數(shù)千萬年前,猿猴為了生存,學(xué)會(huì)使用石器,跳下大樹直立行走,從而為人;人類為了更好地交流,發(fā)展出語言;為了記住過去,又發(fā)明了文字,從此人類有了有記載的歷史。 人類跑得不夠快,所以發(fā)明了汽車;人類的聲音傳播得不夠遠(yuǎn),所以發(fā)明了電話;人類不會(huì)飛,所以發(fā)明了飛機(jī)。 六十多年前,人類發(fā)明了人工智能(AI),一種能幫助人類,卻也可能“替代”人類的新物種。 六十多年后,借助“深度學(xué)習(xí)”的東風(fēng),人工智能再次站在了產(chǎn)業(yè)界的風(fēng)口。一時(shí)間,百花齊放,企業(yè)言必談AI。 在亞洲最大的科技峰會(huì)——香港RISE大會(huì)上,有演講者給參會(huì)者展示了虛擬人,有演講者發(fā)動(dòng)所有參會(huì)者進(jìn)入“AI能否像人類一樣具有創(chuàng)造力”的思考當(dāng)中去。搜狗的王小川,竟然帶來了能夠像真人一樣播報(bào)新聞的“虛擬主播”。 AI能力進(jìn)化史,搜狗濃墨重彩的一筆 2018年7月11日,央視主播“姚雪松”播報(bào)香港RISE科技峰會(huì)相關(guān)新聞的視頻出現(xiàn)在主演講臺(tái)上方的大屏幕上。其實(shí),他并沒有出現(xiàn)在會(huì)場(chǎng)。 王小川介紹說,搜狗使用姚雪松1.5小時(shí)的音視頻數(shù)據(jù),結(jié)合語音,圖像等多模態(tài)信息進(jìn)行聯(lián)合建模訓(xùn)練,輸入一段RISE大會(huì)的文字稿,就實(shí)現(xiàn)了這次與真人無異的播報(bào)效果。 虛擬主播在技術(shù)上的實(shí)現(xiàn)意味著AI具有了更豐富的表達(dá)方式,從文字表達(dá)走向音視頻的富媒體表達(dá)。 虛擬主播技術(shù)的應(yīng)用場(chǎng)景可以非常廣泛。首先,作為具備視頻內(nèi)容生產(chǎn)能力的技術(shù),該技術(shù)可以運(yùn)用在諸如新聞,娛樂等場(chǎng)景中,自動(dòng)實(shí)時(shí)快捷地生成富媒體內(nèi)容。 其次,虛擬主播技術(shù)還能根據(jù)用戶上傳的單張人物圖片(明星、朋友、家人等)實(shí)時(shí)生成該人物的虛擬主播形象,用戶可以與其面對(duì)面交流。還可以應(yīng)用于各種智能軟硬件,如果用于帶屏幕的智能音箱,用戶就可以從單純與聲音的交互變成與一個(gè)逼真的虛擬人物的交互。 未來,虛擬主播如果具備更完善的交互能力,就能用于教育、醫(yī)療、客服等多個(gè)行業(yè),節(jié)約大量的人力成本。 AI產(chǎn)業(yè),誰會(huì)贏? 搜狗因“國民輸入法”而為中國人所熟知,從不燒錢,在追風(fēng)口的互聯(lián)網(wǎng)圈堅(jiān)持自己的道路,何以突然之間,就能夠在人工智能這個(gè)選手密集的賽道祭出此等大殺器呢? 從王小川在大會(huì)上的主題演講《人工智能下一個(gè)應(yīng)用突破》可一窺端倪。 在演講中他提到,語言是人類與動(dòng)物最大的不同,掌握語言就掌握了靈魂;技術(shù)層面,語言是人工智能皇冠上的明珠。 無論是百箱大戰(zhàn)中Amazon Echo、Google Home等多款圍繞著語音交互打造的智能音箱,還是會(huì)打電話訂餐的GoogleDuplex、會(huì)辯論的IBM Projector Debater,都聚焦于讓機(jī)器擁有“語言”這顆明珠。 搜狗因其對(duì)輸入法,對(duì)搜索持續(xù)不斷地更新升級(jí),而在語言領(lǐng)域積累頗深。搜狗輸入法是中國最大的語音輸入法,目前語音識(shí)別準(zhǔn)確率已超98%;日均語音輸入調(diào)用次數(shù)峰值達(dá)4億次;支持外文多語種和中文方言識(shí)別;智能斷句、標(biāo)點(diǎn)預(yù)測(cè)、識(shí)別結(jié)果順滑等功能也領(lǐng)先于業(yè)界。語音合成支持多種音色選擇,通過少量數(shù)據(jù)即可生成說話者自己的合成音色,還可實(shí)現(xiàn)說話人風(fēng)格的遷移。
AI當(dāng)下最需要的也是“力出一孔”,即“利出一孔”。利出一孔,最早出于春秋時(shí)期的《管子》。管仲在《管子· 國蓄第七十三》中提到“利出于一孔者,其國無敵;出二孔者,其兵不詘;出三孔者,不可以舉兵;出四孔者,其國必亡”。 AI是個(gè)火爆的大世界,它涉及的技術(shù)五花八門,深度學(xué)習(xí)、大數(shù)據(jù)、語音、視覺、知識(shí)圖譜等等;它的應(yīng)用場(chǎng)景包羅萬象,娛樂、媒體、營銷、零售、交通、工業(yè)、機(jī)器人等等,可以說無邊無際,有資源進(jìn)行廣撒網(wǎng)的玩家是少數(shù)。隨著BAT等公司開啟AI布局,他們似乎更喜歡“跑馬圈地”,占領(lǐng)盡可能多的AI應(yīng)用場(chǎng)景,百度提出All in AI(集中一切力量做AI),騰訊提出“Make AI Everywhere”(讓AI無處不在),阿里強(qiáng)調(diào)“產(chǎn)業(yè)AI”。 搜狗的AI戰(zhàn)略不做大而全,而是圍繞一個(gè)戰(zhàn)略制高點(diǎn)做精做細(xì),聚焦到語言相關(guān)的人工智能,從單點(diǎn)打入整個(gè)AI行業(yè),這讓它的AI戰(zhàn)略與眾不同。 整個(gè)AI產(chǎn)業(yè)也需要這樣的理念。AI技術(shù)五花八門,但首要問題,還是要幫助機(jī)器建立感知與認(rèn)知能力,真正理解這個(gè)世界并自由交流。如何做到?兩個(gè)事情缺一不可,交互和知識(shí),當(dāng)機(jī)器同時(shí)擁有自然交互能力和知識(shí)計(jì)算能力,才能感知、認(rèn)知這個(gè)世界,與人類智能交流,并幫助解決問題。 讓機(jī)器融入人類世界很重要的一步,就是需要機(jī)器理解人們通過自然語言的發(fā)號(hào)施令,理解大量的文本,理解大量的語音,理解大量的圖像,這就像解決觸摸屏對(duì)于智能手機(jī)的意義一樣,是不可繞過的關(guān)鍵一步。而語言又承載了人類的知識(shí)與思考。當(dāng)機(jī)器進(jìn)入到知識(shí)計(jì)算層次后,就能通過語言集合人類智慧,超越人的認(rèn)知,回答、解決人類在知識(shí)世界的各種問題。 搜狗聚焦到語言,而不是五花八門的AI場(chǎng)景,也是希望將語言當(dāng)成一個(gè)抓手,來撬動(dòng)整個(gè)AI產(chǎn)業(yè),實(shí)現(xiàn)力出一孔。它一方面在交互上布局,從語音識(shí)別、語音合成、圖像識(shí)別、圖像合成衍生研發(fā)出極具特色的情感遷移、唇語識(shí)別、虛擬主播等技術(shù),都在解決交互問題;另一方面在知識(shí)計(jì)算上布局,比如做問答、對(duì)話、翻譯。 搜狗的AI戰(zhàn)略,讓我想起了智能家居的發(fā)展。最一開始,智能家居涉及到智能電視、智能家電、智能門鎖、智能路由器等等,不過在智能家居市場(chǎng)最先取得突破的卻是智能音箱這個(gè)小玩意兒,根源是選擇了從音箱上搭載更智能的語音交互助理來進(jìn)行突破。同樣的,AI賽道中什么都做,往往很難突破,如果有所聚焦,則能單點(diǎn)突破,將自己的AI牢牢嵌入用戶的心智,成功奪取入口,以點(diǎn)帶面。語言對(duì)于AI市場(chǎng)而言,就有點(diǎn)像智能音箱對(duì)于智能家居的價(jià)值。 聚焦語言給搜狗帶來什么? 不論是輸入法、搜索引擎、翻譯,搜狗的核心業(yè)務(wù)都與語言密不可分。如果說搜索和輸入法是搜狗的起家業(yè)務(wù),為搜狗積累了大量的語言數(shù)據(jù),語言AI技術(shù)則是搜狗未來的基石,承擔(dān)為搜狗開疆拓土的使命。 聚焦語言相關(guān)AI技術(shù)的發(fā)展,搜狗在自然交互和知識(shí)計(jì)算兩個(gè)領(lǐng)域上不斷強(qiáng)化優(yōu)勢(shì),將長板不斷筑高,再在語言強(qiáng)相關(guān)的核心應(yīng)用領(lǐng)域投入所有精力。集中優(yōu)勢(shì)兵力、各個(gè)擊破,也是更適合搜狗這個(gè)體量玩家的策略。 尤其是在翻譯領(lǐng)域的技術(shù)突破與實(shí)用化進(jìn)展,不僅讓搜狗領(lǐng)跑行業(yè),也帶給了搜狗更多的信心。早在2016年的烏鎮(zhèn)世界互聯(lián)網(wǎng)大會(huì)上,搜狗發(fā)布了全球第一個(gè)商用神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯系統(tǒng),讓機(jī)器同傳成為重大峰會(huì)活動(dòng)標(biāo)配??缯Z言搜索引擎和輸入法翻譯功能更是讓用戶得以打破語言壁壘,實(shí)現(xiàn)跨語言表達(dá)與獲取信息。今年上半年,搜狗發(fā)布的旅行翻譯寶和錄音翻譯筆則以行業(yè)黑馬的姿態(tài)殺入市場(chǎng)。搜狗相關(guān)負(fù)責(zé)人提到未來也將考慮以翻譯為入口,扎入旅游場(chǎng)景做深度服務(wù)。 相信看到這里,你對(duì)搜狗為什么聚焦到語言這個(gè)獨(dú)特的領(lǐng)域,有了清晰的答案。AI已成為互聯(lián)網(wǎng)巨頭的必爭之地,像BAT這樣的廣撒網(wǎng)是一條路,像搜狗這樣聚焦到一個(gè)細(xì)分領(lǐng)域,實(shí)現(xiàn)單點(diǎn)突破,同樣是一條路。誰會(huì)走得更快,誰會(huì)走得更遠(yuǎn)?時(shí)間會(huì)給出答案,我們樂見其成。 熱點(diǎn)事件追蹤: 淘寶造富計(jì)劃 掌門1對(duì)1 美團(tuán)無人車 算法看門狗 金融科技井噴 中國版米其林 社交之王 Uber撞人 新世相 新氧融資 金蝶第二春 劉強(qiáng)東的平臺(tái)經(jīng)濟(jì)學(xué) 互聯(lián)網(wǎng)上市潮 教育科技 耐克拿下跳一跳 盒馬外賣 阿里收購餓了么 相機(jī)爭奪戰(zhàn) 頭條瞄準(zhǔn)愛奇藝 陌陌收購探探 |
|