“生意上沒有一勞永逸的事,只有不斷創(chuàng)新才行。”編輯|李薇 頭圖來源|受訪者 “你的下一個(gè)外教,何必是外教?他可以是大模型加虛擬人。”這是若軒在試用完Hi Echo的感受。若軒最近沉迷于Hi Echo這款A(yù)PP。打開Hi Echo點(diǎn)擊通話,名叫Echo的虛擬人就可以提供7×24小時(shí)私人英文口語陪練。這款網(wǎng)易有道推出的AI虛擬人口語教練產(chǎn)品,底座基于網(wǎng)易有道研發(fā)的教育垂直大模型子曰。不同于通用大模型,子曰從一開始就定位為一個(gè)場景為先的教育垂類大模型。時(shí)間回到2022年11月底,ChatGPT發(fā)布之后,周楓試用后感到非常震撼。他跟算法團(tuán)隊(duì)來來回回地用,測試它的能力底線,在公司內(nèi)部評測模型不同能力的細(xì)節(jié)。為了了解更多技術(shù)細(xì)節(jié),周楓把從GPT-2開始的所有語言模型相關(guān)的論文全部讀了一遍。他和團(tuán)隊(duì)一直在思考,ChatGPT、大模型跟有道到底有沒有關(guān)系?有道到底要做什么?有沒有合作方可以調(diào)用?2023年1月,有道內(nèi)部召開年度戰(zhàn)略會(huì),這是公司每年的傳統(tǒng),周楓把總監(jiān)以上的團(tuán)隊(duì)集中在一起連續(xù)開三天會(huì)。不同于往年,今年周楓讓有道首席科學(xué)家段亦濤講了一個(gè)多小時(shí)的GPT相關(guān)的技術(shù),讓大家做了充分的討論。來源:受訪者 一部分同事對即將到來的技術(shù)浪潮還很懵。最苦悶的要數(shù)翻譯團(tuán)隊(duì)——?dú)埧岬默F(xiàn)實(shí)擺在面前,之前干的事情都沒用了。當(dāng)時(shí),美國可汗學(xué)院等教育公司已經(jīng)開始嘗試接入GPT-3.5,做一些教育服務(wù)嘗試,但國內(nèi)還沒有能力綜合又非常成熟的可以接入的模型,必須得自己做。很快,周楓就和團(tuán)隊(duì)達(dá)成共識(shí)?!靶乱淮夹g(shù)來了之后,有道一定要抓住,不能做鴕鳥。如果你抓不住,你掉隊(duì)了,從此就是一個(gè)跟隨的角色,何況原來也有一些技術(shù)優(yōu)勢?!敝軛鞲嬖V《中國企業(yè)家》。2023年開年,有道內(nèi)部就開始緊鑼密鼓地研發(fā)垂直大模型,各個(gè)場景的應(yīng)用申請也不斷發(fā)起。周楓要求每個(gè)業(yè)務(wù)團(tuán)隊(duì)都要關(guān)注大模型,在他看來這是十年甚至幾十年才一遇的機(jī)會(huì)。除了有道內(nèi)部,網(wǎng)易集團(tuán)和創(chuàng)始人丁磊也給予了足夠的重視程度。丁磊親自抓集團(tuán)內(nèi)部的AIGC大賽,并親自做評委主席,Hi Echo的虛擬人外教正是有道與網(wǎng)易游戲合力研發(fā)的結(jié)果。截至今年7月,網(wǎng)易有道除了自研教育垂直大模型之外,還基于自研大模型推出“AI虛擬人口語教練”“LLM翻譯”等6大應(yīng)用。在周楓看來,一個(gè)好的技術(shù)有沒有價(jià)值、能不能發(fā)揮巨大的作用,很多時(shí)候關(guān)鍵在場景和應(yīng)用的選擇以及細(xì)節(jié)的打磨。作為資深技術(shù)從業(yè)者,周楓過去20年見證了好幾輪技術(shù)變革浪潮,歷史經(jīng)驗(yàn)告訴他,每一次大的浪潮里,機(jī)會(huì)不僅僅在于基礎(chǔ)技術(shù)。就像互聯(lián)網(wǎng)發(fā)展之初,做服務(wù)器和路由器的公司最賺錢,但大家很快就發(fā)現(xiàn)互聯(lián)網(wǎng)的精髓不在路由器,而是在互聯(lián)網(wǎng)應(yīng)用上。大模型來臨之后,周楓立馬想到的就是應(yīng)用和場景:“大模型作為基座支持很多下游任務(wù),這是它非常重要的優(yōu)勢,抓得越早,后邊可抓的東西越多。如果眼睛全盯著要去做大模型,就像移動(dòng)互聯(lián)網(wǎng)時(shí)整天盯著怎么做手機(jī),而忽視了微信、淘寶、抖音等應(yīng)用的機(jī)會(huì)。”在結(jié)合過往業(yè)務(wù)尋找落地場景應(yīng)用的過程中,周楓有兩個(gè)原則:第一,解決用戶的需要;第二,能快速變現(xiàn),有足夠的商業(yè)空間。他認(rèn)為,即便是200億參數(shù)的模型能力,也可以解決教育方面很多的問題。當(dāng)然,周楓也深知沒有一個(gè)辦法可以解決所有問題。但從2006年網(wǎng)易有道成立,周楓相繼做了有道搜索、有道詞典、有道云筆記、有道精品課、有道詞典筆等業(yè)務(wù),業(yè)務(wù)范圍覆蓋K12教育、成人教育、素質(zhì)教育、智能硬件等領(lǐng)域,讓教育大模型落地有了眾多的場景。隨著ChatGPT在國內(nèi)的普及,有道的技術(shù)團(tuán)隊(duì)見證了用戶行為的快速改變。周楓回憶,與有道翻譯會(huì)員關(guān)聯(lián)的AIBOX才上線幾個(gè)星期,桌面端會(huì)員的四分之一的收入就來自于該功能。這是一個(gè)用戶在翻譯等眾多場景可以用到的功能,比如回一封正式的英文郵件或給海外大學(xué)寫一封申請信,大部分中國人可能擔(dān)心語言不地道,詞不達(dá)意,AIBOX則可提供潤色的功能——用戶選中一段英文,可以根據(jù)自己的需求讓它更專業(yè),原本需要找英語母語者或文書專家修改的稀缺能力,變得唾手可得。文本翻譯之外,Hi Echo聚焦的英語口語陪練也是其重視的場景之一。他認(rèn)為,口語陪練一直以來都有幾百億的市場規(guī)模,這里面創(chuàng)新空間非常大。中國人學(xué)外語最大的困難不是詞匯,也不是語法,而是沒有語言環(huán)境,可語言環(huán)境非常難創(chuàng)建。“以前創(chuàng)造語言環(huán)境的唯一辦法就是請外教,花很高的價(jià)格請外教每個(gè)星期聊幾個(gè)小時(shí),但外教最大的問題在于資源太少且太昂貴了。只有非常少數(shù)的學(xué)生家庭能夠支付得起這樣好的語言環(huán)境,但技術(shù)革新不就是解決這樣的問題嗎?”周楓告訴《中國企業(yè)家》。在周楓看來,隨著大模型能力的提升,讓“因材施教”獲得三大優(yōu)勢:首先,大模型能為學(xué)生提供個(gè)性化的分析和指導(dǎo);其次,大模型能夠?qū)崿F(xiàn)引導(dǎo)式學(xué)習(xí),與教師一樣,提出問題并引導(dǎo)學(xué)生自行探索答案;最后,大模型具備全科知識(shí)整合能力,通過連接多模態(tài)知識(shí)庫、跨學(xué)科整合知識(shí)內(nèi)容,大模型能隨時(shí)滿足學(xué)生的動(dòng)態(tài)需求,幫助孩子培養(yǎng)更綜合的能力。 2023年春節(jié)后,當(dāng)大眾也開始對ChatGPT津津樂道的時(shí)候,有道技術(shù)團(tuán)隊(duì)的感覺是,“怎么這個(gè)東西又火一遍?” 因?yàn)檫^去的積累和技術(shù)的敏銳度,有道技術(shù)團(tuán)隊(duì)在GPT-3.5出來的時(shí)候,也就是2022年12月到2023年1月間拼命關(guān)注、研究和測試,跟行業(yè)投資人和創(chuàng)業(yè)團(tuán)隊(duì)交流,考慮如何跟自己的業(yè)務(wù)做結(jié)合。 Transformer技術(shù)是現(xiàn)在AI的主流技術(shù),GPT中的T也是Transformer的縮寫,而Transformer正是從機(jī)器翻譯開始做的,第一篇Transformer的論文也是與機(jī)器翻譯相關(guān)的。 來源:受訪者 2017年,周楓接觸到Transformer,而早在2008年,有道成為國內(nèi)第一家提供統(tǒng)計(jì)機(jī)器翻譯模型的公司;2017年,有道從機(jī)器翻譯引擎升級成神經(jīng)網(wǎng)絡(luò)翻譯引擎,隨后又升級到現(xiàn)在主流的Transformer技術(shù)。根據(jù)QuestMobile最新數(shù)據(jù),到目前有道詞典月活用戶已經(jīng)超過1億,排名國內(nèi)詞典翻譯市場第一,也意味著這是Transformer方案下市場份額最大的翻譯產(chǎn)品。
技術(shù)積累的優(yōu)勢首先體現(xiàn)在團(tuán)隊(duì)的快速成型上,“有道做大模型的過程,其實(shí)完全是在之前團(tuán)隊(duì)框架下來做的,沒有額外組建團(tuán)隊(duì)來做,因?yàn)楹芏嗉夹g(shù)和資源都是一脈相承的?!本W(wǎng)易有道首席科學(xué)家段亦濤告訴《中國企業(yè)家》。 從2016年開始,有道協(xié)同構(gòu)建AI基礎(chǔ)能力,同步組建語言、視覺、聲音等團(tuán)隊(duì),目前積累了有道神經(jīng)網(wǎng)絡(luò)翻譯(NMT)、計(jì)算機(jī)視覺、智能語音AI技術(shù)、高性能計(jì)算(HPC)四大底層技術(shù)能力。 2017年開始,有道升級到主流技術(shù)Transformer后,將AI能力統(tǒng)一在大模型之下,并重視其在端側(cè)的落地應(yīng)用。2019年,有道詞典筆2代首次搭載離線Transformer NMT,將Transformer裝到詞典筆這樣的小設(shè)備里面。 因此,技術(shù)積累的優(yōu)勢還體現(xiàn)在,過往的技術(shù)工程經(jīng)驗(yàn),讓團(tuán)隊(duì)在處理大模型帶來的算力、成本等難題時(shí),能稍顯從容一些。周楓回憶,當(dāng)時(shí)神經(jīng)網(wǎng)絡(luò)的翻譯上線時(shí),團(tuán)隊(duì)碰到技術(shù)升級和成本問題完全一樣,當(dāng)時(shí)花了三個(gè)多月時(shí)間才把這些問題解決掉。 過去6年多時(shí)間,有道技術(shù)團(tuán)隊(duì)除了將Transformer用在翻譯產(chǎn)品外,也將其用在語音、視覺、OCR字符文字識(shí)別上,因此有道的算法團(tuán)隊(duì)對于這次大模型的技術(shù)變化并不陌生,甚至曾試用過GPT-2的技術(shù),到ChatGPT3.5之后,大模型帶來很多不一樣的東西,如參數(shù)規(guī)模、技術(shù)做法上的差異,但段亦濤認(rèn)為總體技術(shù)路線是一脈相承的。 “很多時(shí)候成本挑戰(zhàn)是一個(gè)相對的過程,你如果能做到行業(yè)內(nèi)對資金利用率、對人員利用率比較高的話,其實(shí)就完全沒問題的。有道總體上不需要增加什么額外的特別大的投入,因?yàn)橛械繟I團(tuán)隊(duì)也不小?!敝軛鞲嬖V《中國企業(yè)家》。 大模型帶給教育從業(yè)者的挑戰(zhàn) 大部分人沉浸在大模型給教育場景帶來新變化的同時(shí),也有一部分擔(dān)心這會(huì)對從業(yè)者帶來一定的沖擊和挑戰(zhàn),尤其像Hi Echo這樣的虛擬口語教練,是否會(huì)導(dǎo)致一部分老師失業(yè)?
|