“一個好的技術(shù)有沒有價值、能不能發(fā)揮巨大的作用,很多時候關(guān)鍵在場景和應(yīng)用的選擇以及細節(jié)的打磨。通過軟件、硬件、AI技術(shù)的結(jié)合,做出精品是我們現(xiàn)在做的事”。7月26日,教育科技公司網(wǎng)易有道(NYSE: DAO)舉辦了“powered by 子曰”教育大模型應(yīng)用成果發(fā)布會。發(fā)布會現(xiàn)場,網(wǎng)易有道CEO周楓如此表示。 會上網(wǎng)易有道推出國內(nèi)首個教育領(lǐng)域垂直大模型——“子曰”,并發(fā)布了基于“子曰”大模型研發(fā)的六大創(chuàng)新應(yīng)用,即“LLM翻譯”“虛擬人口語教練”“AI作文指導(dǎo)”“語法精講”“AI Box”以及“文檔問答”。 一系列大模型全家桶的發(fā)布,瞬時引發(fā)行業(yè)熱議。 大模型熱潮進入“千模大戰(zhàn)”,各家從概念落地,到場景應(yīng)用,競爭一度陷入白熱化,而在教育領(lǐng)域,并未有過大聲量,此次網(wǎng)易有道可謂打響了教育大模型第一槍。“子曰大模型在教育行業(yè)的應(yīng)用,不僅可以幫助學(xué)生更好地學(xué)習(xí),也可以幫助老師更好地教學(xué),借此實現(xiàn)因材施教的教育理想。”發(fā)布會現(xiàn)場,周楓多次強調(diào)“場景拉動”的重要性。 不同于通用大模型,“子曰”大模型的定位是“場景為先”的教育垂類大模型。在AI助力各行各業(yè)變革的當(dāng)下,“子曰”大模型給教育行業(yè)帶來的機會在哪里?周楓給出的答案是“助力因材施教”。 發(fā)布會現(xiàn)場,較為矚目的便是——虛擬人口語教練Hi Echo的面世,有道詞典業(yè)務(wù)負(fù)責(zé)人與 Echo 進行了多組隨機對話,在對話過程中,Echo能夠像真人老師一樣進行實時反饋。對話結(jié)束后,Echo會從發(fā)音、語法等維度給予建議和潤色。 ▲圖:虛擬人口語教練Hi Echo 此外,有道在發(fā)布會上推出的“AI作文指導(dǎo)”應(yīng)用不僅具備“作文批改”功能,針對學(xué)生在寫作前中后過程中面臨的題目主旨難確定、寫作素材匱乏等難題,AI作文指導(dǎo)還會從表達、結(jié)構(gòu)、內(nèi)容深度、情感豐富度四大維度全面提供改進建議。 個性化教育備受推崇之下,子曰大模型能夠為學(xué)生提供個性化的分析和指導(dǎo);同時,大模型能夠?qū)崿F(xiàn)引導(dǎo)式學(xué)習(xí),提出問題并引導(dǎo)學(xué)生自行探索答案;當(dāng)然,更重要的是,大模型具備全科知識整合能力。通過連接多模態(tài)知識庫、跨學(xué)科整合知識內(nèi)容,隨時滿足學(xué)生的動態(tài)需求,幫助孩子培養(yǎng)更綜合的能力。 作為國內(nèi)和業(yè)界知名的教育科技公司,可以說,網(wǎng)易有道從未停止過技術(shù)和產(chǎn)品深度融合的探索。 早在2008年,有道就推出自主研發(fā)的國內(nèi)首家統(tǒng)計機器翻譯線上引擎。2016年起,有道協(xié)同構(gòu)建AI基礎(chǔ)能力,同步組建語言、視覺、聲音等團隊,目前積累了有道神經(jīng)網(wǎng)絡(luò)翻譯(NMT)、計算機視覺、智能語音AI技術(shù)、高性能計算(HPC)四大底層技術(shù)能力。2017年,有道就與主流技術(shù)Transformer“雙向奔赴”,將AI能力統(tǒng)一在大模型之下,并尤其重視在端側(cè)的落地應(yīng)用。2022年,有道詞典筆P5中搭載了自研的離線ASR,也已升級為Transformer技術(shù)。 AI大模型風(fēng)起之后,如何以實際的教育場景驅(qū)動,用技術(shù)創(chuàng)新助力教育創(chuàng)新,成為團隊上下共同攻克的核心目標(biāo),為此團隊將目標(biāo)拆解為不同模塊:向所有下游場景提供語義理解、知識表達等基礎(chǔ)能力;為不同學(xué)習(xí)場景設(shè)計定制化的模型,力爭實現(xiàn)模型與場景的高度契合等命題。 此次子曰大模型的發(fā)布,可以說是AI+教育的進一步落地實踐,為什么是網(wǎng)易有道?子曰大模型能否引領(lǐng)教育個性化革命? 發(fā)布會后,零態(tài)LT(ID:LingTai_LT)等,也共同對話了網(wǎng)易有道CEO周楓,關(guān)于子曰大模型的探索歷程,成本問題以及商業(yè)化預(yù)期,與其進行了深度交流。 以下為對話實錄(有刪節(jié)) 問題:子曰大模型的六個場景讓人震撼,而且大模型是團隊自研,不久前Meta發(fā)布了新的開源以及免費大模型,直接接入開源成本或許會更低,這個層面,網(wǎng)易有道的思考是什么? 周楓:關(guān)于Meta開源的問題,這也是內(nèi)部非常非常關(guān)心的問題,我們是非常擁抱開源的,有道以前也有很多開源產(chǎn)品,我們自己也開源不少自己的項目,包括AI方面的。 但今天的發(fā)布會側(cè)重的是應(yīng)用,AI發(fā)力的重點是產(chǎn)品落地,這也是為什么子曰大模型進行自研的原因。當(dāng)下一些開源的模型暫時不能滿足我們對落地的需求。比如像語法、答疑這些,這些都搞不定的,因為沒有這些數(shù)據(jù)(可供直接訓(xùn)練)。 當(dāng)然,自研過程中,除了最基礎(chǔ)技術(shù)的技術(shù)層面,最后要落地的是完整產(chǎn)品,并且用戶在使用時,非常絲滑的產(chǎn)品,如果哪一天開源項目很成熟,我們也一定會用。 問題:未來有道智能硬件接入子曰大模型后,會帶來哪些升級和變革呢? 周楓:有道在策略上的關(guān)鍵詞是“場景拉動”——大模型在多個場景中的應(yīng)用成果,覆蓋口語訓(xùn)練、作文批改、習(xí)題答疑等六大教育的細分領(lǐng)域。 在AI虛擬人的驅(qū)動方面,有道基于自主研發(fā)的情感識別算法和實時渲染驅(qū)動引擎,對播放的語音數(shù)據(jù)進行深度分析,實時驅(qū)動虛擬人的面部表情和語音同步的口型變化,使虛擬人能夠貼近真人,以更加自然和生動的方式與用戶一對一交互,從而顯著提升對話的真實感和用戶體驗。 例如,虛擬人口語教練在語音識別能力方面進行了巨大的革新,它支持多語種的流式低延遲語音識別技術(shù),讓Echo在中式英語、英語、中英混合等場景下游刃有余;聲學(xué)降噪、回聲消除、自動語音檢測、自動斷句等技術(shù),則讓它像一個真正的傾聽者和交流者,不僅能判斷用戶說話的起始,還能讓用戶隨時打斷,智能觸發(fā)后續(xù)流程。 問題:“子曰”大模型的成本構(gòu)成是什么?產(chǎn)品化以后會不會影響利潤率,甚至是虧損?在線教育前期技術(shù)成本很高,但是后期隨著用戶規(guī)模擴大,成本會顯著下降,大模型不斷的訓(xùn)練之后,會不會改變這個成本模型? 周楓:做公司永遠是這樣的,好東西都要錢,好的也最貴,這不是新問題,我們一定會管理好成本。 像剛才講的,很多時候這是相對的過程,你如果能做到行業(yè)內(nèi)對資金利用率,對人員利用率比較高的話,成本其實是可以的。大模型研發(fā),總體上不需要增加什么額外的特別大的投入,因為有道過往的AI團隊也不小,可以直接復(fù)用。 跟剛才開源的問題相關(guān),我覺得這個世界上大部分的大模型都是免費的。所以很適合開放。大模型的邊際成本其實非常低,復(fù)制模型其實不需要成本,推理時才需要成本,無論對于一個公司也好,個人也好,情況都是如此。 但大模型技術(shù)非常特別,很多技術(shù)拿到代碼還是不會用。即便你會用,你也不會改進,因為你讀不懂這個代碼,回到剛才的問題,我們目前也需要資金來進行自研,確實現(xiàn)有的市面上的大模型,不滿足我們對產(chǎn)品的要求,長期來看,我們技術(shù)本身深耕了好多年,有很多現(xiàn)成的東西可以復(fù)用。 模型雖然越變越大但是開放性會增強,對于想做AI應(yīng)用的創(chuàng)業(yè)者或者公司來說,現(xiàn)在是非常好的時候,未來成本問題也會隨著規(guī)模,會有所改變。但是大模型具體成本,我們財務(wù)可能比我更清楚。 問題:作為一個教育大模型,在具體落地過程中,怎么防范學(xué)生的“抄作業(yè)”心態(tài)? 周楓:它是有家長管控功能,所以不用擔(dān)心這個問題。 問題:剛剛我們看了演示,有教數(shù)學(xué)題也有教寫作文,比如同樣一道數(shù)學(xué)題三年級的解法跟初中解法完全不同,大模型怎么判斷我對面的人是三歲還是六歲?是不是一個人會有自己的專屬大模型? 周楓:不用把大模型神秘化。 很簡單的邏輯,現(xiàn)在的大模型跟以前的AI不一樣的地方是,確實有語言推理能力。如果是文字型的應(yīng)用,不需要特別強的推理,是挺好用的。但是數(shù)學(xué)本身就難,數(shù)學(xué)光喂內(nèi)容沒用,再多也沒用,因為它是原理問題,現(xiàn)有的技術(shù)不是說套一下就能使用。大模型想的比較淺。這也是當(dāng)下大模型的局限性。 問題:“子曰”大模型的團隊配置是怎樣的? 周楓:百人級,肯定不會考慮千人級。 問題:現(xiàn)在這個大模型是會員制? 周楓:目前可能有這個想法,但是我希望越便宜越好,像電子書的邏輯,希望讓好技術(shù)讓更多人使用,這樣才能倒過來推動技術(shù)發(fā)展。 作者|胡展嘉 運營|陳佳慧 出品|零態(tài)LT(ID:LingTai_LT) |
|