【原】對話網(wǎng)易有道CEO周楓：“子曰”大模型與教育個性化革命

零態(tài)LT 2023-07-28 發(fā)布于遼寧

展開全文

“一個好的技術(shù)有沒有價值、能不能發(fā)揮巨大的作用，很多時候關(guān)鍵在場景和應(yīng)用的選擇以及細節(jié)的打磨。通過軟件、硬件、AI技術(shù)的結(jié)合，做出精品是我們現(xiàn)在做的事”。7月26日，教育科技公司網(wǎng)易有道（NYSE: DAO）舉辦了“powered by 子曰”教育大模型應(yīng)用成果發(fā)布會。發(fā)布會現(xiàn)場，網(wǎng)易有道CEO周楓如此表示。

會上網(wǎng)易有道推出國內(nèi)首個教育領(lǐng)域垂直大模型——“子曰”，并發(fā)布了基于“子曰”大模型研發(fā)的六大創(chuàng)新應(yīng)用，即“LLM翻譯”“虛擬人口語教練”“AI作文指導(dǎo)”“語法精講”“AI Box”以及“文檔問答”。

一系列大模型全家桶的發(fā)布，瞬時引發(fā)行業(yè)熱議。

大模型熱潮進入“千模大戰(zhàn)”，各家從概念落地，到場景應(yīng)用，競爭一度陷入白熱化，而在教育領(lǐng)域，并未有過大聲量，此次網(wǎng)易有道可謂打響了教育大模型第一槍。“子曰大模型在教育行業(yè)的應(yīng)用，不僅可以幫助學(xué)生更好地學(xué)習(xí)，也可以幫助老師更好地教學(xué)，借此實現(xiàn)因材施教的教育理想。”發(fā)布會現(xiàn)場，周楓多次強調(diào)“場景拉動”的重要性。

不同于通用大模型，“子曰”大模型的定位是“場景為先”的教育垂類大模型。在AI助力各行各業(yè)變革的當(dāng)下，“子曰”大模型給教育行業(yè)帶來的機會在哪里？周楓給出的答案是“助力因材施教”。

發(fā)布會現(xiàn)場，較為矚目的便是——虛擬人口語教練Hi Echo的面世，有道詞典業(yè)務(wù)負(fù)責(zé)人與 Echo 進行了多組隨機對話，在對話過程中，Echo能夠像真人老師一樣進行實時反饋。對話結(jié)束后，Echo會從發(fā)音、語法等維度給予建議和潤色。

▲圖：虛擬人口語教練Hi Echo

此外，有道在發(fā)布會上推出的“AI作文指導(dǎo)”應(yīng)用不僅具備“作文批改”功能，針對學(xué)生在寫作前中后過程中面臨的題目主旨難確定、寫作素材匱乏等難題，AI作文指導(dǎo)還會從表達、結(jié)構(gòu)、內(nèi)容深度、情感豐富度四大維度全面提供改進建議。

個性化教育備受推崇之下，子曰大模型能夠為學(xué)生提供個性化的分析和指導(dǎo)；同時，大模型能夠?qū)崿F(xiàn)引導(dǎo)式學(xué)習(xí)，提出問題并引導(dǎo)學(xué)生自行探索答案；當(dāng)然，更重要的是，大模型具備全科知識整合能力。通過連接多模態(tài)知識庫、跨學(xué)科整合知識內(nèi)容，隨時滿足學(xué)生的動態(tài)需求，幫助孩子培養(yǎng)更綜合的能力。

作為國內(nèi)和業(yè)界知名的教育科技公司，可以說，網(wǎng)易有道從未停止過技術(shù)和產(chǎn)品深度融合的探索。

早在2008年，有道就推出自主研發(fā)的國內(nèi)首家統(tǒng)計機器翻譯線上引擎。2016年起，有道協(xié)同構(gòu)建AI基礎(chǔ)能力，同步組建語言、視覺、聲音等團隊，目前積累了有道神經(jīng)網(wǎng)絡(luò)翻譯（NMT）、計算機視覺、智能語音AI技術(shù)、高性能計算(HPC）四大底層技術(shù)能力。2017年，有道就與主流技術(shù)Transformer“雙向奔赴”，將AI能力統(tǒng)一在大模型之下，并尤其重視在端側(cè)的落地應(yīng)用。2022年，有道詞典筆P5中搭載了自研的離線ASR，也已升級為Transformer技術(shù)。

AI大模型風(fēng)起之后，如何以實際的教育場景驅(qū)動，用技術(shù)創(chuàng)新助力教育創(chuàng)新，成為團隊上下共同攻克的核心目標(biāo)，為此團隊將目標(biāo)拆解為不同模塊：向所有下游場景提供語義理解、知識表達等基礎(chǔ)能力；為不同學(xué)習(xí)場景設(shè)計定制化的模型，力爭實現(xiàn)模型與場景的高度契合等命題。

此次子曰大模型的發(fā)布，可以說是AI+教育的進一步落地實踐，為什么是網(wǎng)易有道？子曰大模型能否引領(lǐng)教育個性化革命？

發(fā)布會后，零態(tài)LT（ID：LingTai_LT）等，也共同對話了網(wǎng)易有道CEO周楓，關(guān)于子曰大模型的探索歷程，成本問題以及商業(yè)化預(yù)期，與其進行了深度交流。

以下為對話實錄（有刪節(jié)）

問題：子曰大模型的六個場景讓人震撼，而且大模型是團隊自研，不久前Meta發(fā)布了新的開源以及免費大模型，直接接入開源成本或許會更低，這個層面，網(wǎng)易有道的思考是什么？

周楓：關(guān)于Meta開源的問題，這也是內(nèi)部非常非常關(guān)心的問題，我們是非常擁抱開源的，有道以前也有很多開源產(chǎn)品，我們自己也開源不少自己的項目，包括AI方面的。

但今天的發(fā)布會側(cè)重的是應(yīng)用，AI發(fā)力的重點是產(chǎn)品落地，這也是為什么子曰大模型進行自研的原因。當(dāng)下一些開源的模型暫時不能滿足我們對落地的需求。比如像語法、答疑這些，這些都搞不定的，因為沒有這些數(shù)據(jù)（可供直接訓(xùn)練）。

當(dāng)然，自研過程中，除了最基礎(chǔ)技術(shù)的技術(shù)層面，最后要落地的是完整產(chǎn)品，并且用戶在使用時，非常絲滑的產(chǎn)品，如果哪一天開源項目很成熟，我們也一定會用。

問題：未來有道智能硬件接入子曰大模型后，會帶來哪些升級和變革呢？

周楓：有道在策略上的關(guān)鍵詞是“場景拉動”——大模型在多個場景中的應(yīng)用成果，覆蓋口語訓(xùn)練、作文批改、習(xí)題答疑等六大教育的細分領(lǐng)域。

在AI虛擬人的驅(qū)動方面，有道基于自主研發(fā)的情感識別算法和實時渲染驅(qū)動引擎，對播放的語音數(shù)據(jù)進行深度分析，實時驅(qū)動虛擬人的面部表情和語音同步的口型變化，使虛擬人能夠貼近真人，以更加自然和生動的方式與用戶一對一交互，從而顯著提升對話的真實感和用戶體驗。

例如，虛擬人口語教練在語音識別能力方面進行了巨大的革新，它支持多語種的流式低延遲語音識別技術(shù)，讓Echo在中式英語、英語、中英混合等場景下游刃有余；聲學(xué)降噪、回聲消除、自動語音檢測、自動斷句等技術(shù)，則讓它像一個真正的傾聽者和交流者，不僅能判斷用戶說話的起始，還能讓用戶隨時打斷，智能觸發(fā)后續(xù)流程。

問題：“子曰”大模型的成本構(gòu)成是什么？產(chǎn)品化以后會不會影響利潤率，甚至是虧損？在線教育前期技術(shù)成本很高，但是后期隨著用戶規(guī)模擴大，成本會顯著下降，大模型不斷的訓(xùn)練之后，會不會改變這個成本模型？

周楓：做公司永遠是這樣的，好東西都要錢，好的也最貴，這不是新問題，我們一定會管理好成本。

像剛才講的，很多時候這是相對的過程，你如果能做到行業(yè)內(nèi)對資金利用率，對人員利用率比較高的話，成本其實是可以的。大模型研發(fā)，總體上不需要增加什么額外的特別大的投入，因為有道過往的AI團隊也不小，可以直接復(fù)用。

跟剛才開源的問題相關(guān)，我覺得這個世界上大部分的大模型都是免費的。所以很適合開放。大模型的邊際成本其實非常低，復(fù)制模型其實不需要成本，推理時才需要成本，無論對于一個公司也好，個人也好，情況都是如此。

但大模型技術(shù)非常特別，很多技術(shù)拿到代碼還是不會用。即便你會用，你也不會改進，因為你讀不懂這個代碼，回到剛才的問題，我們目前也需要資金來進行自研，確實現(xiàn)有的市面上的大模型，不滿足我們對產(chǎn)品的要求，長期來看，我們技術(shù)本身深耕了好多年，有很多現(xiàn)成的東西可以復(fù)用。

模型雖然越變越大但是開放性會增強，對于想做AI應(yīng)用的創(chuàng)業(yè)者或者公司來說，現(xiàn)在是非常好的時候，未來成本問題也會隨著規(guī)模，會有所改變。但是大模型具體成本，我們財務(wù)可能比我更清楚。

問題：作為一個教育大模型，在具體落地過程中，怎么防范學(xué)生的“抄作業(yè)”心態(tài)？

周楓：它是有家長管控功能，所以不用擔(dān)心這個問題。

問題：剛剛我們看了演示，有教數(shù)學(xué)題也有教寫作文，比如同樣一道數(shù)學(xué)題三年級的解法跟初中解法完全不同，大模型怎么判斷我對面的人是三歲還是六歲？是不是一個人會有自己的專屬大模型？

周楓：不用把大模型神秘化。

很簡單的邏輯，現(xiàn)在的大模型跟以前的AI不一樣的地方是，確實有語言推理能力。如果是文字型的應(yīng)用，不需要特別強的推理，是挺好用的。但是數(shù)學(xué)本身就難，數(shù)學(xué)光喂內(nèi)容沒用，再多也沒用，因為它是原理問題，現(xiàn)有的技術(shù)不是說套一下就能使用。大模型想的比較淺。這也是當(dāng)下大模型的局限性。

問題：“子曰”大模型的團隊配置是怎樣的？

周楓：百人級，肯定不會考慮千人級。

問題：現(xiàn)在這個大模型是會員制？

周楓：目前可能有這個想法，但是我希望越便宜越好，像電子書的邏輯，希望讓好技術(shù)讓更多人使用，這樣才能倒過來推動技術(shù)發(fā)展。

作者｜胡展嘉

運營｜陳佳慧

出品｜零態(tài)LT（ID：LingTai_LT）