“一個好的技術有沒有價值、能不能發(fā)揮巨大的作用,很多時候關鍵在場景和應用的選擇以及細節(jié)的打磨。通過軟件、硬件、AI技術的結合,做出精品是我們現(xiàn)在做的事”。7月26日,教育科技公司網(wǎng)易有道(NYSE: DAO)舉辦了“powered by 子曰”教育大模型應用成果發(fā)布會。發(fā)布會現(xiàn)場,網(wǎng)易有道CEO周楓如此表示。
會上網(wǎng)易有道推出國內首個教育領域垂直大模型——“子曰”,并發(fā)布了基于“子曰”大模型研發(fā)的六大創(chuàng)新應用,即“LLM翻譯”“虛擬人口語教練”“AI作文指導”“語法精講”“AI Box”以及“文檔問答”。
一系列大模型全家桶的發(fā)布,瞬時引發(fā)行業(yè)熱議。
大模型熱潮進入“千模大戰(zhàn)”,各家從概念落地,到場景應用,競爭一度陷入白熱化,而在教育領域,并未有過大聲量,此次網(wǎng)易有道可謂打響了教育大模型第一槍。“子曰大模型在教育行業(yè)的應用,不僅可以幫助學生更好地學習,也可以幫助老師更好地教學,借此實現(xiàn)因材施教的教育理想。”發(fā)布會現(xiàn)場,周楓多次強調“場景拉動”的重要性。
不同于通用大模型,“子曰”大模型的定位是“場景為先”的教育垂類大模型。在AI助力各行各業(yè)變革的當下,“子曰”大模型給教育行業(yè)帶來的機會在哪里?周楓給出的答案是“助力因材施教”。
發(fā)布會現(xiàn)場,較為矚目的便是——虛擬人口語教練Hi Echo的面世,有道詞典業(yè)務負責人與 Echo 進行了多組隨機對話,在對話過程中,Echo能夠像真人老師一樣進行實時反饋。對話結束后,Echo會從發(fā)音、語法等維度給予建議和潤色。

▲圖:虛擬人口語教練Hi Echo
此外,有道在發(fā)布會上推出的“AI作文指導”應用不僅具備“作文批改”功能,針對學生在寫作前中后過程中面臨的題目主旨難確定、寫作素材匱乏等難題,AI作文指導還會從表達、結構、內容深度、情感豐富度四大維度全面提供改進建議。
個性化教育備受推崇之下,子曰大模型能夠為學生提供個性化的分析和指導;同時,大模型能夠實現(xiàn)引導式學習,提出問題并引導學生自行探索答案;當然,更重要的是,大模型具備全科知識整合能力。通過連接多模態(tài)知識庫、跨學科整合知識內容,隨時滿足學生的動態(tài)需求,幫助孩子培養(yǎng)更綜合的能力。
作為國內和業(yè)界知名的教育科技公司,可以說,網(wǎng)易有道從未停止過技術和產品深度融合的探索。
早在2008年,有道就推出自主研發(fā)的國內首家統(tǒng)計機器翻譯線上引擎。2016年起,有道協(xié)同構建AI基礎能力,同步組建語言、視覺、聲音等團隊,目前積累了有道神經(jīng)網(wǎng)絡翻譯(NMT)、計算機視覺、智能語音AI技術、高性能計算(HPC)四大底層技術能力。2017年,有道就與主流技術Transformer“雙向奔赴”,將AI能力統(tǒng)一在大模型之下,并尤其重視在端側的落地應用。2022年,有道詞典筆P5中搭載了自研的離線ASR,也已升級為Transformer技術。
AI大模型風起之后,如何以實際的教育場景驅動,用技術創(chuàng)新助力教育創(chuàng)新,成為團隊上下共同攻克的核心目標,為此團隊將目標拆解為不同模塊:向所有下游場景提供語義理解、知識表達等基礎能力;為不同學習場景設計定制化的模型,力爭實現(xiàn)模型與場景的高度契合等命題。
此次子曰大模型的發(fā)布,可以說是AI+教育的進一步落地實踐,為什么是網(wǎng)易有道?子曰大模型能否引領教育個性化革命?
發(fā)布會后,零態(tài)LT(ID:LingTai_LT)等,也共同對話了網(wǎng)易有道CEO周楓,關于子曰大模型的探索歷程,成本問題以及商業(yè)化預期,與其進行了深度交流。
以下為對話實錄(有刪節(jié))

問題:子曰大模型的六個場景讓人震撼,而且大模型是團隊自研,不久前Meta發(fā)布了新的開源以及免費大模型,直接接入開源成本或許會更低,這個層面,網(wǎng)易有道的思考是什么?
周楓:關于Meta開源的問題,這也是內部非常非常關心的問題,我們是非常擁抱開源的,有道以前也有很多開源產品,我們自己也開源不少自己的項目,包括AI方面的。
但今天的發(fā)布會側重的是應用,AI發(fā)力的重點是產品落地,這也是為什么子曰大模型進行自研的原因。當下一些開源的模型暫時不能滿足我們對落地的需求。比如像語法、答疑這些,這些都搞不定的,因為沒有這些數(shù)據(jù)(可供直接訓練)。
當然,自研過程中,除了最基礎技術的技術層面,最后要落地的是完整產品,并且用戶在使用時,非常絲滑的產品,如果哪一天開源項目很成熟,我們也一定會用。
問題:未來有道智能硬件接入子曰大模型后,會帶來哪些升級和變革呢?
周楓:有道在策略上的關鍵詞是“場景拉動”——大模型在多個場景中的應用成果,覆蓋口語訓練、作文批改、習題答疑等六大教育的細分領域。
在AI虛擬人的驅動方面,有道基于自主研發(fā)的情感識別算法和實時渲染驅動引擎,對播放的語音數(shù)據(jù)進行深度分析,實時驅動虛擬人的面部表情和語音同步的口型變化,使虛擬人能夠貼近真人,以更加自然和生動的方式與用戶一對一交互,從而顯著提升對話的真實感和用戶體驗。
例如,虛擬人口語教練在語音識別能力方面進行了巨大的革新,它支持多語種的流式低延遲語音識別技術,讓Echo在中式英語、英語、中英混合等場景下游刃有余;聲學降噪、回聲消除、自動語音檢測、自動斷句等技術,則讓它像一個真正的傾聽者和交流者,不僅能判斷用戶說話的起始,還能讓用戶隨時打斷,智能觸發(fā)后續(xù)流程。
問題:“子曰”大模型的成本構成是什么?產品化以后會不會影響利潤率,甚至是虧損?在線教育前期技術成本很高,但是后期隨著用戶規(guī)模擴大,成本會顯著下降,大模型不斷的訓練之后,會不會改變這個成本模型?
周楓:做公司永遠是這樣的,好東西都要錢,好的也最貴,這不是新問題,我們一定會管理好成本。
像剛才講的,很多時候這是相對的過程,你如果能做到行業(yè)內對資金利用率,對人員利用率比較高的話,成本其實是可以的。大模型研發(fā),總體上不需要增加什么額外的特別大的投入,因為有道過往的AI團隊也不小,可以直接復用。
跟剛才開源的問題相關,我覺得這個世界上大部分的大模型都是免費的。所以很適合開放。大模型的邊際成本其實非常低,復制模型其實不需要成本,推理時才需要成本,無論對于一個公司也好,個人也好,情況都是如此。

但大模型技術非常特別,很多技術拿到代碼還是不會用。即便你會用,你也不會改進,因為你讀不懂這個代碼,回到剛才的問題,我們目前也需要資金來進行自研,確實現(xiàn)有的市面上的大模型,不滿足我們對產品的要求,長期來看,我們技術本身深耕了好多年,有很多現(xiàn)成的東西可以復用。
模型雖然越變越大但是開放性會增強,對于想做AI應用的創(chuàng)業(yè)者或者公司來說,現(xiàn)在是非常好的時候,未來成本問題也會隨著規(guī)模,會有所改變。但是大模型具體成本,我們財務可能比我更清楚。
問題:作為一個教育大模型,在具體落地過程中,怎么防范學生的“抄作業(yè)”心態(tài)?
周楓:它有家長管控功能,所以不用擔心這個問題。
問題:剛剛我們看了演示,有教數(shù)學題也有教寫作文,比如同樣一道數(shù)學題三年級的解法跟初中解法完全不同,大模型怎么判斷我對面的人是三歲還是六歲?是不是一個人會有自己的專屬大模型?
周楓:不用把大模型神秘化。
很簡單的邏輯,現(xiàn)在的大模型跟以前的AI不一樣的地方是,確實有語言推理能力。如果是文字型的應用,不需要特別強的推理,是挺好用的。但是數(shù)學本身就難,數(shù)學光喂內容沒用,再多也沒用,因為它是原理問題,現(xiàn)有的技術不是說套一下就能使用。大模型想的比較淺。這也是當下大模型的局限性。
問題:“子曰”大模型的團隊配置是怎樣的?
周楓:百人級,肯定不會考慮千人級。
問題:現(xiàn)在這個大模型是會員制?
周楓:目前可能有這個想法,但是我希望越便宜越好,像電子書的邏輯,希望讓好技術讓更多人使用,這樣才能倒過來推動技術發(fā)展。

