大模型如何為我所用? 這是當下B端眾多企業(yè)都在深入思考的一個問題。今年以來,大模型在辦公、對話、搜索等領域所展現出的強大能力,讓越來越多B端企業(yè)意識到大模型對于業(yè)務的巨大價值。 因此,領域認知智能迅速成為B端企業(yè)關注的焦點,甚至各個大廠紛紛為之推出各種垂直領域的大模型。但大模型本身尚處于發(fā)展的早期階段,在垂直行業(yè)的落地依然面臨不小挑戰(zhàn),首當其沖的就是領域數據與大模型如何有效融合、訓練等挑戰(zhàn)。 “領域認知智能是 AGI 時代面向特定技術或行業(yè)領域,基于領域數據對大模型進行預訓練或調優(yōu),并利用知識工程將私域數據加工成領域知識網絡,通過兩種技術融合實現機器對特定領域的理解、推理、歸納等認知能力?!睈蹟悼偛觅R鴻富直言道。 歸根結底,領域認知智能的發(fā)展與落地將決定著人工智能未來普及的廣度和深度。 走向領域深度,用戶準備好了嗎對于金融、教育、醫(yī)療、制造等B端企業(yè)而言,關心的不是大模型如何寫詩作畫,而是業(yè)務場景帶來生產力的提升。 B端企業(yè)通常具有豐富的場景、領域數據量巨大,有利于大模型能力的發(fā)揮;與此同時,又對降本增效需求強烈,且極為看重領域數據的安全性。因此,領域認知智能的建設與面向C端的大模型應用有著本質區(qū)別。 在愛數產品副總裁李基亮看來,大模型走向垂直領域是大勢所趨,領域認知智能的落地主要面臨著兩大挑戰(zhàn):一是大模型在面向特定領域落地時面臨的生成內容幻覺、不及時和不可解釋性等問題;另一個則是大模型在垂直領域帶來的安全性以及成本等方面的擔憂。 領域認知智能需要解決的首要問題就是數據問題。眾所周知,數據決定人工智能發(fā)展的天花板,在領域認知智能尤甚。OpenAI CEO Sam Altman今年指出,大規(guī)模、高質量的數據,以及數據高效處理、調優(yōu)的工程化是大模型能力得以展現和提升的關鍵。 例如,在領域任務中,大模型需要遵循特定領域的規(guī)范、制度、流程和知識進行回答。如果不進行適當的調優(yōu),大模型往往會拋開給定的文檔或信息,傾向于利用已習得的通用知識進行自由發(fā)揮。 另一個不容忽視的顯示情況就是,B端企業(yè)自身積累了大量的領域數據,對安全極其敏感且價值巨大,這就決定著B端企業(yè)在領域認知智能的建設中傾向于本地化部署模式。 不過,本地化部署也不可避免會帶來成本、復雜性等挑戰(zhàn)。例如,垂直類大模型普遍具有多領域數據(多技術、主業(yè)與關聯(lián)行業(yè)的多行業(yè))、多場景分析(運營管理、市場營銷、產品技術、服務支持等)等特點,場景推理分析復雜、應用整合復雜,且開發(fā)整合成本高。 針對領域認知智能落地面臨的各種挑戰(zhàn),愛數的思路是將大模型與數據治理、內容管理、數據資產化等技術進行高效結合,降低大模型在實際垂直領域的落地門檻,最終實現幫助B端企業(yè)構建起領域認知智能。這其中,愛數認知智能框架AnyDATA Framworks 3又是關鍵一環(huán)。 如何才能高效用好大模型在中國人工智能市場,最不缺的就是各種大模型。 相關數據顯示,中國市場的大模型數量已經突破200個,各類大模型琳瑯滿目、魚龍混雜,一定程度也給B端企業(yè)造成選擇困難,加上部署、訓練、開發(fā)的復雜性和成本挑戰(zhàn),B端企業(yè)對于大模型的心態(tài)往往是“想用卻不敢用”。 愛數認知智能框架AnyDATA Framework 3的出現,恰到好處地打消了B端企業(yè)對于大模型的種種顧慮。 作為一個中立的認知智能框架平臺,AnyDATA Framework 3做到大模型的中立,給予B端企業(yè)的選擇權;同時,屏蔽了大模型接入、知識網絡構建與應用開發(fā)的復雜性,且兼容目前市場上各類主流大模型,降低大模型的使用門檻,為B端企業(yè)提供各類大模型的認知應用開發(fā)能力。 “AnyDATA Framework 3是采用私域部署的一站式認知智能框架平臺,實現大模型在各種垂直領域的增強與優(yōu)化,B端企業(yè)利用模型工廠、知識網絡工作臺、認知應用工作臺可以快速、高效、合規(guī)地實現認知應用的開發(fā)。”李基亮介紹道。 例如,針對大模型通過簡單類比得出錯誤答案的“幻覺”問題,AnyDATA Framework 3關鍵技術檢索增強生成模式(RAG模式)在大模型推理生成時,使用私域數據/領域知識庫進行檢索召回,解決大模型“幻覺”問題,實現生成內容的可解釋性,且無需額外訓練,不同大模型均可使用,可以充分發(fā)揮大模型的推理能力和創(chuàng)造能力。 就像人才培養(yǎng),首先從通識教育的基礎能力培養(yǎng)開始,之后再側重專業(yè)知識的高等教育。B端企業(yè)的領域認知智能落地過程也是類似,大模型在AGI時代提供了強大的基礎能力,進入到垂直領域必然需要領域數據、知識做支撐,而愛數AnyDATA Framework 3則猶如架起一座橋梁,幫助大模型在B端企業(yè)實現從基礎到專業(yè)的進階。 事實上,除了AnyDATA Framework 3,愛數近年來持續(xù)探索的大數據基礎設施戰(zhàn)略,開始在AGI時代綻放出巨大的價值。 Data+AI,大數據基礎設施開新局今年起,B端企業(yè)在領域認知智能的探索與實踐中,愈發(fā)意識到基礎設施層所起到的關鍵作用與核心價值。 作為一直深耕在大數據基礎設施領域的廠商,愛數也緊跟時代步伐,持續(xù)投入領域認知智能的創(chuàng)新,與時俱進的提出了“Data+AI”戰(zhàn)略,基于“Data+AI”對各大產品進行全面智能化升級。 之所以會如此,是因為像愛數這種聚焦大數據基礎設施創(chuàng)新的企業(yè),在常年與各類數據打交道過程中,深刻洞察到數據要素對于B端企業(yè)的巨大價值,以及B端企業(yè)對于釋放數據生產力的迫切性;另外,數據基礎設施領域又是大模型最有希望率先實現落地的領域之一,愛數積極擁抱領域認知智能、大模型,對各大產品全面智能化升級,有利于為B端企業(yè)在AGI時代的數據管理、數據消費、使用交互等方面將帶來深遠影響。 首先,愛數已形成AnyBackup、AnyShare、AnyRobot、AnyDATA和AnyFabric五大產品線,可以幫助B端企業(yè)構建起全域數據能力,實現全域數據資產管理和運營創(chuàng)新,滿足在云端、本地等多種環(huán)境下任何數據類型的各種數據服務需求。例如,愛數今年正式推出的AnyBackup Family 8、AnyShare 領域大模型一體機、AnyShare認知助手等一系列新品。 其次,愛數的五大產品并不是簡單的產品堆砌,而是深度集成與融合。憑借ONE架構,愛數五大產品的技術堆棧實現統(tǒng)一,各大產品之間深度集成,可以帶來全域數據的自由流動,以及為全域數據能力實現一致的用戶體驗和融合管理。 以AnyDATA為例,它除了幫助B端將大模型更安全、更經濟地落地行業(yè)應用場景,還與AnyBackup、AnyShare、AnyRobot、AnyFabric等產品緊密集成,利用領域認知智能和大模型提升AnyBackup等產品的智能化水平。像基于領域認知智能的AnyShare認知助手,提供創(chuàng)新的智能搜索、智能問答、輔助創(chuàng)作、輔助閱讀等認知能力,真正幫助B端企業(yè)實現內容管理“智能化”,進一步釋放數據內容的價值。 另外,愛數深知領域認知智能的落地是一條長期之路,僅僅依靠愛數一家公司的產品與能力是遠遠不夠的。為此,愛數推出“數字伙伴計劃”,該計劃旨在將客戶的業(yè)務場景、行業(yè)知識與愛數五大產品結合,形成面向行業(yè)的數據服務解決方案,實現以數據驅動業(yè)務、增強數字化韌性,共創(chuàng)數據驅動型組織。 “愛數的愿景是希望以數據重塑生產力,共創(chuàng)智能世界?!睈蹟悼偛觅R鴻富最后表示道。 |
|