領域認知智能走向落地，B端企業(yè)還缺些啥？

大數據在線 2023-11-07 發(fā)布于北京

展開全文

大模型如何為我所用？

這是當下B端眾多企業(yè)都在深入思考的一個問題。今年以來，大模型在辦公、對話、搜索等領域所展現出的強大能力，讓越來越多B端企業(yè)意識到大模型對于業(yè)務的巨大價值。

因此，領域認知智能迅速成為B端企業(yè)關注的焦點，甚至各個大廠紛紛為之推出各種垂直領域的大模型。但大模型本身尚處于發(fā)展的早期階段，在垂直行業(yè)的落地依然面臨不小挑戰(zhàn)，首當其沖的就是領域數據與大模型如何有效融合、訓練等挑戰(zhàn)。

“領域認知智能是 AGI 時代面向特定技術或行業(yè)領域，基于領域數據對大模型進行預訓練或調優(yōu)，并利用知識工程將私域數據加工成領域知識網絡，通過兩種技術融合實現機器對特定領域的理解、推理、歸納等認知能力?！睈蹟悼偛觅R鴻富直言道。

歸根結底，領域認知智能的發(fā)展與落地將決定著人工智能未來普及的廣度和深度。

走向領域深度，用戶準備好了嗎

對于金融、教育、醫(yī)療、制造等B端企業(yè)而言，關心的不是大模型如何寫詩作畫，而是業(yè)務場景帶來生產力的提升。

B端企業(yè)通常具有豐富的場景、領域數據量巨大，有利于大模型能力的發(fā)揮；與此同時，又對降本增效需求強烈，且極為看重領域數據的安全性。因此，領域認知智能的建設與面向C端的大模型應用有著本質區(qū)別。

在愛數產品副總裁李基亮看來，大模型走向垂直領域是大勢所趨，領域認知智能的落地主要面臨著兩大挑戰(zhàn)：一是大模型在面向特定領域落地時面臨的生成內容幻覺、不及時和不可解釋性等問題；另一個則是大模型在垂直領域帶來的安全性以及成本等方面的擔憂。

領域認知智能需要解決的首要問題就是數據問題。眾所周知，數據決定人工智能發(fā)展的天花板，在領域認知智能尤甚。OpenAI CEO Sam Altman今年指出，大規(guī)模、高質量的數據，以及數據高效處理、調優(yōu)的工程化是大模型能力得以展現和提升的關鍵。

例如，在領域任務中，大模型需要遵循特定領域的規(guī)范、制度、流程和知識進行回答。如果不進行適當的調優(yōu)，大模型往往會拋開給定的文檔或信息，傾向于利用已習得的通用知識進行自由發(fā)揮。

另一個不容忽視的顯示情況就是，B端企業(yè)自身積累了大量的領域數據，對安全極其敏感且價值巨大，這就決定著B端企業(yè)在領域認知智能的建設中傾向于本地化部署模式。

不過，本地化部署也不可避免會帶來成本、復雜性等挑戰(zhàn)。例如，垂直類大模型普遍具有多領域數據（多技術、主業(yè)與關聯(lián)行業(yè)的多行業(yè)）、多場景分析（運營管理、市場營銷、產品技術、服務支持等）等特點，場景推理分析復雜、應用整合復雜，且開發(fā)整合成本高。

針對領域認知智能落地面臨的各種挑戰(zhàn)，愛數的思路是將大模型與數據治理、內容管理、數據資產化等技術進行高效結合，降低大模型在實際垂直領域的落地門檻，最終實現幫助B端企業(yè)構建起領域認知智能。這其中，愛數認知智能框架AnyDATA Framworks 3又是關鍵一環(huán)。

如何才能高效用好大模型

在中國人工智能市場，最不缺的就是各種大模型。

相關數據顯示，中國市場的大模型數量已經突破200個，各類大模型琳瑯滿目、魚龍混雜，一定程度也給B端企業(yè)造成選擇困難，加上部署、訓練、開發(fā)的復雜性和成本挑戰(zhàn)，B端企業(yè)對于大模型的心態(tài)往往是“想用卻不敢用”。

愛數認知智能框架AnyDATA Framework 3的出現，恰到好處地打消了B端企業(yè)對于大模型的種種顧慮。

作為一個中立的認知智能框架平臺，AnyDATA Framework 3做到大模型的中立，給予B端企業(yè)的選擇權；同時，屏蔽了大模型接入、知識網絡構建與應用開發(fā)的復雜性，且兼容目前市場上各類主流大模型，降低大模型的使用門檻，為B端企業(yè)提供各類大模型的認知應用開發(fā)能力。

“AnyDATA Framework 3是采用私域部署的一站式認知智能框架平臺，實現大模型在各種垂直領域的增強與優(yōu)化，B端企業(yè)利用模型工廠、知識網絡工作臺、認知應用工作臺可以快速、高效、合規(guī)地實現認知應用的開發(fā)。”李基亮介紹道。

例如，針對大模型通過簡單類比得出錯誤答案的“幻覺”問題，AnyDATA Framework 3關鍵技術檢索增強生成模式（RAG模式）在大模型推理生成時，使用私域數據/領域知識庫進行檢索召回，解決大模型“幻覺”問題，實現生成內容的可解釋性，且無需額外訓練，不同大模型均可使用，可以充分發(fā)揮大模型的推理能力和創(chuàng)造能力。

就像人才培養(yǎng)，首先從通識教育的基礎能力培養(yǎng)開始，之后再側重專業(yè)知識的高等教育。B端企業(yè)的領域認知智能落地過程也是類似，大模型在AGI時代提供了強大的基礎能力，進入到垂直領域必然需要領域數據、知識做支撐，而愛數AnyDATA Framework 3則猶如架起一座橋梁，幫助大模型在B端企業(yè)實現從基礎到專業(yè)的進階。

事實上，除了AnyDATA Framework 3，愛數近年來持續(xù)探索的大數據基礎設施戰(zhàn)略，開始在AGI時代綻放出巨大的價值。

Data+AI，大數據基礎設施開新局

今年起，B端企業(yè)在領域認知智能的探索與實踐中，愈發(fā)意識到基礎設施層所起到的關鍵作用與核心價值。

作為一直深耕在大數據基礎設施領域的廠商，愛數也緊跟時代步伐，持續(xù)投入領域認知智能的創(chuàng)新，與時俱進的提出了“Data+AI”戰(zhàn)略，基于“Data+AI”對各大產品進行全面智能化升級。

之所以會如此，是因為像愛數這種聚焦大數據基礎設施創(chuàng)新的企業(yè)，在常年與各類數據打交道過程中，深刻洞察到數據要素對于B端企業(yè)的巨大價值，以及B端企業(yè)對于釋放數據生產力的迫切性；另外，數據基礎設施領域又是大模型最有希望率先實現落地的領域之一，愛數積極擁抱領域認知智能、大模型，對各大產品全面智能化升級，有利于為B端企業(yè)在AGI時代的數據管理、數據消費、使用交互等方面將帶來深遠影響。

首先，愛數已形成AnyBackup、AnyShare、AnyRobot、AnyDATA和AnyFabric五大產品線，可以幫助B端企業(yè)構建起全域數據能力，實現全域數據資產管理和運營創(chuàng)新，滿足在云端、本地等多種環(huán)境下任何數據類型的各種數據服務需求。例如，愛數今年正式推出的AnyBackup Family 8、AnyShare 領域大模型一體機、AnyShare認知助手等一系列新品。

其次，愛數的五大產品并不是簡單的產品堆砌，而是深度集成與融合。憑借ONE架構，愛數五大產品的技術堆棧實現統(tǒng)一，各大產品之間深度集成，可以帶來全域數據的自由流動，以及為全域數據能力實現一致的用戶體驗和融合管理。

以AnyDATA為例，它除了幫助B端將大模型更安全、更經濟地落地行業(yè)應用場景，還與AnyBackup、AnyShare、AnyRobot、AnyFabric等產品緊密集成，利用領域認知智能和大模型提升AnyBackup等產品的智能化水平。像基于領域認知智能的AnyShare認知助手，提供創(chuàng)新的智能搜索、智能問答、輔助創(chuàng)作、輔助閱讀等認知能力，真正幫助B端企業(yè)實現內容管理“智能化”，進一步釋放數據內容的價值。

另外，愛數深知領域認知智能的落地是一條長期之路，僅僅依靠愛數一家公司的產品與能力是遠遠不夠的。為此，愛數推出“數字伙伴計劃”，該計劃旨在將客戶的業(yè)務場景、行業(yè)知識與愛數五大產品結合，形成面向行業(yè)的數據服務解決方案，實現以數據驅動業(yè)務、增強數字化韌性，共創(chuàng)數據驅動型組織。

“愛數的愿景是希望以數據重塑生產力，共創(chuàng)智能世界?！睈蹟悼偛觅R鴻富最后表示道。