【原】AIGC如何借AI Agent落地？TARS-RPA-Agent破解RPA與LLM融合難題

王吉偉頻道 2023-08-23 發(fā)布于山東

展開全文

融合LLM的RPA進(jìn)化到什么程度？來看看實(shí)在智能的TARS-RPA-Agent
AIGC如何借AI Agent落地？實(shí)在智能TARS-RPA-Agent告訴你答案
具備里程碑的意義的TARS-RPA-Agent，為超自動(dòng)化的未來提供了方向
實(shí)在智能TARS-RPA-Agent，業(yè)界首發(fā)的產(chǎn)品級Agent有何非凡之處？
像生成文本一樣生成流程，實(shí)在智能TARS-RPA-Agent開啟RPA新體驗(yàn)
邊探索邊創(chuàng)建，實(shí)在智能TARS-RPA-Agent破解RPA與LLM融合難題

文/王吉偉

大語言模型（LLM，Large Language Model）的持續(xù)爆發(fā)，讓AIGC一直處于這股AI風(fēng)暴最中央，不停席卷各個(gè)領(lǐng)域。

在國內(nèi)，仍在雨后春筍般上新的大語言模型，在持續(xù)累加“千模大戰(zhàn)”大模型數(shù)量的同時(shí)，也在不斷填補(bǔ)垂直大語言模型在各個(gè)領(lǐng)域的空白。

每個(gè)領(lǐng)域都會(huì)有自己的大模型，每個(gè)領(lǐng)域都會(huì)有廠商推出自有模型。更多的LLM，讓AIGC以更迅猛的速度進(jìn)入并影響更多業(yè)務(wù)場景。

AIGC并不只有C端用戶所看到的用AI工具生成文字、圖畫、視頻等各種內(nèi)容，還有B端的用AI直接生成以及驅(qū)動(dòng)管理系統(tǒng)生成各種可執(zhí)行的業(yè)務(wù)流程。

相對于C端產(chǎn)品直接引入生成式AI或者部署開源模型就能搞定，B端產(chǎn)品要在引入、部署及自研LLM的基礎(chǔ)上做更多的訓(xùn)練、微調(diào)與優(yōu)化等，才能保證LLM能夠與已有產(chǎn)品更好的融合，以更好地發(fā)揮各自所長。

一旦LLM與企業(yè)管理軟件融合好，便意味著大模型的順利落地。而大語言模型的私有化部署能力，往往意味著廠商們更大的商機(jī)。

這樣，LLM與企業(yè)管理軟件的融合成了重中之重。發(fā)布領(lǐng)域大模型與提供私有化部署，也成了廣大B端廠商主流做法，更使得能夠代替用戶和大模型進(jìn)行交互的AI Agent ，在Prompt系統(tǒng)工程之后成了香餑餑。

當(dāng)前，AI Agent已是公認(rèn)大語言模型落地的有效方式之一，它讓更多人看清了大語言模型創(chuàng)業(yè)的方向，也讓投資者們更加看好LLM、Agent與已有企業(yè)管理軟件的融合應(yīng)用。

在這其中，因?yàn)镽PA、低代碼等技術(shù)在自動(dòng)化方面的天然屬性，并且自然語言交互能夠?yàn)槠鋷硐喈?dāng)?shù)馁|(zhì)變，能夠?yàn)榭蛻舳说蕉俗詣?dòng)化的超自動(dòng)化如何與AI Agent融合，也成了很多投資機(jī)構(gòu)重點(diǎn)關(guān)注的領(lǐng)域。

說到這里，有人可能會(huì)問：超自動(dòng)化與LLM的融合進(jìn)展到了什么程度？有沒有廠商在做AI Agent方面的嘗試？產(chǎn)品體驗(yàn)如何？

恰好最近實(shí)在智能正式發(fā)布了TARS大模型，并在業(yè)界首發(fā)了基于大模型的Agent產(chǎn)品TARS-RPA-Agent。同時(shí)為了搞明白這款產(chǎn)品，發(fā)布會(huì)后王吉偉頻道還做了專訪。

本文就以這款產(chǎn)品為例，跟大家聊聊上面的幾個(gè)問題。

基于大模型的產(chǎn)品級Agent：TARS-RPA-Agent

看到Agent，很多人會(huì)想到AI Agent及其代表作AutoGPT。

AutoGPT是一個(gè)基于ChatGPT的工具，能幫你自動(dòng)完成各種任務(wù)，比如寫代碼、寫報(bào)告、做調(diào)研等等。只需要告訴它要扮演的角色和要實(shí)現(xiàn)的目標(biāo)，它就能利用ChatGPT和谷歌搜索等工具，不斷“思考”如何接近目標(biāo)并執(zhí)行，還可以看到它的思考過程。

AutoGPT會(huì)根據(jù)用戶提出的目標(biāo)制定并自動(dòng)化執(zhí)行完整計(jì)劃，解決了被大多數(shù)人所詬病的“與LLM交互過程中的無效提問及反饋”等諸多問題。

AutoGPT的火爆，也讓AI Agent快速出圈。

AI Agent是指人工智能代理（Artificial Intelligence Agent），是一種能夠感知環(huán)境、進(jìn)行決策和執(zhí)行動(dòng)作的智能實(shí)體。它通?；跈C(jī)器學(xué)習(xí)和人工智能技術(shù)，具備自主性和自適應(yīng)性，在特定任務(wù)或領(lǐng)域中能夠自主地進(jìn)行學(xué)習(xí)和改進(jìn)。

LLM擅長處理和生成文本，但只有給它輸入才會(huì)產(chǎn)生輸出，仍然是一種被動(dòng)使用模式。AI Agent則提供了更廣泛的功能，尤其是在與環(huán)境的交互、主動(dòng)決策和執(zhí)行各種任務(wù)方面。

AI Agent以LLM為大腦，再賦予任務(wù)規(guī)劃能力、長短期記憶力、工具使用能力，即可實(shí)現(xiàn)自動(dòng)化處理更復(fù)雜的任務(wù)。簡單來說，AI Agent基于LLM驅(qū)動(dòng)Agent實(shí)現(xiàn)對通用問題的自動(dòng)化處理。

AI Agent具備獨(dú)立的思考和認(rèn)知功能、擁有記憶，能進(jìn)行思考、邏輯推斷和自我反思，可以閱讀和在線學(xué)習(xí)，擅長利用適當(dāng)?shù)墓ぞ咛幚韱栴}，還能策劃并根據(jù)實(shí)際情況調(diào)整任務(wù)的優(yōu)先級。

可以說，AI Agent為LLM提供了行動(dòng)能力，真正釋放了LLM的潛能。

那RPA與AI Agent結(jié)合，會(huì)有什么樣的化合反應(yīng)呢？

這次實(shí)在智能業(yè)界首發(fā)的TARS-RPA-Agent，正是一款A(yù)I Agent類RPA產(chǎn)品。

但需要說明的是，與AutoGPT只提供智能體框架不同。實(shí)在智能創(chuàng)始人兼CEO孫林君（阿寶）告訴王吉偉頻道，TARS-RPA-Agent是一個(gè)真正的產(chǎn)品級Agent，是普通用戶不需要部署就能方便使用的大語言模型智能體。經(jīng)過技術(shù)優(yōu)化以后的Agent產(chǎn)品，不會(huì)在使用時(shí)陷入邏輯上的死循環(huán)，也不會(huì)過度消耗tokens。

前文講過AI Agent的核心是LLM，TARS-RPA-Agent所依賴的LLM是實(shí)在智能基于通用大模型基座的自研垂直“塔斯（TARS）”大模型。

TARS大模型具備優(yōu)異的文本生成、語言理解、知識問答、邏輯推理等主流能力。

其中，實(shí)在智能與湘財(cái)證券共建的“自研、有效、安全、可信任、可落地”的財(cái)經(jīng)行業(yè)大模型TARS-Finance-7B，保留了生成式大模型的通用技能，并在金融財(cái)經(jīng)領(lǐng)域得到了顯著的加強(qiáng)和提升，在多個(gè)中英文的通用基準(zhǔn)測評集和財(cái)經(jīng)領(lǐng)域基準(zhǔn)測評集上均取得良好成績。

簡單來講，TARS-RPA-Agent是一個(gè)基于“TARS+ISSUT（智能屏幕語義理解）”雙模引擎、有“大腦”，更有“眼睛和手腳”的超自動(dòng)化智能體，是能夠自主拆解任務(wù)、感知當(dāng)前環(huán)境、執(zhí)行并且反饋、記憶歷史經(jīng)驗(yàn)的RPA全新模式產(chǎn)品。

TARS-RPA-Agent采用以TARS大模型和ISSUT智能屏幕語義理解為基座的技術(shù)框架。該技術(shù)框架分為兩層結(jié)構(gòu)：底層是包括通用基礎(chǔ)模型和各個(gè)垂直行業(yè)基礎(chǔ)模型在內(nèi)的TARS系列大模型和智能屏幕語義理解技術(shù)；上層是依托這兩項(xiàng)關(guān)鍵技術(shù)完成全面升級和改造的超自動(dòng)化產(chǎn)品。

能夠在AI Agent盛行不久便能打造出AI智能體產(chǎn)品，得益于長期的技術(shù)沉淀與經(jīng)驗(yàn)積累。自推出RPA產(chǎn)品至今天發(fā)布TARS-RPA-Agent，實(shí)在智能的產(chǎn)品體系已經(jīng)歷三次重要迭代：

2018-2021年，實(shí)在第一代專家模式RPA，實(shí)現(xiàn)可視化拖拉拽構(gòu)建數(shù)字員工。

2021-2022，實(shí)在第二代簡易模式IPA，基于首創(chuàng)ISSUT智能屏幕語義理解技術(shù)，跳出IDE技術(shù)模式，開啟全球首個(gè)點(diǎn)選用模式RPA。

2022-2023，實(shí)在第三代對話模式RPA（ChatRPA），結(jié)合大語言模型基礎(chǔ)，實(shí)現(xiàn)超自動(dòng)化Agent，打造業(yè)界首款計(jì)算機(jī)視覺與大語言模型結(jié)合的智能體產(chǎn)品，以全新體驗(yàn)人機(jī)交互開啟對話式流程創(chuàng)建時(shí)代。

正是因?yàn)槎嗄甑某掷m(xù)創(chuàng)新與不懈努力，使得實(shí)在智能TARS-RPA-Agent模式ChatRPA，成為國內(nèi)首個(gè)基于大語言模型和智能屏幕語義理解的產(chǎn)品級Agent，真正實(shí)現(xiàn)流暢的對話式生成業(yè)務(wù)流程，因此一經(jīng)發(fā)布就得到了業(yè)內(nèi)外的廣泛關(guān)注。

說了這么多，產(chǎn)品體驗(yàn)如何呢？不要急，下一節(jié)就會(huì)講到。

像生成文本一樣生成流程

在采訪中，實(shí)在智能演示了幾個(gè)案例。

其中一個(gè)是web端案例，演示如何通過與TARS對話，ChatRPA自動(dòng)創(chuàng)建在京東查詢商品數(shù)據(jù)的流程。

在新建流程的對話窗口輸入“查詢京東中最暢銷的電視機(jī)”，提交以后塔斯反饋了流程創(chuàng)建的兩個(gè)執(zhí)行計(jì)劃。在計(jì)劃詳情中可以查看每個(gè)計(jì)劃的執(zhí)行步驟，還可以通過多輪對話修改以創(chuàng)建更復(fù)雜的流程。點(diǎn)擊執(zhí)行后，ChatRPA就會(huì)進(jìn)入IPA模式按計(jì)劃的詳情步驟開始執(zhí)行。

遇到不能執(zhí)行的步驟，只需要人工通過繼續(xù)對話或者按照提示點(diǎn)擊相應(yīng)頁面元素，流程就能持續(xù)創(chuàng)建，全流程基本都是自動(dòng)化創(chuàng)建，人工參與的部分已經(jīng)很少。

并且，還可以在流程執(zhí)行完畢的基礎(chǔ)上，通過對話繼續(xù)增加新的執(zhí)行計(jì)劃以完善流程。

在演示中，最后增加了一輪對話：將商品名保存到桌面TXT文件中。提交以后，ChatRPA會(huì)按照新的計(jì)劃繼續(xù)執(zhí)行。

實(shí)在智能產(chǎn)品專家拓海告訴王吉偉頻道，最后這個(gè)計(jì)劃看起來簡單，實(shí)則體現(xiàn)了ChatRPA的兩個(gè)能力：一是邏輯推理能力，它能夠?qū)⒅案鱾€(gè)組件變量的邏輯關(guān)系進(jìn)行串聯(lián)；二是代碼生成能力，在沒有基礎(chǔ)組件的流程步驟中它可以直接生成一段代碼，并把這個(gè)代碼封裝成為自建組件。

重點(diǎn)在于，這個(gè)組件是可以復(fù)用的，以后在流程創(chuàng)建中有需要的時(shí)候可以隨時(shí)調(diào)用這個(gè)組件。

在王吉偉頻道看來，對于沒有編程能力的普通用戶而言，之前只能圍繞已有組件去做各種形式的流程實(shí)現(xiàn)，確實(shí)比較復(fù)雜?，F(xiàn)在基于大語言模型的ChatRPA具備了“遇河搭橋”的能力，在沒有組件可調(diào)用的情況下直接生成一個(gè)組件，進(jìn)而保證流程的創(chuàng)建與執(zhí)行。

這就相當(dāng)于用戶在創(chuàng)建流程的時(shí)候身邊有個(gè)具備業(yè)務(wù)能力的程序員在做指導(dǎo)，總能以最簡單最優(yōu)化的方式幫助用戶去實(shí)現(xiàn)各種流程的創(chuàng)建與執(zhí)行。所以，理論上已經(jīng)沒有任何流程的創(chuàng)建能夠難住ChatRPA。并且隨著不斷的數(shù)據(jù)喂養(yǎng)與加強(qiáng)學(xué)習(xí)，以后它還能生成更復(fù)雜的組件以創(chuàng)建復(fù)雜的長流程。

組件是可以復(fù)用的，流程也是一樣的。

阿寶告訴王吉偉頻道，流程并不是一下就生成的，TARS-RPA-Agent會(huì)不斷修改用戶意圖，不斷完善流程，流程可以越做越復(fù)雜，最后會(huì)變成一個(gè)高可用的標(biāo)準(zhǔn)流程。

簡單地講，讓基于大語言模型的RPA自動(dòng)創(chuàng)建流程主要分為兩步：第一步是分析操作對象界面元素，第二步是在流程步驟中填充需要被操作的元素。

在阿寶看來，大語言模型本質(zhì)上是一個(gè)語言模型，它能夠分析邏輯，卻看不到要操作的對象。而通過計(jì)算機(jī)視覺告訴LLM操作對象在哪里，它就可以進(jìn)一步去操作各種對象驅(qū)動(dòng)RPA去創(chuàng)建各種流程。

所以，TARS-RPA-Agent與其他Agent的不同之處在于，目前大多數(shù)AI Agent產(chǎn)品仍是基于語言模型的綜合應(yīng)用，而TARS-RPA-Agent是計(jì)算機(jī)視覺和大模型的結(jié)合。這在全球Agent領(lǐng)域也是不多見的，更是RPA領(lǐng)域的首創(chuàng)。

能夠?qū)崿F(xiàn)這一點(diǎn)，更得益于實(shí)在智能很久之前就布局的智能屏幕語義理解技術(shù)。

拓海告訴王吉偉頻道，過去的IPA模式，用戶可能還得根據(jù)AI推薦去找一些需要被操作的對象元素。TARS-RPA-Agent則更進(jìn)一步，不需要去指定元素，只需要告訴模型要操作的目標(biāo)是什么，它刷一下當(dāng)前的屏幕，就能根據(jù)屏幕語義理解意思，直接命中目標(biāo)元素。

如果沒有命中的話，則需要一些人機(jī)協(xié)助填充目標(biāo)。并且在協(xié)助過程中，TARS-RPA-Agent能夠記住這些元素及操作，逐步優(yōu)化語義理解，讓流程及組件復(fù)用性更高。

此外，TARS-RPA-Agent還實(shí)現(xiàn)了語音流程創(chuàng)建的體驗(yàn)大提升。

通過對話機(jī)器人+RPA進(jìn)行語音對話式RPA流程創(chuàng)建，已經(jīng)是比較常見的解決方案。現(xiàn)在市面上不乏接入天貓精靈、小度等語音機(jī)器人調(diào)用RPA的產(chǎn)品。但這種應(yīng)用需要建立在已經(jīng)創(chuàng)建好的流程基礎(chǔ)之上，需要先以人工方式創(chuàng)建好流程，才能實(shí)現(xiàn)以對話機(jī)器人調(diào)用流程。

TARS-RPA-Agent的不同之處在于，用戶只需要對機(jī)器人說出需求，機(jī)器人即可完成即時(shí)的流程搭建和執(zhí)行，而不再需要提前創(chuàng)建流程，真正實(shí)現(xiàn)即時(shí)場景的“你說機(jī)器人做”。

整體演示下來，給王吉偉頻道的感覺是，結(jié)合AI Agent及屏幕語義理解技術(shù)的ChatRPA，真的實(shí)現(xiàn)了像生成文本一樣生成流程，使用體驗(yàn)得到倍數(shù)級提升。尤其是通過語音即時(shí)創(chuàng)建與執(zhí)行流程，已經(jīng)初步有了《鋼鐵俠》中托尼使用AI助理塔維斯即時(shí)執(zhí)行任務(wù)的感覺。

“邊探索邊創(chuàng)建”流程生成方式

ChatRPA能夠?qū)崿F(xiàn)流暢的對話生成自動(dòng)化流程，也體現(xiàn)了實(shí)在智能對于產(chǎn)品的幾點(diǎn)思考：

首先，入口要好找，方便進(jìn)入，可根據(jù)場景需要可隨時(shí)喚起；

其次，使用要靈活，不僅能將一個(gè)任務(wù)完整的自動(dòng)化流程規(guī)劃生成出來，還能應(yīng)對復(fù)雜特殊的場景，能夠生成代碼組件，也能保持和發(fā)揮大模型的特色，具有廣闊知識的查詢和建議生成能力。

再者，所生成的流程要能夠工業(yè)化應(yīng)用，就需要容忍模型的不完整，必須支持人機(jī)協(xié)同，也就是可對流程進(jìn)行修改、增加、刪除，當(dāng)然最基本的要求，可直接運(yùn)行。

正是這些思考，使得實(shí)在智能沒有走“全流程一次生成”的路子，而是采取了一種“邊探索邊創(chuàng)建”的遞進(jìn)式流程生成方式。

要知道，流程中的各種元素是時(shí)刻在變的，所以流程創(chuàng)建也應(yīng)該以一種更靈活的方式實(shí)現(xiàn)中途修改，需要每一步都結(jié)合用戶的意圖去探索性的操作，不然就會(huì)出現(xiàn)一次生成完整流程而不能使用或者經(jīng)過大量修改才能使用的情況。

在這個(gè)基礎(chǔ)上，TARS-RPA-Agent不但實(shí)現(xiàn)了單步尋優(yōu)，還做到了把每一步的執(zhí)行過程和結(jié)果都展示和反饋出來。

事實(shí)證明，只有“邊探索邊創(chuàng)建”的模式，才能讓RPA真正融合LLM并發(fā)揮真正的作用。

而為了開發(fā)一款真正意義上的RPA/超自動(dòng)化Agent，實(shí)在智能至少克服了包括打造“邊探索邊創(chuàng)建”模式在內(nèi)的四重挑戰(zhàn)。

“你說，TArs做”背后的四重挑戰(zhàn)

這次發(fā)布會(huì)的主題是：RPA新境界—你說TArs做。

這個(gè)主題，也映射了實(shí)在智能在TARS-RPA-Agent的終極目標(biāo)是“你說，PC做”，要真正實(shí)現(xiàn)包括流程創(chuàng)建等各種業(yè)務(wù)處理的“所說及所得”。

我們已經(jīng)知道，TARS大模型在語義理解、內(nèi)容生成、多輪問答、信息抽取等方面具有獨(dú)特優(yōu)勢和強(qiáng)大能力。要實(shí)現(xiàn)這個(gè)目標(biāo)，是不是把TARS的能力接入到RPA中就夠了？是不是大模型就能直接為生成流程、完成工作？

經(jīng)過一系列論證與測試，在實(shí)在智能看來，想要實(shí)現(xiàn)“你說，TArs做”這個(gè)目標(biāo)，并不是簡單結(jié)合就可以的。

想要讓TARS聽得懂人話并完得成各種任務(wù)，至少面臨四重挑戰(zhàn)：

挑戰(zhàn)一：不能自主拆解任務(wù)。實(shí)際場景中的復(fù)雜指令往往蘊(yùn)含在簡潔的語句當(dāng)中，想要TARS-RPA-Agent既能接任務(wù)又能做任務(wù)，無法依靠大模型生成一段Python代碼或簡單調(diào)用幾個(gè)RPA組件就能實(shí)現(xiàn)，而是需要它理解指令并拆解成可執(zhí)行的子任務(wù)和步驟。

挑戰(zhàn)二：無法感知當(dāng)前環(huán)境。TARS-RPA-Agent必須對周邊的環(huán)境有充分的認(rèn)知、理解和交互，知道它是誰以及它在哪。

在RPA領(lǐng)域中，TARS-RPA-Agent所處的周邊環(huán)境也就是運(yùn)行流程的那臺電腦，以及所要操作的各種網(wǎng)頁、軟件和電腦屏幕等。單純依靠一個(gè)大語言模型做不到這一點(diǎn)，它需要超越語言大模型技能之外的、真正人類視角的操作對象理解能力。

挑戰(zhàn)三：不能邊執(zhí)行邊反饋。任務(wù)執(zhí)行應(yīng)該隨地關(guān)注任務(wù)的進(jìn)度如何，有無風(fēng)險(xiǎn)，并通過不斷的“執(zhí)行-反饋-修正”來確保任務(wù)正常運(yùn)行。

TARS-RPA-Agent面臨同樣問題，一次性生成但無法成功執(zhí)行的整段流程是沒有意義的，它需要保證每一步操作的正確性，不會(huì)因?yàn)轭I(lǐng)會(huì)錯(cuò)了意圖，或者前一步操作失誤，而導(dǎo)致當(dāng)前步驟點(diǎn)錯(cuò)按鈕、輸錯(cuò)賬號或者發(fā)錯(cuò)郵件。

挑戰(zhàn)四：無法記憶歷史經(jīng)驗(yàn)。大語言模型一直存在一個(gè)很大的問題是缺乏長時(shí)記憶，TARS-RPA-Agent需要學(xué)習(xí)歷史經(jīng)驗(yàn)，并通過歷史案例不斷提升決策能力。但如果不能長時(shí)記憶，顯然就無法勝任與學(xué)習(xí)各種能力，因此它需要超出一般大模型的自主迭代能力。

針對上述四重挑戰(zhàn)，實(shí)在智能采取了不同的技術(shù)、設(shè)計(jì)和方法來應(yīng)對，最終將TARS-RPA-Agent打造成為一個(gè)有大腦眼睛和手腳的能夠自主拆解任務(wù)、感知當(dāng)前環(huán)境、執(zhí)行并且反饋和記憶歷史經(jīng)驗(yàn)的IPA全新模式和超自動(dòng)化智能體。

有了對AI Agent類RPA產(chǎn)品的深度認(rèn)知、全新理解，基于“ISSUT智能屏幕語義理解+TARS垂類大模型”架構(gòu)的ARS-RPA-Agent模式ChatRPA，也具備了“三智三可”的特色優(yōu)勢。

“三智”即智能理解、智能分析和智能生成：

■ 智能理解：能智能理解對話內(nèi)容，理解所描述的任務(wù)、指令；

■ 智能分析：能分析并拆解任務(wù)，規(guī)劃任務(wù)過程和動(dòng)作；

■ 智能生成：能映射成自動(dòng)化組件，智能填充好屬性、對象等。

“三可”為可以執(zhí)行、可以解釋及可以修改：

■ 可以執(zhí)行：不只是生成過程規(guī)劃，而是可執(zhí)行的自動(dòng)化流程；

■ 可以解釋：不僅是任務(wù)拆解過程說明，還可查看每個(gè)動(dòng)作參屬性數(shù)；

■ 可以修改：不僅可執(zhí)行，還可隨意插入、修改和刪除的動(dòng)作。

“三智三可”體現(xiàn)了實(shí)在智能ChatRPA“真實(shí)實(shí)用”的宗旨，也讓其產(chǎn)品真正實(shí)現(xiàn)了“像生成文本一樣生成流程”的超易用性體驗(yàn)。

后記：TARS-RPA-Agent的未來

TARS-RPA-Agent能夠在哪些領(lǐng)域獲得長足的發(fā)展，一定程度上取決于TARS大模型在哪些領(lǐng)域有更強(qiáng)的能力。目前TARS-Finance-7B在金融領(lǐng)域的能力是有目共睹的，在多個(gè)大模型評測中的綜合評分都遠(yuǎn)超行業(yè)平均分?jǐn)?shù)。

對于為何要優(yōu)先選擇金融領(lǐng)域，阿寶告訴王吉偉頻道，首先在于金融領(lǐng)域的公開數(shù)據(jù)、權(quán)威數(shù)據(jù)比較多且相對規(guī)范，其次在于金融是RPA市場份額增長比較快的領(lǐng)域。

除了金融領(lǐng)域，實(shí)在智能也正在訓(xùn)練和微調(diào)塔斯大模型在其他領(lǐng)域的能力。并且實(shí)現(xiàn)起來也比較簡單，只要把諸如法律、人力資源等領(lǐng)域的語料加入并進(jìn)行持續(xù)訓(xùn)練和微調(diào)，就能打造面向這兩個(gè)領(lǐng)域垂直行業(yè)模型。

TARS-RPA-Agent之所以備受矚目，在于它是業(yè)界首個(gè)大語言模型與計(jì)算機(jī)視覺有機(jī)結(jié)合的Agent，這是國內(nèi)廠商在AI Agent領(lǐng)域初步嘗試的成果，為超自動(dòng)化廠商以及To B領(lǐng)域產(chǎn)品的未來發(fā)展提供了一個(gè)方向，對RPA行業(yè)的發(fā)展具有里程碑的意義，也必將成為大語言模型落地的典型AI智能體案例。

在TARS大模型+ISSUT的后續(xù)發(fā)展上，實(shí)在智能早已制定計(jì)劃。

首先，會(huì)在充分評估和修正（模型性能、安全性等方面）后，對的TARS-Finance-7B模型進(jìn)行開源，以促進(jìn)生成式大模型方向的學(xué)術(shù)研究和應(yīng)用發(fā)展；

其次，會(huì)繼續(xù)擴(kuò)大TARS垂直大模型的參數(shù)規(guī)模，讓更多模型能力在更大的參數(shù)尺度上涌現(xiàn)，目前一個(gè)70B的行業(yè)大模型已經(jīng)在訓(xùn)練和優(yōu)化當(dāng)中；

第三，面向RPA領(lǐng)域的全新TARS-RPA-Agent功能則將在未來2個(gè)月內(nèi)隨著功能、性能等測試的進(jìn)一步完善，隨著新版本的發(fā)布而開放試用。

可以預(yù)見，有了這些發(fā)展計(jì)劃，TARS+X的全新模型及全新產(chǎn)品將會(huì)有更多可能。

除此之外，TARS-RPA-Agent的組件自動(dòng)生成，也有更大的想象空間。

對話式RPA的易用性前所未有，任何人都能通過簡單對話就能實(shí)現(xiàn)業(yè)務(wù)流程創(chuàng)建。

用戶只需通過簡單的自然語言指令，便能在自動(dòng)化或者人機(jī)協(xié)作構(gòu)建業(yè)務(wù)流程的過程中生成可復(fù)用的業(yè)務(wù)流程組件。

這意味著，普通用戶在使用ChatRPA的同時(shí)也將成為組件開發(fā)者，大量組件都將伴隨著他們的流程創(chuàng)建而生成，而不再依靠各領(lǐng)域的專業(yè)開發(fā)者去做組件開發(fā)，由此組件的開發(fā)速度和量級將會(huì)產(chǎn)生翻天覆地的變化。

未來這些業(yè)務(wù)流程和組件還可以上傳到應(yīng)用市場，所適配的應(yīng)用場景也會(huì)越來越豐富。隨著更多組件被置入公共組件庫，對話式生成流程的精準(zhǔn)度、適配度以及用戶體驗(yàn)也會(huì)越來越好。

這種流程及組件生成的UGC模式，將會(huì)真正改變流程構(gòu)建自動(dòng)化以及超自動(dòng)化行業(yè)的未來。

從TARS-RPA-Agent來看，TARS+ISSUT這樣的技術(shù)組合，大語言模型加上智能屏幕語義理解，大概率能夠讓RPA行業(yè)喊了多年的“RPA人人可用”愿景成為現(xiàn)實(shí)，也使得“人人擁有一個(gè)智能助理”進(jìn)一步成為可能。

阿寶透露，TARS大模型的名字來源于科幻電影《星際穿越》中的TARS 。

影片中的TARS是男主身邊的智能助理機(jī)器人，精通各個(gè)領(lǐng)域的知識，能夠自動(dòng)處理各項(xiàng)事務(wù)，并多次在關(guān)鍵時(shí)刻幫男主化險(xiǎn)為夷。

在未來計(jì)劃中，實(shí)在智能將會(huì)持續(xù)推出更多的TARS+X的模型及產(chǎn)品。

相信假以時(shí)日，在更多的廠商的努力之下，電影中的“你說TARS做”應(yīng)用場景也將在現(xiàn)實(shí)中無處不在。

全文完

【王吉偉頻道，關(guān)注AIGC與IoT，專注數(shù)字化轉(zhuǎn)型、業(yè)務(wù)流程自動(dòng)化與RPA，歡迎關(guān)注與交流?！?/span>

贊賞

共11人贊賞

小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

【原】AIGC如何借AI Agent落地？TARS-RPA-Agent破解RPA與LLM融合難題

【原】AIGC如何借AI Agent落地？TARS-RPA-Agent破解RPA與LLM融合難題