小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

AIGC如何借AI Agent落地?TARS-RPA-Agent破解RPA與LLM融合難題

 王吉偉頻道 2023-08-23 發(fā)布于山東

  • 融合LLM的RPA進(jìn)化到什么程度?來看看實(shí)在智能的TARS-RPA-Agent

  • AIGC如何借AI Agent落地?實(shí)在智能TARS-RPA-Agent告訴你答案

  • 具備里程碑的意義的TARS-RPA-Agent,為超自動(dòng)化的未來提供了方向

  • 實(shí)在智能TARS-RPA-Agent,業(yè)界首發(fā)的產(chǎn)品級Agent有何非凡之處?

  • 像生成文本一樣生成流程,實(shí)在智能TARS-RPA-Agent開啟RPA新體驗(yàn)

  • 邊探索邊創(chuàng)建,實(shí)在智能TARS-RPA-Agent破解RPA與LLM融合難題


文/王吉偉

大語言模型(LLM,Large Language Model)的持續(xù)爆發(fā),讓AIGC一直處于這股AI風(fēng)暴最中央,不停席卷各個(gè)領(lǐng)域。

在國內(nèi),仍在雨后春筍般上新的大語言模型,在持續(xù)累加“千模大戰(zhàn)”大模型數(shù)量的同時(shí),也在不斷填補(bǔ)垂直大語言模型在各個(gè)領(lǐng)域的空白。

每個(gè)領(lǐng)域都會(huì)有自己的大模型,每個(gè)領(lǐng)域都會(huì)有廠商推出自有模型。更多的LLM,讓AIGC以更迅猛的速度進(jìn)入并影響更多業(yè)務(wù)場景。

AIGC并不只有C端用戶所看到的用AI工具生成文字、圖畫、視頻等各種內(nèi)容,還有B端的用AI直接生成以及驅(qū)動(dòng)管理系統(tǒng)生成各種可執(zhí)行的業(yè)務(wù)流程。

相對于C端產(chǎn)品直接引入生成式AI或者部署開源模型就能搞定,B端產(chǎn)品要在引入、部署及自研LLM的基礎(chǔ)上做更多的訓(xùn)練、微調(diào)與優(yōu)化等,才能保證LLM能夠與已有產(chǎn)品更好的融合,以更好地發(fā)揮各自所長。

一旦LLM與企業(yè)管理軟件融合好,便意味著大模型的順利落地。而大語言模型的私有化部署能力,往往意味著廠商們更大的商機(jī)。

這樣,LLM與企業(yè)管理軟件的融合成了重中之重。發(fā)布領(lǐng)域大模型與提供私有化部署,也成了廣大B端廠商主流做法,更使得能夠代替用戶和大模型進(jìn)行交互的AI Agent ,在Prompt系統(tǒng)工程之后成了香餑餑。

當(dāng)前,AI Agent已是公認(rèn)大語言模型落地的有效方式之一,它讓更多人看清了大語言模型創(chuàng)業(yè)的方向,也讓投資者們更加看好LLM、Agent與已有企業(yè)管理軟件的融合應(yīng)用。

在這其中,因?yàn)镽PA、低代碼等技術(shù)在自動(dòng)化方面的天然屬性,并且自然語言交互能夠?yàn)槠鋷硐喈?dāng)?shù)馁|(zhì)變,能夠?yàn)榭蛻舳说蕉俗詣?dòng)化的超自動(dòng)化如何與AI Agent融合,也成了很多投資機(jī)構(gòu)重點(diǎn)關(guān)注的領(lǐng)域。

說到這里,有人可能會(huì)問:超自動(dòng)化與LLM的融合進(jìn)展到了什么程度?有沒有廠商在做AI Agent方面的嘗試?產(chǎn)品體驗(yàn)如何?

恰好最近實(shí)在智能正式發(fā)布了TARS大模型,并在業(yè)界首發(fā)了基于大模型的Agent產(chǎn)品TARS-RPA-Agent。同時(shí)為了搞明白這款產(chǎn)品,發(fā)布會(huì)后王吉偉頻道還做了專訪。

本文就以這款產(chǎn)品為例,跟大家聊聊上面的幾個(gè)問題。

基于大模型的產(chǎn)品級Agent:TARS-RPA-Agent

看到Agent,很多人會(huì)想到AI Agent及其代表作AutoGPT。

AutoGPT是一個(gè)基于ChatGPT的工具,能幫你自動(dòng)完成各種任務(wù),比如寫代碼、寫報(bào)告、做調(diào)研等等。只需要告訴它要扮演的角色和要實(shí)現(xiàn)的目標(biāo),它就能利用ChatGPT和谷歌搜索等工具,不斷“思考”如何接近目標(biāo)并執(zhí)行,還可以看到它的思考過程。

AutoGPT會(huì)根據(jù)用戶提出的目標(biāo)制定并自動(dòng)化執(zhí)行完整計(jì)劃,解決了被大多數(shù)人所詬病的“與LLM交互過程中的無效提問及反饋”等諸多問題。

AutoGPT的火爆,也讓AI Agent快速出圈。

AI Agent是指人工智能代理(Artificial Intelligence Agent),是一種能夠感知環(huán)境、進(jìn)行決策和執(zhí)行動(dòng)作的智能實(shí)體。它通?;跈C(jī)器學(xué)習(xí)和人工智能技術(shù),具備自主性和自適應(yīng)性,在特定任務(wù)或領(lǐng)域中能夠自主地進(jìn)行學(xué)習(xí)和改進(jìn)。

LLM擅長處理和生成文本,但只有給它輸入才會(huì)產(chǎn)生輸出,仍然是一種被動(dòng)使用模式。AI Agent則提供了更廣泛的功能,尤其是在與環(huán)境的交互、主動(dòng)決策和執(zhí)行各種任務(wù)方面。

AI Agent以LLM為大腦,再賦予任務(wù)規(guī)劃能力、長短期記憶力、工具使用能力,即可實(shí)現(xiàn)自動(dòng)化處理更復(fù)雜的任務(wù)。簡單來說,AI Agent基于LLM驅(qū)動(dòng)Agent實(shí)現(xiàn)對通用問題的自動(dòng)化處理。

AI Agent具備獨(dú)立的思考和認(rèn)知功能、擁有記憶,能進(jìn)行思考、邏輯推斷和自我反思,可以閱讀和在線學(xué)習(xí),擅長利用適當(dāng)?shù)墓ぞ咛幚韱栴},還能策劃并根據(jù)實(shí)際情況調(diào)整任務(wù)的優(yōu)先級。

可以說,AI Agent為LLM提供了行動(dòng)能力,真正釋放了LLM的潛能。

那RPA與AI Agent結(jié)合,會(huì)有什么樣的化合反應(yīng)呢?

這次實(shí)在智能業(yè)界首發(fā)的TARS-RPA-Agent,正是一款A(yù)I Agent類RPA產(chǎn)品。

但需要說明的是,與AutoGPT只提供智能體框架不同。實(shí)在智能創(chuàng)始人兼CEO孫林君(阿寶)告訴王吉偉頻道,TARS-RPA-Agent是一個(gè)真正的產(chǎn)品級Agent,是普通用戶不需要部署就能方便使用的大語言模型智能體。經(jīng)過技術(shù)優(yōu)化以后的Agent產(chǎn)品,不會(huì)在使用時(shí)陷入邏輯上的死循環(huán),也不會(huì)過度消耗tokens。

前文講過AI Agent的核心是LLM,TARS-RPA-Agent所依賴的LLM是實(shí)在智能基于通用大模型基座的自研垂直“塔斯(TARS)”大模型。

TARS大模型具備優(yōu)異的文本生成、語言理解、知識問答、邏輯推理等主流能力。

其中,實(shí)在智能與湘財(cái)證券共建的“自研、有效、安全、可信任、可落地”的財(cái)經(jīng)行業(yè)大模型TARS-Finance-7B,保留了生成式大模型的通用技能,并在金融財(cái)經(jīng)領(lǐng)域得到了顯著的加強(qiáng)和提升,在多個(gè)中英文的通用基準(zhǔn)測評集和財(cái)經(jīng)領(lǐng)域基準(zhǔn)測評集上均取得良好成績。

簡單來講,TARS-RPA-Agent是一個(gè)基于“TARS+ISSUT(智能屏幕語義理解)”雙模引擎、有“大腦”,更有“眼睛和手腳”的超自動(dòng)化智能體,是能夠自主拆解任務(wù)、感知當(dāng)前環(huán)境、執(zhí)行并且反饋、記憶歷史經(jīng)驗(yàn)的RPA全新模式產(chǎn)品。

TARS-RPA-Agent采用以TARS大模型和ISSUT智能屏幕語義理解為基座的技術(shù)框架。該技術(shù)框架分為兩層結(jié)構(gòu):底層是包括通用基礎(chǔ)模型和各個(gè)垂直行業(yè)基礎(chǔ)模型在內(nèi)的TARS系列大模型和智能屏幕語義理解技術(shù);上層是依托這兩項(xiàng)關(guān)鍵技術(shù)完成全面升級和改造的超自動(dòng)化產(chǎn)品。

能夠在AI Agent盛行不久便能打造出AI智能體產(chǎn)品,得益于長期的技術(shù)沉淀與經(jīng)驗(yàn)積累。自推出RPA產(chǎn)品至今天發(fā)布TARS-RPA-Agent,實(shí)在智能的產(chǎn)品體系已經(jīng)歷三次重要迭代:

2018-2021年,實(shí)在第一代專家模式RPA,實(shí)現(xiàn)可視化拖拉拽構(gòu)建數(shù)字員工。

2021-2022,實(shí)在第二代簡易模式IPA,基于首創(chuàng)ISSUT智能屏幕語義理解技術(shù),跳出IDE技術(shù)模式,開啟全球首個(gè)點(diǎn)選用模式RPA。

2022-2023,實(shí)在第三代對話模式RPA(ChatRPA),結(jié)合大語言模型基礎(chǔ),實(shí)現(xiàn)超自動(dòng)化Agent,打造業(yè)界首款計(jì)算機(jī)視覺與大語言模型結(jié)合的智能體產(chǎn)品,以全新體驗(yàn)人機(jī)交互開啟對話式流程創(chuàng)建時(shí)代。

正是因?yàn)槎嗄甑某掷m(xù)創(chuàng)新與不懈努力,使得實(shí)在智能TARS-RPA-Agent模式ChatRPA,成為國內(nèi)首個(gè)基于大語言模型和智能屏幕語義理解的產(chǎn)品級Agent,真正實(shí)現(xiàn)流暢的對話式生成業(yè)務(wù)流程,因此一經(jīng)發(fā)布就得到了業(yè)內(nèi)外的廣泛關(guān)注。

說了這么多,產(chǎn)品體驗(yàn)如何呢?不要急,下一節(jié)就會(huì)講到。

像生成文本一樣生成流程

在采訪中,實(shí)在智能演示了幾個(gè)案例。

其中一個(gè)是web端案例,演示如何通過與TARS對話,ChatRPA自動(dòng)創(chuàng)建在京東查詢商品數(shù)據(jù)的流程。

在新建流程的對話窗口輸入“查詢京東中最暢銷的電視機(jī)”,提交以后塔斯反饋了流程創(chuàng)建的兩個(gè)執(zhí)行計(jì)劃。在計(jì)劃詳情中可以查看每個(gè)計(jì)劃的執(zhí)行步驟,還可以通過多輪對話修改以創(chuàng)建更復(fù)雜的流程。點(diǎn)擊執(zhí)行后,ChatRPA就會(huì)進(jìn)入IPA模式按計(jì)劃的詳情步驟開始執(zhí)行。

遇到不能執(zhí)行的步驟,只需要人工通過繼續(xù)對話或者按照提示點(diǎn)擊相應(yīng)頁面元素,流程就能持續(xù)創(chuàng)建,全流程基本都是自動(dòng)化創(chuàng)建,人工參與的部分已經(jīng)很少。

并且,還可以在流程執(zhí)行完畢的基礎(chǔ)上,通過對話繼續(xù)增加新的執(zhí)行計(jì)劃以完善流程。

在演示中,最后增加了一輪對話:將商品名保存到桌面TXT文件中。提交以后,ChatRPA會(huì)按照新的計(jì)劃繼續(xù)執(zhí)行。

實(shí)在智能產(chǎn)品專家拓海告訴王吉偉頻道,最后這個(gè)計(jì)劃看起來簡單,實(shí)則體現(xiàn)了ChatRPA的兩個(gè)能力:一是邏輯推理能力,它能夠?qū)⒅案鱾€(gè)組件變量的邏輯關(guān)系進(jìn)行串聯(lián);二是代碼生成能力,在沒有基礎(chǔ)組件的流程步驟中它可以直接生成一段代碼,并把這個(gè)代碼封裝成為自建組件。

重點(diǎn)在于,這個(gè)組件是可以復(fù)用的,以后在流程創(chuàng)建中有需要的時(shí)候可以隨時(shí)調(diào)用這個(gè)組件。

在王吉偉頻道看來,對于沒有編程能力的普通用戶而言,之前只能圍繞已有組件去做各種形式的流程實(shí)現(xiàn),確實(shí)比較復(fù)雜?,F(xiàn)在基于大語言模型的ChatRPA具備了“遇河搭橋”的能力,在沒有組件可調(diào)用的情況下直接生成一個(gè)組件,進(jìn)而保證流程的創(chuàng)建與執(zhí)行。

這就相當(dāng)于用戶在創(chuàng)建流程的時(shí)候身邊有個(gè)具備業(yè)務(wù)能力的程序員在做指導(dǎo),總能以最簡單最優(yōu)化的方式幫助用戶去實(shí)現(xiàn)各種流程的創(chuàng)建與執(zhí)行。所以,理論上已經(jīng)沒有任何流程的創(chuàng)建能夠難住ChatRPA。并且隨著不斷的數(shù)據(jù)喂養(yǎng)與加強(qiáng)學(xué)習(xí),以后它還能生成更復(fù)雜的組件以創(chuàng)建復(fù)雜的長流程。

組件是可以復(fù)用的,流程也是一樣的。

阿寶告訴王吉偉頻道,流程并不是一下就生成的,TARS-RPA-Agent會(huì)不斷修改用戶意圖,不斷完善流程,流程可以越做越復(fù)雜,最后會(huì)變成一個(gè)高可用的標(biāo)準(zhǔn)流程。

簡單地講,讓基于大語言模型的RPA自動(dòng)創(chuàng)建流程主要分為兩步:第一步是分析操作對象界面元素,第二步是在流程步驟中填充需要被操作的元素。

在阿寶看來,大語言模型本質(zhì)上是一個(gè)語言模型,它能夠分析邏輯,卻看不到要操作的對象。而通過計(jì)算機(jī)視覺告訴LLM操作對象在哪里,它就可以進(jìn)一步去操作各種對象驅(qū)動(dòng)RPA去創(chuàng)建各種流程。

所以,TARS-RPA-Agent與其他Agent的不同之處在于,目前大多數(shù)AI Agent產(chǎn)品仍是基于語言模型的綜合應(yīng)用,而TARS-RPA-Agent是計(jì)算機(jī)視覺和大模型的結(jié)合。這在全球Agent領(lǐng)域也是不多見的,更是RPA領(lǐng)域的首創(chuàng)。

能夠?qū)崿F(xiàn)這一點(diǎn),更得益于實(shí)在智能很久之前就布局的智能屏幕語義理解技術(shù)。

拓海告訴王吉偉頻道,過去的IPA模式,用戶可能還得根據(jù)AI推薦去找一些需要被操作的對象元素。TARS-RPA-Agent則更進(jìn)一步,不需要去指定元素,只需要告訴模型要操作的目標(biāo)是什么,它刷一下當(dāng)前的屏幕,就能根據(jù)屏幕語義理解意思,直接命中目標(biāo)元素。

如果沒有命中的話,則需要一些人機(jī)協(xié)助填充目標(biāo)。并且在協(xié)助過程中,TARS-RPA-Agent能夠記住這些元素及操作,逐步優(yōu)化語義理解,讓流程及組件復(fù)用性更高。

此外,TARS-RPA-Agent還實(shí)現(xiàn)了語音流程創(chuàng)建的體驗(yàn)大提升。

通過對話機(jī)器人+RPA進(jìn)行語音對話式RPA流程創(chuàng)建,已經(jīng)是比較常見的解決方案。現(xiàn)在市面上不乏接入天貓精靈、小度等語音機(jī)器人調(diào)用RPA的產(chǎn)品。但這種應(yīng)用需要建立在已經(jīng)創(chuàng)建好的流程基礎(chǔ)之上,需要先以人工方式創(chuàng)建好流程,才能實(shí)現(xiàn)以對話機(jī)器人調(diào)用流程。

TARS-RPA-Agent的不同之處在于,用戶只需要對機(jī)器人說出需求,機(jī)器人即可完成即時(shí)的流程搭建和執(zhí)行,而不再需要提前創(chuàng)建流程,真正實(shí)現(xiàn)即時(shí)場景的“你說機(jī)器人做”。

整體演示下來,給王吉偉頻道的感覺是,結(jié)合AI Agent及屏幕語義理解技術(shù)的ChatRPA,真的實(shí)現(xiàn)了像生成文本一樣生成流程,使用體驗(yàn)得到倍數(shù)級提升。尤其是通過語音即時(shí)創(chuàng)建與執(zhí)行流程,已經(jīng)初步有了《鋼鐵俠》中托尼使用AI助理塔維斯即時(shí)執(zhí)行任務(wù)的感覺。

“邊探索邊創(chuàng)建”流程生成方式

ChatRPA能夠?qū)崿F(xiàn)流暢的對話生成自動(dòng)化流程,也體現(xiàn)了實(shí)在智能對于產(chǎn)品的幾點(diǎn)思考:

首先,入口要好找,方便進(jìn)入,可根據(jù)場景需要可隨時(shí)喚起;

其次,使用要靈活,不僅能將一個(gè)任務(wù)完整的自動(dòng)化流程規(guī)劃生成出來,還能應(yīng)對復(fù)雜特殊的場景,能夠生成代碼組件,也能保持和發(fā)揮大模型的特色,具有廣闊知識的查詢和建議生成能力。

再者,所生成的流程要能夠工業(yè)化應(yīng)用,就需要容忍模型的不完整,必須支持人機(jī)協(xié)同,也就是可對流程進(jìn)行修改、增加、刪除,當(dāng)然最基本的要求,可直接運(yùn)行。

正是這些思考,使得實(shí)在智能沒有走“全流程一次生成”的路子,而是采取了一種“邊探索邊創(chuàng)建”的遞進(jìn)式流程生成方式。

要知道,流程中的各種元素是時(shí)刻在變的,所以流程創(chuàng)建也應(yīng)該以一種更靈活的方式實(shí)現(xiàn)中途修改,需要每一步都結(jié)合用戶的意圖去探索性的操作,不然就會(huì)出現(xiàn)一次生成完整流程而不能使用或者經(jīng)過大量修改才能使用的情況。

在這個(gè)基礎(chǔ)上,TARS-RPA-Agent不但實(shí)現(xiàn)了單步尋優(yōu),還做到了把每一步的執(zhí)行過程和結(jié)果都展示和反饋出來。

事實(shí)證明,只有“邊探索邊創(chuàng)建”的模式,才能讓RPA真正融合LLM并發(fā)揮真正的作用。

而為了開發(fā)一款真正意義上的RPA/超自動(dòng)化Agent,實(shí)在智能至少克服了包括打造“邊探索邊創(chuàng)建”模式在內(nèi)的四重挑戰(zhàn)。

“你說,TArs做”背后的四重挑戰(zhàn)

這次發(fā)布會(huì)的主題是:RPA新境界—你說TArs做。

這個(gè)主題,也映射了實(shí)在智能在TARS-RPA-Agent的終極目標(biāo)是“你說,PC做”,要真正實(shí)現(xiàn)包括流程創(chuàng)建等各種業(yè)務(wù)處理的“所說及所得”。

我們已經(jīng)知道,TARS大模型在語義理解、內(nèi)容生成、多輪問答、信息抽取等方面具有獨(dú)特優(yōu)勢和強(qiáng)大能力。要實(shí)現(xiàn)這個(gè)目標(biāo),是不是把TARS的能力接入到RPA中就夠了?是不是大模型就能直接為生成流程、完成工作?

經(jīng)過一系列論證與測試,在實(shí)在智能看來,想要實(shí)現(xiàn)“你說,TArs做”這個(gè)目標(biāo),并不是簡單結(jié)合就可以的。

想要讓TARS聽得懂人話并完得成各種任務(wù),至少面臨四重挑戰(zhàn):

挑戰(zhàn)一:不能自主拆解任務(wù)。實(shí)際場景中的復(fù)雜指令往往蘊(yùn)含在簡潔的語句當(dāng)中,想要TARS-RPA-Agent既能接任務(wù)又能做任務(wù),無法依靠大模型生成一段Python代碼或簡單調(diào)用幾個(gè)RPA組件就能實(shí)現(xiàn),而是需要它理解指令并拆解成可執(zhí)行的子任務(wù)和步驟。

挑戰(zhàn)二:無法感知當(dāng)前環(huán)境。TARS-RPA-Agent必須對周邊的環(huán)境有充分的認(rèn)知、理解和交互,知道它是誰以及它在哪。

在RPA領(lǐng)域中,TARS-RPA-Agent所處的周邊環(huán)境也就是運(yùn)行流程的那臺電腦,以及所要操作的各種網(wǎng)頁、軟件和電腦屏幕等。單純依靠一個(gè)大語言模型做不到這一點(diǎn),它需要超越語言大模型技能之外的、真正人類視角的操作對象理解能力。

挑戰(zhàn)三:不能邊執(zhí)行邊反饋。任務(wù)執(zhí)行應(yīng)該隨地關(guān)注任務(wù)的進(jìn)度如何,有無風(fēng)險(xiǎn),并通過不斷的“執(zhí)行-反饋-修正”來確保任務(wù)正常運(yùn)行。

TARS-RPA-Agent面臨同樣問題,一次性生成但無法成功執(zhí)行的整段流程是沒有意義的,它需要保證每一步操作的正確性,不會(huì)因?yàn)轭I(lǐng)會(huì)錯(cuò)了意圖,或者前一步操作失誤,而導(dǎo)致當(dāng)前步驟點(diǎn)錯(cuò)按鈕、輸錯(cuò)賬號或者發(fā)錯(cuò)郵件。

挑戰(zhàn)四:無法記憶歷史經(jīng)驗(yàn)。大語言模型一直存在一個(gè)很大的問題是缺乏長時(shí)記憶,TARS-RPA-Agent需要學(xué)習(xí)歷史經(jīng)驗(yàn),并通過歷史案例不斷提升決策能力。但如果不能長時(shí)記憶,顯然就無法勝任與學(xué)習(xí)各種能力,因此它需要超出一般大模型的自主迭代能力。

針對上述四重挑戰(zhàn),實(shí)在智能采取了不同的技術(shù)、設(shè)計(jì)和方法來應(yīng)對,最終將TARS-RPA-Agent打造成為一個(gè)有大腦眼睛和手腳的能夠自主拆解任務(wù)、感知當(dāng)前環(huán)境、執(zhí)行并且反饋和記憶歷史經(jīng)驗(yàn)的IPA全新模式和超自動(dòng)化智能體。

有了對AI Agent類RPA產(chǎn)品的深度認(rèn)知、全新理解,基于“ISSUT智能屏幕語義理解+TARS垂類大模型”架構(gòu)的ARS-RPA-Agent模式ChatRPA,也具備了“三智三可”的特色優(yōu)勢。

“三智”即智能理解、智能分析和智能生成:

■ 智能理解:能智能理解對話內(nèi)容,理解所描述的任務(wù)、指令;

■ 智能分析:能分析并拆解任務(wù),規(guī)劃任務(wù)過程和動(dòng)作;

■ 智能生成:能映射成自動(dòng)化組件,智能填充好屬性、對象等。

“三可”為可以執(zhí)行、可以解釋及可以修改:

■ 可以執(zhí)行:不只是生成過程規(guī)劃,而是可執(zhí)行的自動(dòng)化流程;

■ 可以解釋:不僅是任務(wù)拆解過程說明,還可查看每個(gè)動(dòng)作參屬性數(shù);

■ 可以修改:不僅可執(zhí)行,還可隨意插入、修改和刪除的動(dòng)作。

“三智三可”體現(xiàn)了實(shí)在智能ChatRPA“真實(shí)實(shí)用”的宗旨,也讓其產(chǎn)品真正實(shí)現(xiàn)了“像生成文本一樣生成流程”的超易用性體驗(yàn)。

后記:TARS-RPA-Agent的未來

TARS-RPA-Agent能夠在哪些領(lǐng)域獲得長足的發(fā)展,一定程度上取決于TARS大模型在哪些領(lǐng)域有更強(qiáng)的能力。目前TARS-Finance-7B在金融領(lǐng)域的能力是有目共睹的,在多個(gè)大模型評測中的綜合評分都遠(yuǎn)超行業(yè)平均分?jǐn)?shù)。

對于為何要優(yōu)先選擇金融領(lǐng)域,阿寶告訴王吉偉頻道,首先在于金融領(lǐng)域的公開數(shù)據(jù)、權(quán)威數(shù)據(jù)比較多且相對規(guī)范,其次在于金融是RPA市場份額增長比較快的領(lǐng)域。

除了金融領(lǐng)域,實(shí)在智能也正在訓(xùn)練和微調(diào)塔斯大模型在其他領(lǐng)域的能力。并且實(shí)現(xiàn)起來也比較簡單,只要把諸如法律、人力資源等領(lǐng)域的語料加入并進(jìn)行持續(xù)訓(xùn)練和微調(diào),就能打造面向這兩個(gè)領(lǐng)域垂直行業(yè)模型。

TARS-RPA-Agent之所以備受矚目,在于它是業(yè)界首個(gè)大語言模型與計(jì)算機(jī)視覺有機(jī)結(jié)合的Agent,這是國內(nèi)廠商在AI Agent領(lǐng)域初步嘗試的成果,為超自動(dòng)化廠商以及To B領(lǐng)域產(chǎn)品的未來發(fā)展提供了一個(gè)方向,對RPA行業(yè)的發(fā)展具有里程碑的意義,也必將成為大語言模型落地的典型AI智能體案例。

在TARS大模型+ISSUT的后續(xù)發(fā)展上,實(shí)在智能早已制定計(jì)劃。

首先,會(huì)在充分評估和修正(模型性能、安全性等方面)后,對的TARS-Finance-7B模型進(jìn)行開源,以促進(jìn)生成式大模型方向的學(xué)術(shù)研究和應(yīng)用發(fā)展;

其次,會(huì)繼續(xù)擴(kuò)大TARS垂直大模型的參數(shù)規(guī)模,讓更多模型能力在更大的參數(shù)尺度上涌現(xiàn),目前一個(gè)70B的行業(yè)大模型已經(jīng)在訓(xùn)練和優(yōu)化當(dāng)中;

第三,面向RPA領(lǐng)域的全新TARS-RPA-Agent功能則將在未來2個(gè)月內(nèi)隨著功能、性能等測試的進(jìn)一步完善,隨著新版本的發(fā)布而開放試用。

可以預(yù)見,有了這些發(fā)展計(jì)劃,TARS+X的全新模型及全新產(chǎn)品將會(huì)有更多可能。

除此之外,TARS-RPA-Agent的組件自動(dòng)生成,也有更大的想象空間。

對話式RPA的易用性前所未有,任何人都能通過簡單對話就能實(shí)現(xiàn)業(yè)務(wù)流程創(chuàng)建。

用戶只需通過簡單的自然語言指令,便能在自動(dòng)化或者人機(jī)協(xié)作構(gòu)建業(yè)務(wù)流程的過程中生成可復(fù)用的業(yè)務(wù)流程組件。

這意味著,普通用戶在使用ChatRPA的同時(shí)也將成為組件開發(fā)者,大量組件都將伴隨著他們的流程創(chuàng)建而生成,而不再依靠各領(lǐng)域的專業(yè)開發(fā)者去做組件開發(fā),由此組件的開發(fā)速度和量級將會(huì)產(chǎn)生翻天覆地的變化。

未來這些業(yè)務(wù)流程和組件還可以上傳到應(yīng)用市場,所適配的應(yīng)用場景也會(huì)越來越豐富。隨著更多組件被置入公共組件庫,對話式生成流程的精準(zhǔn)度、適配度以及用戶體驗(yàn)也會(huì)越來越好。

這種流程及組件生成的UGC模式,將會(huì)真正改變流程構(gòu)建自動(dòng)化以及超自動(dòng)化行業(yè)的未來。

從TARS-RPA-Agent來看,TARS+ISSUT這樣的技術(shù)組合,大語言模型加上智能屏幕語義理解,大概率能夠讓RPA行業(yè)喊了多年的“RPA人人可用”愿景成為現(xiàn)實(shí),也使得“人人擁有一個(gè)智能助理”進(jìn)一步成為可能。

阿寶透露,TARS大模型的名字來源于科幻電影《星際穿越》中的TARS 。

影片中的TARS是男主身邊的智能助理機(jī)器人,精通各個(gè)領(lǐng)域的知識,能夠自動(dòng)處理各項(xiàng)事務(wù),并多次在關(guān)鍵時(shí)刻幫男主化險(xiǎn)為夷。

在未來計(jì)劃中,實(shí)在智能將會(huì)持續(xù)推出更多的TARS+X的模型及產(chǎn)品。

相信假以時(shí)日,在更多的廠商的努力之下,電影中的“你說TARS做”應(yīng)用場景也將在現(xiàn)實(shí)中無處不在。

全文完

【王吉偉頻道,關(guān)注AIGC與IoT,專注數(shù)字化轉(zhuǎn)型、業(yè)務(wù)流程自動(dòng)化與RPA,歡迎關(guān)注與交流?!?/span>

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多