2023年初,火遍全球的ChatGPT揭開AIGC元年大幕,國內(nèi)外各家科技公司紛紛發(fā)布大模型,一時(shí)間“百模大戰(zhàn)”風(fēng)起云涌。6月下旬,AI行業(yè)準(zhǔn)獨(dú)角獸實(shí)在智能(Intelligence Indeed)開啟自研垂直大語言模型“塔斯(TARS)”內(nèi)測。
在此之前,早在2022年12月,實(shí)在智能曾首創(chuàng)基于計(jì)算機(jī)視覺大模型的“智能屏幕語義理解”技術(shù)(ISSUT),并發(fā)布“實(shí)在IPA”模式,將RPA從傳統(tǒng)“拖拉拽”的專家模式進(jìn)階到輕松“點(diǎn)選用”的小白模式,實(shí)現(xiàn)RPA的人人可用。
時(shí)針再撥到2023年下半年,“大模型如何在真實(shí)商業(yè)場景快速、有效落地”成為科技屆與產(chǎn)業(yè)界最關(guān)注的首要問題。8月16日,實(shí)在智能召開第七次新品發(fā)布會(huì),對這個(gè)問題交出實(shí)實(shí)在在的答卷。
【資料圖】
會(huì)上,實(shí)在智能正式發(fā)布“塔斯(TARS)”大模型,并震撼推出行業(yè)首個(gè)基于大模型的TARS-RPA-Agent產(chǎn)品,將數(shù)字員工應(yīng)用門檻進(jìn)一步大幅降低,實(shí)現(xiàn)“所說即所得,你說,PC做!”
下面,小編帶您一同進(jìn)入TARS的世界,回顧干貨滿滿、精彩紛呈的科技盛宴:
大模型開啟RPA新境界:對話式生成數(shù)字員工,自主完成工作
實(shí)在智能創(chuàng)始人兼CEO孫林君(阿寶)在開場致辭中提到,在大模型時(shí)代,數(shù)字員工的終極形態(tài)已變得越來越清晰——“大模型與RPA緊密結(jié)合,大幅降低使用門檻,突破接口能力邊界。數(shù)字員工將具備自主完成任務(wù)的能力,成為每個(gè)人的智能數(shù)字助理,讓工作生活更輕松”。本次發(fā)布會(huì)推出的“TARS-RPA-Agent”是業(yè)界首款計(jì)算機(jī)視覺與大語言模型結(jié)合的智能體產(chǎn)品,相信會(huì)對RPA行業(yè)的發(fā)展具有里程碑的意義。
他同時(shí)回顧了五年來的技術(shù)迭代和產(chǎn)品創(chuàng)新,“實(shí)在智能已擁有50余項(xiàng)發(fā)明專利,300余項(xiàng)知識(shí)產(chǎn)權(quán),這是我們踏踏實(shí)實(shí)做好技術(shù)、做好產(chǎn)品的力證”,作為一家平臺(tái)型的科技公司,實(shí)在智能致力于不斷迭代產(chǎn)品技術(shù),通過標(biāo)準(zhǔn)化產(chǎn)品和解決方案為千行百業(yè)客戶和生態(tài)合作伙伴賦能,同時(shí)構(gòu)建客戶最優(yōu)感知的交付和服務(wù)體系。
實(shí)在智能全新技術(shù)底:TARS大模型
內(nèi)測開啟45天之后,實(shí)在智能合伙人、核心算法部負(fù)責(zé)人歐陽小剛(新一)與算法專家汪東瑤(奎托斯)共同揭開了“塔斯(TARS)”大模型的神秘面紗。
在AIGC時(shí)代到來之際,實(shí)在智能通過“TARS大語言模型(通用基礎(chǔ)模型、各個(gè)垂直行業(yè)模型)+ISSUT(智能屏幕語義理解)機(jī)器視覺大模型”重構(gòu)了技術(shù)底座,并在這二者之上,對超自動(dòng)化產(chǎn)品矩陣升級改造,持續(xù)發(fā)布創(chuàng)新應(yīng)用。
發(fā)布會(huì)上,TARS大模型展現(xiàn)了優(yōu)異的文本生成、語言理解、知識(shí)問答、邏輯推理等主流能力:
其中,與湘財(cái)證券共建的“自研、有效、安全、可信任、可落地”的財(cái)經(jīng)行業(yè)大模型TARS-Finance-7B,既保留了生成類大模型的通用技能,更在金融財(cái)經(jīng)領(lǐng)域得到了顯著的加強(qiáng)和提升,在多個(gè)中英文的通用基準(zhǔn)測評集和財(cái)經(jīng)領(lǐng)域基準(zhǔn)測評集上均取得良好成績:
在財(cái)經(jīng)領(lǐng)域,與同為60-70億參數(shù)的Baseline模型相比,TARS-Finance-7B模型平均任務(wù)得分領(lǐng)先1%~20%;
在通用領(lǐng)域,TARS-Finance-7B相較基座模型和其他同尺寸Baseline模型,旗鼓相當(dāng)并在部分領(lǐng)域領(lǐng)先。
優(yōu)異測評成績的背后,是歷時(shí)4個(gè)月實(shí)實(shí)在在的工作:
基于充分細(xì)致的語料收集和清洗、數(shù)據(jù)處理及標(biāo)注,超千億Tokens的預(yù)訓(xùn)練語料和超百萬條指令微調(diào)數(shù)據(jù),實(shí)在智能獨(dú)立完整復(fù)現(xiàn)大模型構(gòu)建的預(yù)訓(xùn)練、指令微調(diào)和人類反饋強(qiáng)化學(xué)習(xí)(RLHF)三階段,使大模型具備完整能力
自主研發(fā)用于中文不當(dāng)言論判別和生成終止的Detoxify系統(tǒng),提升模型的安全性和無害性,讓大模型“既懂事,又懂法”
輕便落地的大模型,才是更好的大模型。“成本可控、效果可用、定制化訓(xùn)練、私有化部署”是TARS大模型在真實(shí)場景商用落地的關(guān)鍵特性。
在解決大模型的輕便性和易用性方面,實(shí)在智能也做了很多創(chuàng)新,如通過模型量化降低推理階段的硬件資源消耗、通過推理加速工具和技術(shù)優(yōu)化問答交互產(chǎn)品體驗(yàn)等。此外,TARS大模型支持無縫對接實(shí)在Chatbot產(chǎn)品,可以將大模型的能力通過“?鍵配置”便捷投放到網(wǎng)頁、App、小程序等各個(gè)終端,同時(shí)支持私有化部署,模型更可控、數(shù)據(jù)更安全!
讓大模型“看得見 動(dòng)起來”:行業(yè)首發(fā)TARS-RPA-Agent
實(shí)在智能進(jìn)入超自動(dòng)化賽道以來,不斷將AI技術(shù)與RPA產(chǎn)品進(jìn)行深度融合,持續(xù)推動(dòng)創(chuàng)新應(yīng)用。曾在業(yè)內(nèi)首創(chuàng)“融合拾取”技術(shù),支持頂層拾取與CV拾取無縫融合,使得傳統(tǒng)RPA“拖拉拽”專家模式穩(wěn)定絲滑;進(jìn)而首創(chuàng)“智能屏幕語義理解”技術(shù)(ISSUT),支持對電腦、手機(jī)、平板等屏幕的理解,通過實(shí)在IPA開創(chuàng)“點(diǎn)選用”的小白模式。
大模型時(shí)代開啟后,實(shí)在智能一直在思考如何將大模型與RPA產(chǎn)品相結(jié)合,通過文本指令或?qū)υ捔奶斓姆绞街苯由蓴?shù)字員工,操作PC電腦自主完成工作任務(wù)。從而在實(shí)在IPA“小白模式”基礎(chǔ)上,將RPA使用門檻再進(jìn)一步降低,直接進(jìn)入到“所說即所得,你說,PC做”的“傻瓜模式”。
經(jīng)過不斷探索和嘗試,實(shí)在智能在業(yè)界首發(fā)基于大模型的Agent產(chǎn)品,即TARS-RPA-Agent——這是一個(gè)基于“TARS+ISSUT”雙模引擎,有“大腦”,更有“眼睛和手腳”的超自動(dòng)化智能體。同時(shí),也是能夠自主拆解任務(wù)、感知當(dāng)前環(huán)境、執(zhí)行并且反饋、記憶歷史經(jīng)驗(yàn)的RPA全新模式。
發(fā)布會(huì)上,歐陽小剛(新一)詳細(xì)介紹了TARS-RPA-Agent在設(shè)計(jì)過程中的解決的關(guān)鍵問題和創(chuàng)新特性:
①自主拆解任務(wù):復(fù)雜問題,分而治之
在實(shí)際場景中,人類的復(fù)雜指令往往蘊(yùn)含在非常簡潔的語句當(dāng)中,并不是通過大模型生成一段Python代碼,或簡單調(diào)用3-5個(gè)RPA組件就能實(shí)現(xiàn)。
TARS-RPA-Agent支持將表述簡單但含義復(fù)雜的指令,進(jìn)行Chain-Of-Thought式的自主拆解和細(xì)化,之后將拆解出的子任務(wù)和具體步驟與實(shí)在RPA的流程塊和組件進(jìn)行映射,最終完成一體化、高可控的復(fù)雜流程生成。
例如,“我要買一臺(tái)筆記本電腦,幫我推薦下”,TARS-RPA-Agent可將其拆解成“登錄購物網(wǎng)站,查詢筆記本電腦品牌、配置、價(jià)格等信息,完成產(chǎn)品推薦”等多個(gè)步驟并加以自動(dòng)實(shí)現(xiàn)。
②感知當(dāng)前環(huán)境:人類視角,理解屏幕
“如何在理解指令含義的基礎(chǔ)上,精準(zhǔn)找到所要操作的屏幕畫面上哪里是輸入框、登錄按鈕或者聊天窗口?如果不僅僅是基于瀏覽器的軟件而是成千上萬種不同CS架構(gòu)的客戶端軟件怎么辦……”
“你是我的眼”,基于計(jì)算機(jī)視覺大模型的“智能屏幕語義理解”技術(shù)(ISSUT)為TARS-RPA-Agent裝上了感知世界的眼睛,帶來真正基于人類視覺的電腦屏幕和操作對象理解。
ISSUT使得TARS-RPA-Agent可以“秒懂”屏幕畫面,第一時(shí)間完成自動(dòng)解析,無需人工介入?yún)⑴c。在無法解析網(wǎng)頁源代碼或者客戶端軟件不開放API接口的大量真實(shí)場景中,ISSUT的價(jià)值倍加凸顯。
例如,理解指令并自動(dòng)操作并不開放API接口的企業(yè)微信:
③執(zhí)行并且反饋:環(huán)環(huán)相扣,單步尋優(yōu)
PDCA(計(jì)劃、執(zhí)行、檢查、處理)是人類優(yōu)秀的工作習(xí)慣,在執(zhí)行過程中不斷反饋和修正是客觀世界的一般規(guī)律。真實(shí)場景的意圖理解和任務(wù)執(zhí)行非常復(fù)雜,TARS-RPA-Agent同樣需要保證每一步操作的正確性,避免因?yàn)槔斫馄睿蛘卟僮魇д`,導(dǎo)致最終無法完成任務(wù)。
因此,TARS-RPA-Agent巧妙地設(shè)計(jì)了“基于強(qiáng)化學(xué)習(xí)的單步尋優(yōu)策略和每步執(zhí)行的反饋”相關(guān)機(jī)制,不斷提高決策和執(zhí)行過程的正確性、可控性。
例如,基于之前動(dòng)作的啟發(fā)式尋優(yōu):
④記憶歷史經(jīng)驗(yàn):擴(kuò)展檢索、長時(shí)記憶
“圣斗士不會(huì)被同樣的招數(shù)打敗兩次”,作為一個(gè)智能體,TARS-RPA-Agent也需要提升自主學(xué)習(xí)和迭代能力,從而能夠?qū)W習(xí)歷史經(jīng)驗(yàn),并通過歷史案例不斷提升下次遇到類似任務(wù)時(shí)的自主決策能力,持續(xù)提升人機(jī)協(xié)同效率。
大模型的上下文保留和決策優(yōu)化等長時(shí)記憶能力,通常通過內(nèi)存管理等手段實(shí)現(xiàn)。TARS-RPA-Agent也結(jié)合上下文擴(kuò)展、向量檢索等技術(shù),配備了長時(shí)記憶能力,支持將過往任務(wù)的執(zhí)行情況、用戶修正、執(zhí)行結(jié)果等保存到數(shù)據(jù)庫,并作為后續(xù)分析和優(yōu)化的基礎(chǔ)。
“TARS+”開啟無限可能
發(fā)布會(huì)上,實(shí)在智能合伙人、產(chǎn)品創(chuàng)新部負(fù)責(zé)人周春照(索隆),實(shí)在智能合伙人、創(chuàng)新研發(fā)中心負(fù)責(zé)人趙明(鳴人),以及產(chǎn)品專家張譯顥(拓海)、張鑫燕(虞姬)等,分別接連上新體驗(yàn)感拉滿、智能感十足的TARS大模型與超自動(dòng)化產(chǎn)品矩陣的深度融合產(chǎn)品,以及全面支持國產(chǎn)信創(chuàng)的IPA數(shù)字員工。
TARS+RPA=ChatRPA
TARS+IDP=ChatIDP
TARS+Platform=ChatPlatform
TARS+國產(chǎn)信創(chuàng)IPA數(shù)字員工
實(shí)在智能始終秉持“AI賦能商業(yè)”初心,堅(jiān)定相信人機(jī)協(xié)同及超自動(dòng)化時(shí)代的美好未來,在過往三年里連續(xù)舉辦新品發(fā)布會(huì),不斷帶快行業(yè)創(chuàng)新節(jié)奏:
2022.12.7 “蝶變·新番”,無需拖拉拽、只需點(diǎn)選用的實(shí)在IPA模式讓RPA真正人人可用
2022.3.31 “AI你所愛,新益求新”,一直創(chuàng)新,永遠(yuǎn)AI
2021.10.18 創(chuàng)新領(lǐng)先的融合拾取技術(shù)帶來“拾全拾美·無邊無界”
2021.5.25 “新·動(dòng)·智·燃”,實(shí)實(shí)在在的創(chuàng)新突破
2021.1.8 快速迭代進(jìn)化的實(shí)在RPA讓“重復(fù)的歸我,創(chuàng)造的歸你”
2020.7.15 實(shí)在的第一聲問候:“智驅(qū)未來丨Hello,數(shù)字員工”!
本次發(fā)布會(huì),TARS+ISSUT大模型雙底座為超自動(dòng)化帶來嶄新視野,TARS-RPA-Agent開創(chuàng)人機(jī)協(xié)同“你說,PC做!”的更高境界。
后續(xù),在對模型性能、安全性等方面進(jìn)行充分評估和修正后,實(shí)在智能將對社區(qū)開源TARS-Finance-7B財(cái)經(jīng)大模型,以促進(jìn)生成式大模型方向的學(xué)術(shù)研究和應(yīng)用發(fā)展。也將繼續(xù)擴(kuò)大TARS垂直大模型的參數(shù)規(guī)模,迎接更多的能力涌現(xiàn)。
實(shí)在智能將繼續(xù)與國內(nèi)外學(xué)界、產(chǎn)業(yè)界同仁一起努力,奔向擁有無限可能的彼岸。
按照慣例,我們不說再見,下一次實(shí)在智能產(chǎn)品發(fā)布會(huì),與您在更高峰相見!
責(zé)任編輯:Rex_18