ChatGPT大火之后,AI Agent拉開超自動化智能體時代帷幕
近日,實在智能2023 “實力派數智先鋒訪談節”正式開播,即刻吸引近萬位實在朋友在線觀看。第一期,AI屆的三位“老朋友”聯袂同臺。
實在智能創始人、CEO孫林君、王吉偉頻道創始人、AIGC&超自動化分析師王吉偉以及今年火爆全球的新朋友大模型。
一場關于AI話題的”鏘鏘三人行”,他們帶來了“大模型行業洞察”、“AI Agent最新動態解析”、“大模型+的行業應用探討”等話題,涵蓋了AI大模型前沿內容和國內最新實踐經驗,給觀眾們帶來獨特的啟發。
一、一場關于:“大模型+行業”、“AI Agent”的“鏘鏘三人行”
作為實在智能的重要伙伴,王吉偉一直關注著行業數字化轉型發展,其欄目“王吉偉頻道”也在不斷為讀者普及最新數字化技術,助力大家了解數字化技術并應用起來,實現提質增效。
實在智能是國內AI準獨角獸企業,率先在業界首發了產品級AI Agent,TARS-RPA-Agent,將其打造成為一個有大腦眼睛和手腳的能夠自主拆解任務、感知當前環境、執行并且反饋和記憶歷史經驗的IPA全新模式和超自動化智能體。
從王吉偉的角度來看,實在智能是時刻走在技術前沿陣地的人工智能公司。過往的交流中可以看到實在智能具有很強的研發能力,總能在這個前沿科技流行的時代下,如在去年推出RPA的進階版IPA模式的RPA,今年又率先推出了這個塔斯大模型和基于塔斯的TARS-RPA-Agent,就能在很短時間內就能推出相應的產品服務。
大模型全稱大規模語言模型(Large Language Model,LLM),“大”在“大語言模型”是指模型的參數量非常大,可以讓這些模型能夠捕捉到他們所訓練的數據中更復雜的模式,從而使他們能夠生成更準確的。
模型在大規模數據集上完成了預訓練后無需或僅需要少量數據的微調,就能直接支撐各類應用,AIGC時代到來,只要愿意體驗,我們都能感受到大語言模型的強大之處(自動生成圖片、內容、視頻等),目前,國內百度、阿里、騰訊、華為、實在智能等公司擁有AI大模型,這也讓企業和個人都有機會加入到商業化的賽道中去。
二、企業和個人怎么用大模型實現價值最大化?
孫林君總結了八個字——“模型可用,成本可控。”
隨著大眾對ChatGPT的深入了解,大模型成為了關注和研究的焦點,AI Agent(人工智能助理)被公認為大語言模型落地的有效方式之一。
它是一種能夠感知環境、進行決策和執行動作的智能實體,通常基于機器學習和人工智能技術,具備自主性和自適應性,在特定任務或領域中能夠自主地進行學習和改進。
簡單來說,AI Agent基于LLM驅動Agent,實現對通用問題的自動化處理,具備獨立的思考和認知功能、擁有記憶,能進行思考、邏輯推斷和自我反思,可以閱讀和在線學習,擅長利用適當的工具處理問題,還能策劃并根據實際情況調整任務的優先級,為LLM提供了行動能力,真正釋放了LLM的潛能,為TO B和TO C企業帶來巨大變革。
但AI智能體的落地并非易事。大模型怎么能夠把這個任務拆解的非常合理?怎么能夠在拆解任務過程中控制拆解質量?推理能力是否夠用等等……這些都是要考慮和解決的問題。
反過來看,大模型并不是一個產品,而是產品里的一部分,更多時候并不是直接以一個產品的模式生成內容,這需要我們的產品級工具去精確完成任務,這就是挑戰所在。
在執行任務時,人類會隨時關注進度,并通過不斷的「執行-反饋-修正」來確保任務的正常進行。
對于Agent來說,同樣需要保證每一步操作的正確性,不會因為領會錯了意圖,或者前一步操作失誤,而導致當前步驟點錯按鈕、輸錯賬號或者發錯郵件。
實在智能把TARS大模型作為技術底座,結合產品能力做進一步的升級,打造TARS-RPA-Agent、ChatIDP等產品級的工具,真正為用戶解決問題。而實在的塔斯大語言模型是垂直類大模型,其通用能力是具備的,同時還具備足夠強的泛化能力。而垂直大語言模型可以確保在特定領域上做的精度更高。而對于企業而言,用相對比較小的這個部署成本可以成功完成大語言模型的TOB端的部署,就可以發揮相對比較大的價值。故而要實現大模型價值的最大化,實在總結出的最優操作就是確保“模型可用,成本可控”。
與RPA結合后,Agent就是一個“AI助理”,用戶不需要部署就能方便使用。在搭建RPA流程的時候,通過你說的任務指令,該智能體就能反饋流程創建的執行計劃,還可以通過多輪對話修改,以創建更復雜的流程,幫助用戶一點點探索流程生成。最后“AI助理”就會進入IPA模式按計劃的詳情步驟開始執行,實現“你說,PC做”,大幅提升工作效率。
IDP文檔審閱也是同樣的道理。有了大模型加持后,Chat-IDP就能自己讀懂文檔內容,文字工作者能從長篇累贅的案牘中解放出來,用對話的方式審閱文檔,沉浸式高效地處理業務問題,這樣一來,無論是從解決問題的效率,還是客戶所付出的成本性價比來看,都是受益的。
在C端,它可以成為我們的智能助理,在我們的流程性、事務性、常規性的這個工作當中發揮價值;在B端上,AI Agent是數字員工新階段的具體形態,落地到客戶業務場景當中,能在很多領域都可以發揮作用,輔助員工更高效地完成工作,協助行業專家做一些更深入的思考,人工智能的真正的價值也在Agent上逐步顯現出來。
三、基于大模型的TARS-RPA-Agent數字員工 VS Auto-GPT類AI智能體和直接接入ChatGPT的智能助手
為了搞明白這款產品,王吉偉頻道在實在智能Agent發布會后做了專訪,并率先體驗Agent產品。
王吉偉表示,TARS-RPA-Agent首先是一個產品級別的東西。比方說大模型它來生成流程可能會出錯,這個是不可避免的,因為它畢竟是個生成式模型,有多樣性要求,也是一個概率性質的。
那么當大模型出錯時,Agent產品允不允許人機協同?能不能夠接受打斷?能不能夠多種模式下面都能構建這個流程?這些就是要從產品級別去解決的問題。
第二個不同點在于,應用的技術組合上面會有差別,TARS-RPA-Agent是結合多種AI能力形成的,本質上是因為RPA要操作的對象,就是要把對象識別出來,并且要把參數配置進去,而這個操作還需要結合計算機視覺(CV)來去做,才能更好地處理一些高級任務。
孫林君則回顧到,實在智能RPA的每一次重磅的迭代升級,都體現出對人工智能技術對RPA流程構建的顛覆性變化。
實在IPA模式基于自研AI技術,智能屏幕語義理解技術(ISSUT),將計算機視覺和RPA能力整合到一起,RPA的流程構建方式就從傳統的“拖拉拽”模式,來到了直接“點選用”新體驗,這是一種很大的變革(實在IPA模式的NPS值已超過0.73,傳統模式下的RPA最高做到0.35左右)。
在實在IPA模式下,再結合大語言模型技術,現在我們可以更多通過自然語言,就能讓Agent幫我們拆解任務,完成任務。
所以從這個視角上,實在智能更關注的是流程構建的方式的易用性,將流程構建的難度降低,學習和部署成本變得更低,這個本領只通過集成ChatGPT是做不到的。
當我們的數據飛輪建立起來以后,整個這個產品還會隨著每次迭代會逐步的增強,在流程構建的成本上、用戶使用體驗上會更具優勢。
在這個與AI共舞的時代,大模型的商業化應用日趨成熟,作為職場人的我們何去何從?作為第一期的收尾,王吉偉和孫林君給我們帶來了他們“E型人”觀點:在接受AI的同時,更要懷揣學習能力、應變能力,積極主動性和敬業心態,積極擁抱這個AI時代,多學一些相關技能,學會用AI增強自己學習和接觸與所在崗位業務場景,提升自己的業務能力。要相信,技術永遠都是給人使用的,科技服務于人。
一直以來,實在智能都在思考數字員工的最終形態,期望用最合適的呈現方式和技術手段讓人工智能真正的為人人所用,把人工智能技術踏踏實實落地,打造人手一個智能助理。所以我們不必畏懼AI,人的能力是最重要的,在人和AI的相輔相成共同作用下,人機協同才是我們見證的發展趨勢。