大模型時代下,數(shù)字員工演進全景圖:RPA/IPA/Agent
從蒸汽機到電力,再到計算機,每一次技術(shù)的飛躍都極大地提升了企業(yè)效率。
如今,隨著數(shù)字化轉(zhuǎn)型的浪潮席卷全球,企業(yè)開始尋求新的解決方案來優(yōu)化業(yè)務流程、打破數(shù)據(jù)屏障,達到提效降本的目的。在這一背景下,數(shù)字員工的概念逐漸在企業(yè)界內(nèi)“流行”起來。
根據(jù)RPA市場調(diào)研報告顯示,2022年中國約有85%的企業(yè)與機構(gòu)愿意與彼此互相了解的廠商進行合作,已經(jīng)有43.8%的企業(yè)及機構(gòu)開始了RPA的部分范圍應用,17.9%的企業(yè)及機構(gòu)在進行RPA規(guī)模化探索。其中,銀行、保險、證券、電商與零售、政務等領域是RPA商用實踐主力軍。
從調(diào)研數(shù)據(jù)來看,RPA在企業(yè)中的認知度和接受度都相當高,大多數(shù)企業(yè)有計劃將RPA應用于自身業(yè)務。此外,國家也持續(xù)出臺相關政策加快包括RPA在內(nèi)的新一代信息技術(shù)在各領域的應用,提高各行業(yè)管理效率,促進行業(yè)發(fā)展。

數(shù)字員工之所以能夠快速獲得企業(yè)的認可,一方面離不開企業(yè)對于高效營銷解決方案的切實需求,另一方面則是數(shù)字員工的自動化解決方案,能夠有效幫助企業(yè)解決重復低效工作和降低人力成本,平均應用ROI可達1:6。
在企業(yè)效率大幅提升的背后,與數(shù)字員工的多次技術(shù)迭代密不可分。數(shù)字員工的三個發(fā)展階段分別為:RPA、IPA和Agent,分別代表了自動化技術(shù)的不同發(fā)展水平。RPA作為起點,通過模擬人類用戶執(zhí)行重復性任務來實現(xiàn)流程自動化;IPA則集成AI技術(shù),提升了自動化的智能化水平,使得數(shù)字員工能夠處理更復雜的任務;Agent智能體階段,數(shù)字員工不僅能夠執(zhí)行任務,還能進行自主決策,與人類交互,為企業(yè)帶來更深層次的變革。
接下來,實在智能將詳細分析這三個階段的技術(shù)特點、應用場景以及它們對企業(yè)運營的影響,旨在為企業(yè)提供一幅數(shù)字員工演進的全景圖,幫助其更好地理解這一領域的最新發(fā)展。

RPA技術(shù)的起源和早期發(fā)展可以追溯到20世紀中葉的自動化生產(chǎn)線和工業(yè)機器人,而其作為現(xiàn)代軟件自動化技術(shù)的成熟和廣泛應用則是在21世紀初,特別是2010年以后。

RPA定義與原理
RPA(Robotic Process Automation,)是一種業(yè)務流程自動化技術(shù),它通過軟件機器人來模擬人類用戶執(zhí)行一些重復性高、基于規(guī)則的后臺任務。這些任務通常包括數(shù)據(jù)的提取、錄入、處理,以及文件的移動等。
用戶通過RPA設計器的可視化設計界面,以“拖拉拽”方式構(gòu)建自動化流程。在開發(fā)過程中,用戶需要定義機器人的觸發(fā)條件、任務序列、異常處理和數(shù)據(jù)流轉(zhuǎn)。
這時候RPA的核心在于"模擬"能力,能夠模擬鼠標點擊、鍵盤輸入、數(shù)據(jù)復制和粘貼等人類操作。通過這種方式,RPA軟件機器人能夠無縫地與現(xiàn)有的IT基礎設施和應用程序集成,無需對現(xiàn)有系統(tǒng)進行大規(guī)模改造。
應用場景
企業(yè)應用RPA需要確定哪些業(yè)務流程適合自動化。這通常涉及對現(xiàn)有流程的詳細審查,以識別那些重復性高、規(guī)則明確且耗時的任務;再通過專業(yè)實施團隊進行技術(shù)評估,流程設計以及部署測試;穩(wěn)定后,可能需要對機器人進行維護和更新,以確保它們繼續(xù)高效地運行。
RPA技術(shù)的應用場景幾乎涵蓋了所有需要重復性數(shù)據(jù)輸入和處理的業(yè)務流程,以下是一些典型場景:
- 財務和會計:自動執(zhí)行發(fā)票處理、賬目核對和財務報告生成等任務。
- 人力資源:自動化員工入職流程、薪資計算和福利管理。
- 客戶服務:通過聊天機器人提供7×24h的客戶支持,自動處理常見查詢。
- 供應鏈管理:監(jiān)控庫存水平,自動下單補貨,優(yōu)化物流流程。
- IT運維:自動化系統(tǒng)監(jiān)控、故障排查和常規(guī)維護任務。
局限性
RPA的實施可以顯著提高企業(yè)的運營效率,減少人為錯誤,并釋放員工從事更高價值的工作。但也存在一些局限性:
- 系統(tǒng)脆弱:RPA機器人只能按照預設的規(guī)則執(zhí)行任務,界面微小變化后需要重新配置
- 存在技術(shù)門檻:雖然RPA工具可視化界面對用戶友好,但某些復雜的自動化任務實施仍需要專業(yè)實施
- 非結(jié)構(gòu)化數(shù)據(jù)處理:RPA主要用于處理結(jié)構(gòu)化數(shù)據(jù),對圖片、文檔等非結(jié)構(gòu)化數(shù)據(jù)的處理存在局限
盡管初代的RPA存在局限性,但仍然是企業(yè)實現(xiàn)初步自動化的重要工具。而通過結(jié)合AI技術(shù),RPA的局限性可以得到緩解,例如利用機器學習、自然語言處理等技術(shù)處理非結(jié)構(gòu)化數(shù)據(jù),使RPA更加靈活和強大;通過結(jié)合智能屏幕語義理解技術(shù)降低使用門檻,使非技術(shù)人員也能構(gòu)建自動化流程。

IPA的定義與原理
IPA(Intelligent Process Automation)是一種集成了多種智能技術(shù),用于增強自動化流程的靈活性、適應性和智能化水平的自動化技術(shù)。它不僅能夠執(zhí)行基于規(guī)則的重復性任務,還能處理更復雜的業(yè)務場景,如決策支持、預測分析和認知自動化。
IPA的核心在于“智能”二字。與RPA相比,IPA設計器的人機交互更加智能化。在開發(fā)過程中,除了專業(yè)的“拖拉拽”方式,用戶還可以選擇基于AI技術(shù)的“點選用”方式構(gòu)建自動化流程,想要實現(xiàn)哪個動作的自動化,只需要把鼠標懸停在界面元素上,對應的流程組件就會自動推送到眼前,用戶按照實際動作選取即可。
IPA的“點選用”優(yōu)勢有多方面,其一是那些不精通技術(shù)的業(yè)務人員,可以自行使用IPA實現(xiàn)流程自動化,降低技術(shù)依賴;其二是當界面元素出現(xiàn)微小變化時,業(yè)務人員可以第一時間自行調(diào)整,降低運維成本,增強靈活性和敏捷性。
以上具備“點選用”特性的IPA是實在智能基于自研智能屏幕語義理解技術(shù)(ISSUT)和多年客戶服務經(jīng)驗,于2022年全行業(yè)首發(fā),這也為后面的Agent(RPA第三階段演進)奠定了堅實基礎。
技術(shù)集成
IPA是建立在RPA基礎上為用戶強大和靈活的自動化解決方案,依賴于多種AI技術(shù)的集成:
- 機器學習:ML算法能夠從數(shù)據(jù)中學習并改進流程,使IPA能夠適應新的數(shù)據(jù)模式和變化
- 智能屏幕語義理解技術(shù):這是實在智能的自研技術(shù),使得IPA能夠理解屏幕上的元素和用戶的操作意圖,從而提供更準確的自動化建議
- 業(yè)務感知推薦:結(jié)合場景預測和自然語言處理技術(shù),IPA能夠推薦符合業(yè)務場景的自動化操作
- 頁面結(jié)構(gòu)分析技術(shù):通過分析頁面結(jié)構(gòu),IPA可以理解軟件界面的布局,并適應頁面變化,如拉伸、移動或內(nèi)容位移
應用場景
這些AI技術(shù)的集成,使得IPA不僅僅能夠執(zhí)行簡單的、規(guī)則明確的任務,還能夠處理更復雜的、需要一定智能判斷的任務,極大地擴展了自動化的應用范圍和深度。以下是一些主要的IPA應用場景:
- 發(fā)票處理自動化:IPA可以自動處理來自不同供應商的發(fā)票,識別和提取相關信息,即使是非結(jié)構(gòu)化內(nèi)容和不同格式的發(fā)票也能應對
- 財務分析和報告:IPA能夠快速分析大量財務數(shù)據(jù),并生成準確、全面的財務報告,支持企業(yè)決策
- 審計判斷:在審計工作中,IPA可以幫助審計人員快速準確地完成審計底稿的編制、數(shù)據(jù)比對等任務,并進行智能判斷
- 工資核算:IPA可以自動化工資核算流程,檢查員工數(shù)據(jù)的一致性,管理福利和付款,避免數(shù)據(jù)不準確和延遲
局限性
IPA在企業(yè)應用中具備比RPA更廣泛的適應性和靈活性,但在實施過程中也面臨著一些類似挑戰(zhàn):
- 技術(shù)復雜性:隨著AI技術(shù)的集成,IPA系統(tǒng)的復雜性增加,需要專業(yè)人員進行維護和管理
- 數(shù)據(jù)隱私和安全:IPA處理大量敏感數(shù)據(jù),需要加強數(shù)據(jù)保護和隱私措施
- 成本問題:引入IPA可能需要較高的初期投資,尤其是在采購高級分析工具和培訓員工方面
- 變革抵抗:企業(yè)內(nèi)部對變革的抵抗可能會阻礙IPA的實施和成功
三、Agent階段 - 自主決策的實現(xiàn)
隨著大模型技術(shù)的興起,RPA也迎來第三次形態(tài)改變——Agent模式。大模型通常指的是使用大量數(shù)據(jù)訓練而成的復雜機器學習模型,它們在自然語言處理(NLP)、圖像識別、語音識別等領域展現(xiàn)出強大的性能。
2023年上半年,實在智能自研的垂直大模型TARS(塔斯)在國內(nèi)大模型各類榜單名列前茅,具備“效果可用、成本可控、定制化訓練、私有化部署”等差異化優(yōu)勢。

Agent的定義與原理
Agent可以看作是一種能夠感知環(huán)境、進行決策和執(zhí)行動作的智能實體,本質(zhì)是一種結(jié)合大模型和自動化技術(shù)的AI助理,其自動化的能力主要來源于AI模型推理。同時,Agent具備自主性和自適應性,能在特定任務或領域中能夠自主地進行學習和改進,甚至能夠進行創(chuàng)造性的任務,如內(nèi)容生成或復雜問題的解決。
在實在智能的AI產(chǎn)品矩陣中,實在Agent能夠展現(xiàn)出接近人類專家級別的認知能力,可以很好地理解和解析人類語言,拆分為細小的自動化步驟,通過RPA實現(xiàn)全流程的自動化。簡單地說,用戶通過一句話描述任務,實在Agent就可以自動執(zhí)行。
通過融入大模型技術(shù),Agent能夠提供更加強大和靈活的自動化解決方案,處理更加復雜和多樣化的業(yè)務需求。這不僅推動了RPA技術(shù)的發(fā)展,也為數(shù)字化轉(zhuǎn)型提供了新的動力。
技術(shù)集成
相較于IPA,Agent是在大模型技術(shù)的支持下,成為真正基于自然語言交互的數(shù)字員工或AI助理。以下是Agent模式RPA集成的一些關鍵技術(shù):
- 自然語言處理NLP:NLP技術(shù)增強了RPA的文本處理能力,使其能夠理解和處理人類語言,包括語音和文本
- 大語言模型LLM:LLM技術(shù)使得Agent模式的RPA能夠進行更復雜的語言處理和生成任務
- 深度數(shù)據(jù)分析:Agent模式的RPA可以分析大量數(shù)據(jù),預測未來趨勢和行為,并據(jù)此做出決策
應用場景
通過融合AI技術(shù),尤其是大語言模型(LLM),RPA在多個領域?qū)崿F(xiàn)了廣泛的應用。這種類型的Agent特別適用于人力資源管理、供應鏈優(yōu)化、財務規(guī)劃和風險分析。由于其不斷增加的處理能力和知識,Agent能夠提供及時準確的建議,以支持業(yè)務主管的決策過程。
- 客戶服務:作為虛擬助手,Agent能夠提供個性化的客戶服務和支持
- 金融服務:在風險管理、投資咨詢和個性化金融產(chǎn)品推薦中發(fā)揮作用
- 績效管理:Agent可以跟蹤員工的工作績效,通過數(shù)據(jù)分析提供客觀的績效評估
- 輔助教育:Agent可以根據(jù)學生的學習歷史和表現(xiàn),推薦相關的學習資源、課程和活動
局限性
目前,Agent作為一種新興技術(shù),其發(fā)展前景廣闊,但同時也面臨著技術(shù)、市場和實施等方面的挑戰(zhàn)。隨著技術(shù)的不斷成熟和市場教育的深入,預計這些局限性將逐步得到解決。
- 技術(shù)成熟度:雖然Agent技術(shù)發(fā)展迅速,但仍有許多項目處于概念驗證和demo階段
- 數(shù)據(jù)安全和隱私:隨著越來越多的敏感數(shù)據(jù)通過Agent處理,如何確保數(shù)據(jù)安全和隱私仍是一個挑戰(zhàn)
- 技術(shù)發(fā)展周期:AI和機器學習模型的發(fā)展需要時間,Agent在實現(xiàn)廣泛的商業(yè)應用之前,可能需要經(jīng)歷一個相對較長的技術(shù)成熟周期
實在智能作為Agent領域的先行者,自成立之日起就專注于在AI算法上的持續(xù)投入,在解決數(shù)據(jù)安全方面做了很多創(chuàng)新和努力。比如,實在智能自主研發(fā)用于中文不當言論判別和生成終止的Detoxify系統(tǒng),提升模型的安全性和無害性,讓大模型“既懂事,又懂法”。此外,Agent支持私有化部署,在企業(yè)算力支持條件下,可以做到數(shù)據(jù)不上云,模型更可控、數(shù)據(jù)更安全!
為了更好地理解RPA、IPA和Agent三者之間的關系和差異,實在智能對它們進行了對比分析:
- 技術(shù)復雜性:
- RPA:相對較低,主要依賴于固定規(guī)則和直接的腳本執(zhí)行。
- IPA:較高,需要集成多種AI技術(shù)以實現(xiàn)更高級的自動化。
- Agent:最高,需要復雜的AI和機器學習算法來支持自主決策和學習。
- 自動化范圍:
- RPA:主要適用于標準化、重復性高的流程。
- IPA:適用于需要一定程度智能判斷和適應性的場景。
- Agent:適用于需要高度自主性和復雜決策支持的領域。
- 對人類干預的依賴:
- RPA:在大多數(shù)情況下需要預先定義的規(guī)則和定期的維護。
- IPA:雖然減少了對人類干預的依賴,但在某些復雜決策時可能仍需人類介入。
- Agent:設計為最小化人類干預,能夠獨立執(zhí)行任務和做出決策。
- 成本與效益:
- RPA:初期投資較低,易于實施,但可能需要持續(xù)的維護和更新。
- IPA:初期投資和實施復雜性較高,但長期效益在于其智能化處理能力。
- Agent:需要較大的初期投資和高度的技術(shù)專長,但能提供最大的自主性和靈活性。

整體而言,RPA、IPA和Agent三者并非相互獨立,而是存在一定的演進和依賴關系。RPA作為基礎,為自動化提供了一個起點,其技術(shù)相對成熟且易于實施;IPA作為擴展,在RPA的基礎上,通過集成AI技術(shù),提升了自動化的智能化水平;Agent作為目標,融合大模型技術(shù),代表了自動化技術(shù)的未來方向。
盡管AI Agent在當下備受矚目,但我們?nèi)匀恍枰J識到RPA技術(shù)的獨特優(yōu)勢。比如,RPA的集成過程相對簡單,這通常意味著在成本控制方面具有優(yōu)勢,對于智能化需求不高的自動化場景,RPA依然是首選。此外,在短時間內(nèi),AI Agent還無法用于操作成百上千的企業(yè)管理系統(tǒng)。
所以,Agent技術(shù)作為超自動化的一部分,實在智能會將其與其他AI、iPaaS等集成,形成更加全面的自動化解決方案。同樣,這個過程也面臨著一些可以預知的挑戰(zhàn),如技術(shù)復雜性、倫理和責任以及用戶接受度等,這些挑戰(zhàn)需要實在智能與企業(yè)和整個行業(yè)共同努力解決。
[免責聲明]
原文標題: 大模型時代下,數(shù)字員工演進全景圖:RPA/IPA/Agent
本文由作者原創(chuàng)發(fā)布于36氪企服點評;未經(jīng)許可,禁止轉(zhuǎn)載。



