大模型時代下,數字員工演進全景圖:RPA/IPA/Agent
從蒸汽機到電力,再到計算機,每一次技術的飛躍都極大地提升了企業效率。
如今,隨著數字化轉型的浪潮席卷全球,企業開始尋求新的解決方案來優化業務流程、打破數據屏障,達到提效降本的目的。在這一背景下,數字員工的概念逐漸在企業界內“流行”起來。
根據RPA市場調研報告顯示,2022年中國約有85%的企業與機構愿意與彼此互相了解的廠商進行合作,已經有43.8%的企業及機構開始了RPA的部分范圍應用,17.9%的企業及機構在進行RPA規模化探索。其中,銀行、保險、證券、電商與零售、政務等領域是RPA商用實踐主力軍。
從調研數據來看,RPA在企業中的認知度和接受度都相當高,大多數企業有計劃將RPA應用于自身業務。此外,國家也持續出臺相關政策加快包括RPA在內的新一代信息技術在各領域的應用,提高各行業管理效率,促進行業發展。

數字員工之所以能夠快速獲得企業的認可,一方面離不開企業對于高效營銷解決方案的切實需求,另一方面則是數字員工的自動化解決方案,能夠有效幫助企業解決重復低效工作和降低人力成本,平均應用ROI可達1:6。
在企業效率大幅提升的背后,與數字員工的多次技術迭代密不可分。數字員工的三個發展階段分別為:RPA、IPA和Agent,分別代表了自動化技術的不同發展水平。RPA作為起點,通過模擬人類用戶執行重復性任務來實現流程自動化;IPA則集成AI技術,提升了自動化的智能化水平,使得數字員工能夠處理更復雜的任務;Agent智能體階段,數字員工不僅能夠執行任務,還能進行自主決策,與人類交互,為企業帶來更深層次的變革。
接下來,實在智能將詳細分析這三個階段的技術特點、應用場景以及它們對企業運營的影響,旨在為企業提供一幅數字員工演進的全景圖,幫助其更好地理解這一領域的最新發展。

RPA技術的起源和早期發展可以追溯到20世紀中葉的自動化生產線和工業機器人,而其作為現代軟件自動化技術的成熟和廣泛應用則是在21世紀初,特別是2010年以后。

RPA定義與原理
RPA(Robotic Process Automation,)是一種業務流程自動化技術,它通過軟件機器人來模擬人類用戶執行一些重復性高、基于規則的后臺任務。這些任務通常包括數據的提取、錄入、處理,以及文件的移動等。
用戶通過RPA設計器的可視化設計界面,以“拖拉拽”方式構建自動化流程。在開發過程中,用戶需要定義機器人的觸發條件、任務序列、異常處理和數據流轉。
這時候RPA的核心在于"模擬"能力,能夠模擬鼠標點擊、鍵盤輸入、數據復制和粘貼等人類操作。通過這種方式,RPA軟件機器人能夠無縫地與現有的IT基礎設施和應用程序集成,無需對現有系統進行大規模改造。
應用場景
企業應用RPA需要確定哪些業務流程適合自動化。這通常涉及對現有流程的詳細審查,以識別那些重復性高、規則明確且耗時的任務;再通過專業實施團隊進行技術評估,流程設計以及部署測試;穩定后,可能需要對機器人進行維護和更新,以確保它們繼續高效地運行。
RPA技術的應用場景幾乎涵蓋了所有需要重復性數據輸入和處理的業務流程,以下是一些典型場景:
- 財務和會計:自動執行發票處理、賬目核對和財務報告生成等任務。
- 人力資源:自動化員工入職流程、薪資計算和福利管理。
- 客戶服務:通過聊天機器人提供7×24h的客戶支持,自動處理常見查詢。
- 供應鏈管理:監控庫存水平,自動下單補貨,優化物流流程。
- IT運維:自動化系統監控、故障排查和常規維護任務。
局限性
RPA的實施可以顯著提高企業的運營效率,減少人為錯誤,并釋放員工從事更高價值的工作。但也存在一些局限性:
- 系統脆弱:RPA機器人只能按照預設的規則執行任務,界面微小變化后需要重新配置
- 存在技術門檻:雖然RPA工具可視化界面對用戶友好,但某些復雜的自動化任務實施仍需要專業實施
- 非結構化數據處理:RPA主要用于處理結構化數據,對圖片、文檔等非結構化數據的處理存在局限
盡管初代的RPA存在局限性,但仍然是企業實現初步自動化的重要工具。而通過結合AI技術,RPA的局限性可以得到緩解,例如利用機器學習、自然語言處理等技術處理非結構化數據,使RPA更加靈活和強大;通過結合智能屏幕語義理解技術降低使用門檻,使非技術人員也能構建自動化流程。

IPA的定義與原理
IPA(Intelligent Process Automation)是一種集成了多種智能技術,用于增強自動化流程的靈活性、適應性和智能化水平的自動化技術。它不僅能夠執行基于規則的重復性任務,還能處理更復雜的業務場景,如決策支持、預測分析和認知自動化。
IPA的核心在于“智能”二字。與RPA相比,IPA設計器的人機交互更加智能化。在開發過程中,除了專業的“拖拉拽”方式,用戶還可以選擇基于AI技術的“點選用”方式構建自動化流程,想要實現哪個動作的自動化,只需要把鼠標懸停在界面元素上,對應的流程組件就會自動推送到眼前,用戶按照實際動作選取即可。
IPA的“點選用”優勢有多方面,其一是那些不精通技術的業務人員,可以自行使用IPA實現流程自動化,降低技術依賴;其二是當界面元素出現微小變化時,業務人員可以第一時間自行調整,降低運維成本,增強靈活性和敏捷性。
以上具備“點選用”特性的IPA是實在智能基于自研智能屏幕語義理解技術(ISSUT)和多年客戶服務經驗,于2022年全行業首發,這也為后面的Agent(RPA第三階段演進)奠定了堅實基礎。
技術集成
IPA是建立在RPA基礎上為用戶強大和靈活的自動化解決方案,依賴于多種AI技術的集成:
- 機器學習:ML算法能夠從數據中學習并改進流程,使IPA能夠適應新的數據模式和變化
- 智能屏幕語義理解技術:這是實在智能的自研技術,使得IPA能夠理解屏幕上的元素和用戶的操作意圖,從而提供更準確的自動化建議
- 業務感知推薦:結合場景預測和自然語言處理技術,IPA能夠推薦符合業務場景的自動化操作
- 頁面結構分析技術:通過分析頁面結構,IPA可以理解軟件界面的布局,并適應頁面變化,如拉伸、移動或內容位移
應用場景
這些AI技術的集成,使得IPA不僅僅能夠執行簡單的、規則明確的任務,還能夠處理更復雜的、需要一定智能判斷的任務,極大地擴展了自動化的應用范圍和深度。以下是一些主要的IPA應用場景:
- 發票處理自動化:IPA可以自動處理來自不同供應商的發票,識別和提取相關信息,即使是非結構化內容和不同格式的發票也能應對
- 財務分析和報告:IPA能夠快速分析大量財務數據,并生成準確、全面的財務報告,支持企業決策
- 審計判斷:在審計工作中,IPA可以幫助審計人員快速準確地完成審計底稿的編制、數據比對等任務,并進行智能判斷
- 工資核算:IPA可以自動化工資核算流程,檢查員工數據的一致性,管理福利和付款,避免數據不準確和延遲
局限性
IPA在企業應用中具備比RPA更廣泛的適應性和靈活性,但在實施過程中也面臨著一些類似挑戰:
- 技術復雜性:隨著AI技術的集成,IPA系統的復雜性增加,需要專業人員進行維護和管理
- 數據隱私和安全:IPA處理大量敏感數據,需要加強數據保護和隱私措施
- 成本問題:引入IPA可能需要較高的初期投資,尤其是在采購高級分析工具和培訓員工方面
- 變革抵抗:企業內部對變革的抵抗可能會阻礙IPA的實施和成功
三、Agent階段 - 自主決策的實現
隨著大模型技術的興起,RPA也迎來第三次形態改變——Agent模式。大模型通常指的是使用大量數據訓練而成的復雜機器學習模型,它們在自然語言處理(NLP)、圖像識別、語音識別等領域展現出強大的性能。
2023年上半年,實在智能自研的垂直大模型TARS(塔斯)在國內大模型各類榜單名列前茅,具備“效果可用、成本可控、定制化訓練、私有化部署”等差異化優勢。

Agent的定義與原理
Agent可以看作是一種能夠感知環境、進行決策和執行動作的智能實體,本質是一種結合大模型和自動化技術的AI助理,其自動化的能力主要來源于AI模型推理。同時,Agent具備自主性和自適應性,能在特定任務或領域中能夠自主地進行學習和改進,甚至能夠進行創造性的任務,如內容生成或復雜問題的解決。
在實在智能的AI產品矩陣中,實在Agent能夠展現出接近人類專家級別的認知能力,可以很好地理解和解析人類語言,拆分為細小的自動化步驟,通過RPA實現全流程的自動化。簡單地說,用戶通過一句話描述任務,實在Agent就可以自動執行。
通過融入大模型技術,Agent能夠提供更加強大和靈活的自動化解決方案,處理更加復雜和多樣化的業務需求。這不僅推動了RPA技術的發展,也為數字化轉型提供了新的動力。
技術集成
相較于IPA,Agent是在大模型技術的支持下,成為真正基于自然語言交互的數字員工或AI助理。以下是Agent模式RPA集成的一些關鍵技術:
- 自然語言處理NLP:NLP技術增強了RPA的文本處理能力,使其能夠理解和處理人類語言,包括語音和文本
- 大語言模型LLM:LLM技術使得Agent模式的RPA能夠進行更復雜的語言處理和生成任務
- 深度數據分析:Agent模式的RPA可以分析大量數據,預測未來趨勢和行為,并據此做出決策
應用場景
通過融合AI技術,尤其是大語言模型(LLM),RPA在多個領域實現了廣泛的應用。這種類型的Agent特別適用于人力資源管理、供應鏈優化、財務規劃和風險分析。由于其不斷增加的處理能力和知識,Agent能夠提供及時準確的建議,以支持業務主管的決策過程。
- 客戶服務:作為虛擬助手,Agent能夠提供個性化的客戶服務和支持
- 金融服務:在風險管理、投資咨詢和個性化金融產品推薦中發揮作用
- 績效管理:Agent可以跟蹤員工的工作績效,通過數據分析提供客觀的績效評估
- 輔助教育:Agent可以根據學生的學習歷史和表現,推薦相關的學習資源、課程和活動
局限性
目前,Agent作為一種新興技術,其發展前景廣闊,但同時也面臨著技術、市場和實施等方面的挑戰。隨著技術的不斷成熟和市場教育的深入,預計這些局限性將逐步得到解決。
- 技術成熟度:雖然Agent技術發展迅速,但仍有許多項目處于概念驗證和demo階段
- 數據安全和隱私:隨著越來越多的敏感數據通過Agent處理,如何確保數據安全和隱私仍是一個挑戰
- 技術發展周期:AI和機器學習模型的發展需要時間,Agent在實現廣泛的商業應用之前,可能需要經歷一個相對較長的技術成熟周期
實在智能作為Agent領域的先行者,自成立之日起就專注于在AI算法上的持續投入,在解決數據安全方面做了很多創新和努力。比如,實在智能自主研發用于中文不當言論判別和生成終止的Detoxify系統,提升模型的安全性和無害性,讓大模型“既懂事,又懂法”。此外,Agent支持私有化部署,在企業算力支持條件下,可以做到數據不上云,模型更可控、數據更安全!
為了更好地理解RPA、IPA和Agent三者之間的關系和差異,實在智能對它們進行了對比分析:
- 技術復雜性:
- RPA:相對較低,主要依賴于固定規則和直接的腳本執行。
- IPA:較高,需要集成多種AI技術以實現更高級的自動化。
- Agent:最高,需要復雜的AI和機器學習算法來支持自主決策和學習。
- 自動化范圍:
- RPA:主要適用于標準化、重復性高的流程。
- IPA:適用于需要一定程度智能判斷和適應性的場景。
- Agent:適用于需要高度自主性和復雜決策支持的領域。
- 對人類干預的依賴:
- RPA:在大多數情況下需要預先定義的規則和定期的維護。
- IPA:雖然減少了對人類干預的依賴,但在某些復雜決策時可能仍需人類介入。
- Agent:設計為最小化人類干預,能夠獨立執行任務和做出決策。
- 成本與效益:
- RPA:初期投資較低,易于實施,但可能需要持續的維護和更新。
- IPA:初期投資和實施復雜性較高,但長期效益在于其智能化處理能力。
- Agent:需要較大的初期投資和高度的技術專長,但能提供最大的自主性和靈活性。

整體而言,RPA、IPA和Agent三者并非相互獨立,而是存在一定的演進和依賴關系。RPA作為基礎,為自動化提供了一個起點,其技術相對成熟且易于實施;IPA作為擴展,在RPA的基礎上,通過集成AI技術,提升了自動化的智能化水平;Agent作為目標,融合大模型技術,代表了自動化技術的未來方向。
盡管AI Agent在當下備受矚目,但我們仍然需要認識到RPA技術的獨特優勢。比如,RPA的集成過程相對簡單,這通常意味著在成本控制方面具有優勢,對于智能化需求不高的自動化場景,RPA依然是首選。此外,在短時間內,AI Agent還無法用于操作成百上千的企業管理系統。
所以,Agent技術作為超自動化的一部分,實在智能會將其與其他AI、iPaaS等集成,形成更加全面的自動化解決方案。同樣,這個過程也面臨著一些可以預知的挑戰,如技術復雜性、倫理和責任以及用戶接受度等,這些挑戰需要實在智能與企業和整個行業共同努力解決。