大模型時(shí)代下,數(shù)字員工演進(jìn)全景圖:RPA/IPA/Agent
從蒸汽機(jī)到電力,再到計(jì)算機(jī),每一次技術(shù)的飛躍都極大地提升了企業(yè)效率。
如今,隨著數(shù)字化轉(zhuǎn)型的浪潮席卷全球,企業(yè)開始尋求新的解決方案來優(yōu)化業(yè)務(wù)流程、打破數(shù)據(jù)屏障,達(dá)到提效降本的目的。在這一背景下,數(shù)字員工的概念逐漸在企業(yè)界內(nèi)“流行”起來。
根據(jù)RPA市場調(diào)研報(bào)告顯示,2022年中國約有85%的企業(yè)與機(jī)構(gòu)愿意與彼此互相了解的廠商進(jìn)行合作,已經(jīng)有43.8%的企業(yè)及機(jī)構(gòu)開始了RPA的部分范圍應(yīng)用,17.9%的企業(yè)及機(jī)構(gòu)在進(jìn)行RPA規(guī)模化探索。其中,銀行、保險(xiǎn)、證券、電商與零售、政務(wù)等領(lǐng)域是RPA商用實(shí)踐主力軍。
從調(diào)研數(shù)據(jù)來看,RPA在企業(yè)中的認(rèn)知度和接受度都相當(dāng)高,大多數(shù)企業(yè)有計(jì)劃將RPA應(yīng)用于自身業(yè)務(wù)。此外,國家也持續(xù)出臺相關(guān)政策加快包括RPA在內(nèi)的新一代信息技術(shù)在各領(lǐng)域的應(yīng)用,提高各行業(yè)管理效率,促進(jìn)行業(yè)發(fā)展。

數(shù)字員工之所以能夠快速獲得企業(yè)的認(rèn)可,一方面離不開企業(yè)對于高效營銷解決方案的切實(shí)需求,另一方面則是數(shù)字員工的自動(dòng)化解決方案,能夠有效幫助企業(yè)解決重復(fù)低效工作和降低人力成本,平均應(yīng)用ROI可達(dá)1:6。
在企業(yè)效率大幅提升的背后,與數(shù)字員工的多次技術(shù)迭代密不可分。數(shù)字員工的三個(gè)發(fā)展階段分別為:RPA、IPA和Agent,分別代表了自動(dòng)化技術(shù)的不同發(fā)展水平。RPA作為起點(diǎn),通過模擬人類用戶執(zhí)行重復(fù)性任務(wù)來實(shí)現(xiàn)流程自動(dòng)化;IPA則集成AI技術(shù),提升了自動(dòng)化的智能化水平,使得數(shù)字員工能夠處理更復(fù)雜的任務(wù);Agent智能體階段,數(shù)字員工不僅能夠執(zhí)行任務(wù),還能進(jìn)行自主決策,與人類交互,為企業(yè)帶來更深層次的變革。
接下來,實(shí)在智能將詳細(xì)分析這三個(gè)階段的技術(shù)特點(diǎn)、應(yīng)用場景以及它們對企業(yè)運(yùn)營的影響,旨在為企業(yè)提供一幅數(shù)字員工演進(jìn)的全景圖,幫助其更好地理解這一領(lǐng)域的最新發(fā)展。

RPA技術(shù)的起源和早期發(fā)展可以追溯到20世紀(jì)中葉的自動(dòng)化生產(chǎn)線和工業(yè)機(jī)器人,而其作為現(xiàn)代軟件自動(dòng)化技術(shù)的成熟和廣泛應(yīng)用則是在21世紀(jì)初,特別是2010年以后。

RPA定義與原理
RPA(Robotic Process Automation,)是一種業(yè)務(wù)流程自動(dòng)化技術(shù),它通過軟件機(jī)器人來模擬人類用戶執(zhí)行一些重復(fù)性高、基于規(guī)則的后臺任務(wù)。這些任務(wù)通常包括數(shù)據(jù)的提取、錄入、處理,以及文件的移動(dòng)等。
用戶通過RPA設(shè)計(jì)器的可視化設(shè)計(jì)界面,以“拖拉拽”方式構(gòu)建自動(dòng)化流程。在開發(fā)過程中,用戶需要定義機(jī)器人的觸發(fā)條件、任務(wù)序列、異常處理和數(shù)據(jù)流轉(zhuǎn)。
這時(shí)候RPA的核心在于"模擬"能力,能夠模擬鼠標(biāo)點(diǎn)擊、鍵盤輸入、數(shù)據(jù)復(fù)制和粘貼等人類操作。通過這種方式,RPA軟件機(jī)器人能夠無縫地與現(xiàn)有的IT基礎(chǔ)設(shè)施和應(yīng)用程序集成,無需對現(xiàn)有系統(tǒng)進(jìn)行大規(guī)模改造。
應(yīng)用場景
企業(yè)應(yīng)用RPA需要確定哪些業(yè)務(wù)流程適合自動(dòng)化。這通常涉及對現(xiàn)有流程的詳細(xì)審查,以識別那些重復(fù)性高、規(guī)則明確且耗時(shí)的任務(wù);再通過專業(yè)實(shí)施團(tuán)隊(duì)進(jìn)行技術(shù)評估,流程設(shè)計(jì)以及部署測試;穩(wěn)定后,可能需要對機(jī)器人進(jìn)行維護(hù)和更新,以確保它們繼續(xù)高效地運(yùn)行。
RPA技術(shù)的應(yīng)用場景幾乎涵蓋了所有需要重復(fù)性數(shù)據(jù)輸入和處理的業(yè)務(wù)流程,以下是一些典型場景:
- 財(cái)務(wù)和會計(jì):自動(dòng)執(zhí)行發(fā)票處理、賬目核對和財(cái)務(wù)報(bào)告生成等任務(wù)。
- 人力資源:自動(dòng)化員工入職流程、薪資計(jì)算和福利管理。
- 客戶服務(wù):通過聊天機(jī)器人提供7×24h的客戶支持,自動(dòng)處理常見查詢。
- 供應(yīng)鏈管理:監(jiān)控庫存水平,自動(dòng)下單補(bǔ)貨,優(yōu)化物流流程。
- IT運(yùn)維:自動(dòng)化系統(tǒng)監(jiān)控、故障排查和常規(guī)維護(hù)任務(wù)。
局限性
RPA的實(shí)施可以顯著提高企業(yè)的運(yùn)營效率,減少人為錯(cuò)誤,并釋放員工從事更高價(jià)值的工作。但也存在一些局限性:
- 系統(tǒng)脆弱:RPA機(jī)器人只能按照預(yù)設(shè)的規(guī)則執(zhí)行任務(wù),界面微小變化后需要重新配置
- 存在技術(shù)門檻:雖然RPA工具可視化界面對用戶友好,但某些復(fù)雜的自動(dòng)化任務(wù)實(shí)施仍需要專業(yè)實(shí)施
- 非結(jié)構(gòu)化數(shù)據(jù)處理:RPA主要用于處理結(jié)構(gòu)化數(shù)據(jù),對圖片、文檔等非結(jié)構(gòu)化數(shù)據(jù)的處理存在局限
盡管初代的RPA存在局限性,但仍然是企業(yè)實(shí)現(xiàn)初步自動(dòng)化的重要工具。而通過結(jié)合AI技術(shù),RPA的局限性可以得到緩解,例如利用機(jī)器學(xué)習(xí)、自然語言處理等技術(shù)處理非結(jié)構(gòu)化數(shù)據(jù),使RPA更加靈活和強(qiáng)大;通過結(jié)合智能屏幕語義理解技術(shù)降低使用門檻,使非技術(shù)人員也能構(gòu)建自動(dòng)化流程。

IPA的定義與原理
IPA(Intelligent Process Automation)是一種集成了多種智能技術(shù),用于增強(qiáng)自動(dòng)化流程的靈活性、適應(yīng)性和智能化水平的自動(dòng)化技術(shù)。它不僅能夠執(zhí)行基于規(guī)則的重復(fù)性任務(wù),還能處理更復(fù)雜的業(yè)務(wù)場景,如決策支持、預(yù)測分析和認(rèn)知自動(dòng)化。
IPA的核心在于“智能”二字。與RPA相比,IPA設(shè)計(jì)器的人機(jī)交互更加智能化。在開發(fā)過程中,除了專業(yè)的“拖拉拽”方式,用戶還可以選擇基于AI技術(shù)的“點(diǎn)選用”方式構(gòu)建自動(dòng)化流程,想要實(shí)現(xiàn)哪個(gè)動(dòng)作的自動(dòng)化,只需要把鼠標(biāo)懸停在界面元素上,對應(yīng)的流程組件就會自動(dòng)推送到眼前,用戶按照實(shí)際動(dòng)作選取即可。
IPA的“點(diǎn)選用”優(yōu)勢有多方面,其一是那些不精通技術(shù)的業(yè)務(wù)人員,可以自行使用IPA實(shí)現(xiàn)流程自動(dòng)化,降低技術(shù)依賴;其二是當(dāng)界面元素出現(xiàn)微小變化時(shí),業(yè)務(wù)人員可以第一時(shí)間自行調(diào)整,降低運(yùn)維成本,增強(qiáng)靈活性和敏捷性。
以上具備“點(diǎn)選用”特性的IPA是實(shí)在智能基于自研智能屏幕語義理解技術(shù)(ISSUT)和多年客戶服務(wù)經(jīng)驗(yàn),于2022年全行業(yè)首發(fā),這也為后面的Agent(RPA第三階段演進(jìn))奠定了堅(jiān)實(shí)基礎(chǔ)。
技術(shù)集成
IPA是建立在RPA基礎(chǔ)上為用戶強(qiáng)大和靈活的自動(dòng)化解決方案,依賴于多種AI技術(shù)的集成:
- 機(jī)器學(xué)習(xí):ML算法能夠從數(shù)據(jù)中學(xué)習(xí)并改進(jìn)流程,使IPA能夠適應(yīng)新的數(shù)據(jù)模式和變化
- 智能屏幕語義理解技術(shù):這是實(shí)在智能的自研技術(shù),使得IPA能夠理解屏幕上的元素和用戶的操作意圖,從而提供更準(zhǔn)確的自動(dòng)化建議
- 業(yè)務(wù)感知推薦:結(jié)合場景預(yù)測和自然語言處理技術(shù),IPA能夠推薦符合業(yè)務(wù)場景的自動(dòng)化操作
- 頁面結(jié)構(gòu)分析技術(shù):通過分析頁面結(jié)構(gòu),IPA可以理解軟件界面的布局,并適應(yīng)頁面變化,如拉伸、移動(dòng)或內(nèi)容位移
應(yīng)用場景
這些AI技術(shù)的集成,使得IPA不僅僅能夠執(zhí)行簡單的、規(guī)則明確的任務(wù),還能夠處理更復(fù)雜的、需要一定智能判斷的任務(wù),極大地?cái)U(kuò)展了自動(dòng)化的應(yīng)用范圍和深度。以下是一些主要的IPA應(yīng)用場景:
- 發(fā)票處理自動(dòng)化:IPA可以自動(dòng)處理來自不同供應(yīng)商的發(fā)票,識別和提取相關(guān)信息,即使是非結(jié)構(gòu)化內(nèi)容和不同格式的發(fā)票也能應(yīng)對
- 財(cái)務(wù)分析和報(bào)告:IPA能夠快速分析大量財(cái)務(wù)數(shù)據(jù),并生成準(zhǔn)確、全面的財(cái)務(wù)報(bào)告,支持企業(yè)決策
- 審計(jì)判斷:在審計(jì)工作中,IPA可以幫助審計(jì)人員快速準(zhǔn)確地完成審計(jì)底稿的編制、數(shù)據(jù)比對等任務(wù),并進(jìn)行智能判斷
- 工資核算:IPA可以自動(dòng)化工資核算流程,檢查員工數(shù)據(jù)的一致性,管理福利和付款,避免數(shù)據(jù)不準(zhǔn)確和延遲
局限性
IPA在企業(yè)應(yīng)用中具備比RPA更廣泛的適應(yīng)性和靈活性,但在實(shí)施過程中也面臨著一些類似挑戰(zhàn):
- 技術(shù)復(fù)雜性:隨著AI技術(shù)的集成,IPA系統(tǒng)的復(fù)雜性增加,需要專業(yè)人員進(jìn)行維護(hù)和管理
- 數(shù)據(jù)隱私和安全:IPA處理大量敏感數(shù)據(jù),需要加強(qiáng)數(shù)據(jù)保護(hù)和隱私措施
- 成本問題:引入IPA可能需要較高的初期投資,尤其是在采購高級分析工具和培訓(xùn)員工方面
- 變革抵抗:企業(yè)內(nèi)部對變革的抵抗可能會阻礙IPA的實(shí)施和成功
三、Agent階段 - 自主決策的實(shí)現(xiàn)
隨著大模型技術(shù)的興起,RPA也迎來第三次形態(tài)改變——Agent模式。大模型通常指的是使用大量數(shù)據(jù)訓(xùn)練而成的復(fù)雜機(jī)器學(xué)習(xí)模型,它們在自然語言處理(NLP)、圖像識別、語音識別等領(lǐng)域展現(xiàn)出強(qiáng)大的性能。
2023年上半年,實(shí)在智能自研的垂直大模型TARS(塔斯)在國內(nèi)大模型各類榜單名列前茅,具備“效果可用、成本可控、定制化訓(xùn)練、私有化部署”等差異化優(yōu)勢。

Agent的定義與原理
Agent可以看作是一種能夠感知環(huán)境、進(jìn)行決策和執(zhí)行動(dòng)作的智能實(shí)體,本質(zhì)是一種結(jié)合大模型和自動(dòng)化技術(shù)的AI助理,其自動(dòng)化的能力主要來源于AI模型推理。同時(shí),Agent具備自主性和自適應(yīng)性,能在特定任務(wù)或領(lǐng)域中能夠自主地進(jìn)行學(xué)習(xí)和改進(jìn),甚至能夠進(jìn)行創(chuàng)造性的任務(wù),如內(nèi)容生成或復(fù)雜問題的解決。
在實(shí)在智能的AI產(chǎn)品矩陣中,實(shí)在Agent能夠展現(xiàn)出接近人類專家級別的認(rèn)知能力,可以很好地理解和解析人類語言,拆分為細(xì)小的自動(dòng)化步驟,通過RPA實(shí)現(xiàn)全流程的自動(dòng)化。簡單地說,用戶通過一句話描述任務(wù),實(shí)在Agent就可以自動(dòng)執(zhí)行。
通過融入大模型技術(shù),Agent能夠提供更加強(qiáng)大和靈活的自動(dòng)化解決方案,處理更加復(fù)雜和多樣化的業(yè)務(wù)需求。這不僅推動(dòng)了RPA技術(shù)的發(fā)展,也為數(shù)字化轉(zhuǎn)型提供了新的動(dòng)力。
技術(shù)集成
相較于IPA,Agent是在大模型技術(shù)的支持下,成為真正基于自然語言交互的數(shù)字員工或AI助理。以下是Agent模式RPA集成的一些關(guān)鍵技術(shù):
- 自然語言處理NLP:NLP技術(shù)增強(qiáng)了RPA的文本處理能力,使其能夠理解和處理人類語言,包括語音和文本
- 大語言模型LLM:LLM技術(shù)使得Agent模式的RPA能夠進(jìn)行更復(fù)雜的語言處理和生成任務(wù)
- 深度數(shù)據(jù)分析:Agent模式的RPA可以分析大量數(shù)據(jù),預(yù)測未來趨勢和行為,并據(jù)此做出決策
應(yīng)用場景
通過融合AI技術(shù),尤其是大語言模型(LLM),RPA在多個(gè)領(lǐng)域?qū)崿F(xiàn)了廣泛的應(yīng)用。這種類型的Agent特別適用于人力資源管理、供應(yīng)鏈優(yōu)化、財(cái)務(wù)規(guī)劃和風(fēng)險(xiǎn)分析。由于其不斷增加的處理能力和知識,Agent能夠提供及時(shí)準(zhǔn)確的建議,以支持業(yè)務(wù)主管的決策過程。
- 客戶服務(wù):作為虛擬助手,Agent能夠提供個(gè)性化的客戶服務(wù)和支持
- 金融服務(wù):在風(fēng)險(xiǎn)管理、投資咨詢和個(gè)性化金融產(chǎn)品推薦中發(fā)揮作用
- 績效管理:Agent可以跟蹤員工的工作績效,通過數(shù)據(jù)分析提供客觀的績效評估
- 輔助教育:Agent可以根據(jù)學(xué)生的學(xué)習(xí)歷史和表現(xiàn),推薦相關(guān)的學(xué)習(xí)資源、課程和活動(dòng)
局限性
目前,Agent作為一種新興技術(shù),其發(fā)展前景廣闊,但同時(shí)也面臨著技術(shù)、市場和實(shí)施等方面的挑戰(zhàn)。隨著技術(shù)的不斷成熟和市場教育的深入,預(yù)計(jì)這些局限性將逐步得到解決。
- 技術(shù)成熟度:雖然Agent技術(shù)發(fā)展迅速,但仍有許多項(xiàng)目處于概念驗(yàn)證和demo階段
- 數(shù)據(jù)安全和隱私:隨著越來越多的敏感數(shù)據(jù)通過Agent處理,如何確保數(shù)據(jù)安全和隱私仍是一個(gè)挑戰(zhàn)
- 技術(shù)發(fā)展周期:AI和機(jī)器學(xué)習(xí)模型的發(fā)展需要時(shí)間,Agent在實(shí)現(xiàn)廣泛的商業(yè)應(yīng)用之前,可能需要經(jīng)歷一個(gè)相對較長的技術(shù)成熟周期
實(shí)在智能作為Agent領(lǐng)域的先行者,自成立之日起就專注于在AI算法上的持續(xù)投入,在解決數(shù)據(jù)安全方面做了很多創(chuàng)新和努力。比如,實(shí)在智能自主研發(fā)用于中文不當(dāng)言論判別和生成終止的Detoxify系統(tǒng),提升模型的安全性和無害性,讓大模型“既懂事,又懂法”。此外,Agent支持私有化部署,在企業(yè)算力支持條件下,可以做到數(shù)據(jù)不上云,模型更可控、數(shù)據(jù)更安全!
為了更好地理解RPA、IPA和Agent三者之間的關(guān)系和差異,實(shí)在智能對它們進(jìn)行了對比分析:
- 技術(shù)復(fù)雜性:
- RPA:相對較低,主要依賴于固定規(guī)則和直接的腳本執(zhí)行。
- IPA:較高,需要集成多種AI技術(shù)以實(shí)現(xiàn)更高級的自動(dòng)化。
- Agent:最高,需要復(fù)雜的AI和機(jī)器學(xué)習(xí)算法來支持自主決策和學(xué)習(xí)。
- 自動(dòng)化范圍:
- RPA:主要適用于標(biāo)準(zhǔn)化、重復(fù)性高的流程。
- IPA:適用于需要一定程度智能判斷和適應(yīng)性的場景。
- Agent:適用于需要高度自主性和復(fù)雜決策支持的領(lǐng)域。
- 對人類干預(yù)的依賴:
- RPA:在大多數(shù)情況下需要預(yù)先定義的規(guī)則和定期的維護(hù)。
- IPA:雖然減少了對人類干預(yù)的依賴,但在某些復(fù)雜決策時(shí)可能仍需人類介入。
- Agent:設(shè)計(jì)為最小化人類干預(yù),能夠獨(dú)立執(zhí)行任務(wù)和做出決策。
- 成本與效益:
- RPA:初期投資較低,易于實(shí)施,但可能需要持續(xù)的維護(hù)和更新。
- IPA:初期投資和實(shí)施復(fù)雜性較高,但長期效益在于其智能化處理能力。
- Agent:需要較大的初期投資和高度的技術(shù)專長,但能提供最大的自主性和靈活性。

整體而言,RPA、IPA和Agent三者并非相互獨(dú)立,而是存在一定的演進(jìn)和依賴關(guān)系。RPA作為基礎(chǔ),為自動(dòng)化提供了一個(gè)起點(diǎn),其技術(shù)相對成熟且易于實(shí)施;IPA作為擴(kuò)展,在RPA的基礎(chǔ)上,通過集成AI技術(shù),提升了自動(dòng)化的智能化水平;Agent作為目標(biāo),融合大模型技術(shù),代表了自動(dòng)化技術(shù)的未來方向。
盡管AI Agent在當(dāng)下備受矚目,但我們?nèi)匀恍枰J(rèn)識到RPA技術(shù)的獨(dú)特優(yōu)勢。比如,RPA的集成過程相對簡單,這通常意味著在成本控制方面具有優(yōu)勢,對于智能化需求不高的自動(dòng)化場景,RPA依然是首選。此外,在短時(shí)間內(nèi),AI Agent還無法用于操作成百上千的企業(yè)管理系統(tǒng)。
所以,Agent技術(shù)作為超自動(dòng)化的一部分,實(shí)在智能會將其與其他AI、iPaaS等集成,形成更加全面的自動(dòng)化解決方案。同樣,這個(gè)過程也面臨著一些可以預(yù)知的挑戰(zhàn),如技術(shù)復(fù)雜性、倫理和責(zé)任以及用戶接受度等,這些挑戰(zhàn)需要實(shí)在智能與企業(yè)和整個(gè)行業(yè)共同努力解決。
[免責(zé)聲明]
原文標(biāo)題: 大模型時(shí)代下,數(shù)字員工演進(jìn)全景圖:RPA/IPA/Agent
本文由作者原創(chuàng)發(fā)布于36氪企服點(diǎn)評;未經(jīng)許可,禁止轉(zhuǎn)載。














