大模型時(shí)代下，數(shù)字員工演進(jìn)全景圖：RPA/IPA/Agent

實(shí)在智能

+ 關(guān)注

2024-07-11 15:52

1209次閱讀

從蒸汽機(jī)到電力，再到計(jì)算機(jī)，每一次技術(shù)的飛躍都極大地提升了企業(yè)效率。

如今，隨著數(shù)字化轉(zhuǎn)型的浪潮席卷全球，企業(yè)開始尋求新的解決方案來優(yōu)化業(yè)務(wù)流程、打破數(shù)據(jù)屏障，達(dá)到提效降本的目的。在這一背景下，數(shù)字員工的概念逐漸在企業(yè)界內(nèi)“流行”起來。

根據(jù)RPA市場調(diào)研報(bào)告顯示，2022年中國約有85%的企業(yè)與機(jī)構(gòu)愿意與彼此互相了解的廠商進(jìn)行合作，已經(jīng)有43.8%的企業(yè)及機(jī)構(gòu)開始了RPA的部分范圍應(yīng)用，17.9%的企業(yè)及機(jī)構(gòu)在進(jìn)行RPA規(guī)模化探索。其中，銀行、保險(xiǎn)、證券、電商與零售、政務(wù)等領(lǐng)域是RPA商用實(shí)踐主力軍。

從調(diào)研數(shù)據(jù)來看，RPA在企業(yè)中的認(rèn)知度和接受度都相當(dāng)高，大多數(shù)企業(yè)有計(jì)劃將RPA應(yīng)用于自身業(yè)務(wù)。此外，國家也持續(xù)出臺相關(guān)政策加快包括RPA在內(nèi)的新一代信息技術(shù)在各領(lǐng)域的應(yīng)用，提高各行業(yè)管理效率，促進(jìn)行業(yè)發(fā)展。

大模型時(shí)代下，數(shù)字員工演進(jìn)全景圖：RPA/IPA/Agent

數(shù)字員工之所以能夠快速獲得企業(yè)的認(rèn)可，一方面離不開企業(yè)對于高效營銷解決方案的切實(shí)需求，另一方面則是數(shù)字員工的自動(dòng)化解決方案，能夠有效幫助企業(yè)解決重復(fù)低效工作和降低人力成本，平均應(yīng)用ROI可達(dá)1：6。

在企業(yè)效率大幅提升的背后，與數(shù)字員工的多次技術(shù)迭代密不可分。數(shù)字員工的三個(gè)發(fā)展階段分別為：RPA、IPA和Agent，分別代表了自動(dòng)化技術(shù)的不同發(fā)展水平。RPA作為起點(diǎn)，通過模擬人類用戶執(zhí)行重復(fù)性任務(wù)來實(shí)現(xiàn)流程自動(dòng)化；IPA則集成AI技術(shù)，提升了自動(dòng)化的智能化水平，使得數(shù)字員工能夠處理更復(fù)雜的任務(wù)；Agent智能體階段，數(shù)字員工不僅能夠執(zhí)行任務(wù)，還能進(jìn)行自主決策，與人類交互，為企業(yè)帶來更深層次的變革。

接下來，實(shí)在智能將詳細(xì)分析這三個(gè)階段的技術(shù)特點(diǎn)、應(yīng)用場景以及它們對企業(yè)運(yùn)營的影響，旨在為企業(yè)提供一幅數(shù)字員工演進(jìn)的全景圖，幫助其更好地理解這一領(lǐng)域的最新發(fā)展。

一、RPA階段 - 自動(dòng)化的起點(diǎn)

RPA技術(shù)的起源和早期發(fā)展可以追溯到20世紀(jì)中葉的自動(dòng)化生產(chǎn)線和工業(yè)機(jī)器人，而其作為現(xiàn)代軟件自動(dòng)化技術(shù)的成熟和廣泛應(yīng)用則是在21世紀(jì)初，特別是2010年以后。

RPA定義與原理

RPA（Robotic Process Automation,）是一種業(yè)務(wù)流程自動(dòng)化技術(shù)，它通過軟件機(jī)器人來模擬人類用戶執(zhí)行一些重復(fù)性高、基于規(guī)則的后臺任務(wù)。這些任務(wù)通常包括數(shù)據(jù)的提取、錄入、處理，以及文件的移動(dòng)等。

用戶通過RPA設(shè)計(jì)器的可視化設(shè)計(jì)界面，以“拖拉拽”方式構(gòu)建自動(dòng)化流程。在開發(fā)過程中，用戶需要定義機(jī)器人的觸發(fā)條件、任務(wù)序列、異常處理和數(shù)據(jù)流轉(zhuǎn)。

這時(shí)候RPA的核心在于"模擬"能力，能夠模擬鼠標(biāo)點(diǎn)擊、鍵盤輸入、數(shù)據(jù)復(fù)制和粘貼等人類操作。通過這種方式，RPA軟件機(jī)器人能夠無縫地與現(xiàn)有的IT基礎(chǔ)設(shè)施和應(yīng)用程序集成，無需對現(xiàn)有系統(tǒng)進(jìn)行大規(guī)模改造。

應(yīng)用場景

企業(yè)應(yīng)用RPA需要確定哪些業(yè)務(wù)流程適合自動(dòng)化。這通常涉及對現(xiàn)有流程的詳細(xì)審查，以識別那些重復(fù)性高、規(guī)則明確且耗時(shí)的任務(wù)；再通過專業(yè)實(shí)施團(tuán)隊(duì)進(jìn)行技術(shù)評估，流程設(shè)計(jì)以及部署測試；穩(wěn)定后，可能需要對機(jī)器人進(jìn)行維護(hù)和更新，以確保它們繼續(xù)高效地運(yùn)行。

RPA技術(shù)的應(yīng)用場景幾乎涵蓋了所有需要重復(fù)性數(shù)據(jù)輸入和處理的業(yè)務(wù)流程，以下是一些典型場景：

財(cái)務(wù)和會計(jì)：自動(dòng)執(zhí)行發(fā)票處理、賬目核對和財(cái)務(wù)報(bào)告生成等任務(wù)。
人力資源：自動(dòng)化員工入職流程、薪資計(jì)算和福利管理。
客戶服務(wù)：通過聊天機(jī)器人提供7×24h的客戶支持，自動(dòng)處理常見查詢。
供應(yīng)鏈管理：監(jiān)控庫存水平，自動(dòng)下單補(bǔ)貨，優(yōu)化物流流程。
IT運(yùn)維：自動(dòng)化系統(tǒng)監(jiān)控、故障排查和常規(guī)維護(hù)任務(wù)。

局限性

RPA的實(shí)施可以顯著提高企業(yè)的運(yùn)營效率，減少人為錯(cuò)誤，并釋放員工從事更高價(jià)值的工作。但也存在一些局限性：

系統(tǒng)脆弱：RPA機(jī)器人只能按照預(yù)設(shè)的規(guī)則執(zhí)行任務(wù)，界面微小變化后需要重新配置
存在技術(shù)門檻：雖然RPA工具可視化界面對用戶友好，但某些復(fù)雜的自動(dòng)化任務(wù)實(shí)施仍需要專業(yè)實(shí)施
非結(jié)構(gòu)化數(shù)據(jù)處理：RPA主要用于處理結(jié)構(gòu)化數(shù)據(jù)，對圖片、文檔等非結(jié)構(gòu)化數(shù)據(jù)的處理存在局限

二、IPA階段 - 智能化的融合

盡管初代的RPA存在局限性，但仍然是企業(yè)實(shí)現(xiàn)初步自動(dòng)化的重要工具。而通過結(jié)合AI技術(shù)，RPA的局限性可以得到緩解，例如利用機(jī)器學(xué)習(xí)、自然語言處理等技術(shù)處理非結(jié)構(gòu)化數(shù)據(jù)，使RPA更加靈活和強(qiáng)大；通過結(jié)合智能屏幕語義理解技術(shù)降低使用門檻，使非技術(shù)人員也能構(gòu)建自動(dòng)化流程。

IPA的定義與原理

IPA（Intelligent Process Automation）是一種集成了多種智能技術(shù)，用于增強(qiáng)自動(dòng)化流程的靈活性、適應(yīng)性和智能化水平的自動(dòng)化技術(shù)。它不僅能夠執(zhí)行基于規(guī)則的重復(fù)性任務(wù)，還能處理更復(fù)雜的業(yè)務(wù)場景，如決策支持、預(yù)測分析和認(rèn)知自動(dòng)化。

IPA的核心在于“智能”二字。與RPA相比，IPA設(shè)計(jì)器的人機(jī)交互更加智能化。在開發(fā)過程中，除了專業(yè)的“拖拉拽”方式，用戶還可以選擇基于AI技術(shù)的“點(diǎn)選用”方式構(gòu)建自動(dòng)化流程，想要實(shí)現(xiàn)哪個(gè)動(dòng)作的自動(dòng)化，只需要把鼠標(biāo)懸停在界面元素上，對應(yīng)的流程組件就會自動(dòng)推送到眼前，用戶按照實(shí)際動(dòng)作選取即可。

IPA的“點(diǎn)選用”優(yōu)勢有多方面，其一是那些不精通技術(shù)的業(yè)務(wù)人員，可以自行使用IPA實(shí)現(xiàn)流程自動(dòng)化，降低技術(shù)依賴；其二是當(dāng)界面元素出現(xiàn)微小變化時(shí)，業(yè)務(wù)人員可以第一時(shí)間自行調(diào)整，降低運(yùn)維成本，增強(qiáng)靈活性和敏捷性。

以上具備“點(diǎn)選用”特性的IPA是實(shí)在智能基于自研智能屏幕語義理解技術(shù)（ISSUT）和多年客戶服務(wù)經(jīng)驗(yàn)，于2022年全行業(yè)首發(fā)，這也為后面的Agent（RPA第三階段演進(jìn)）奠定了堅(jiān)實(shí)基礎(chǔ)。

技術(shù)集成

IPA是建立在RPA基礎(chǔ)上為用戶強(qiáng)大和靈活的自動(dòng)化解決方案，依賴于多種AI技術(shù)的集成：

機(jī)器學(xué)習(xí)：ML算法能夠從數(shù)據(jù)中學(xué)習(xí)并改進(jìn)流程，使IPA能夠適應(yīng)新的數(shù)據(jù)模式和變化
智能屏幕語義理解技術(shù)：這是實(shí)在智能的自研技術(shù)，使得IPA能夠理解屏幕上的元素和用戶的操作意圖，從而提供更準(zhǔn)確的自動(dòng)化建議
業(yè)務(wù)感知推薦：結(jié)合場景預(yù)測和自然語言處理技術(shù)，IPA能夠推薦符合業(yè)務(wù)場景的自動(dòng)化操作
頁面結(jié)構(gòu)分析技術(shù)：通過分析頁面結(jié)構(gòu)，IPA可以理解軟件界面的布局，并適應(yīng)頁面變化，如拉伸、移動(dòng)或內(nèi)容位移

應(yīng)用場景

這些AI技術(shù)的集成，使得IPA不僅僅能夠執(zhí)行簡單的、規(guī)則明確的任務(wù)，還能夠處理更復(fù)雜的、需要一定智能判斷的任務(wù)，極大地?cái)U(kuò)展了自動(dòng)化的應(yīng)用范圍和深度。以下是一些主要的IPA應(yīng)用場景：

發(fā)票處理自動(dòng)化：IPA可以自動(dòng)處理來自不同供應(yīng)商的發(fā)票，識別和提取相關(guān)信息，即使是非結(jié)構(gòu)化內(nèi)容和不同格式的發(fā)票也能應(yīng)對
財(cái)務(wù)分析和報(bào)告：IPA能夠快速分析大量財(cái)務(wù)數(shù)據(jù)，并生成準(zhǔn)確、全面的財(cái)務(wù)報(bào)告，支持企業(yè)決策
審計(jì)判斷：在審計(jì)工作中，IPA可以幫助審計(jì)人員快速準(zhǔn)確地完成審計(jì)底稿的編制、數(shù)據(jù)比對等任務(wù)，并進(jìn)行智能判斷
工資核算：IPA可以自動(dòng)化工資核算流程，檢查員工數(shù)據(jù)的一致性，管理福利和付款，避免數(shù)據(jù)不準(zhǔn)確和延遲

局限性

IPA在企業(yè)應(yīng)用中具備比RPA更廣泛的適應(yīng)性和靈活性，但在實(shí)施過程中也面臨著一些類似挑戰(zhàn)：

技術(shù)復(fù)雜性：隨著AI技術(shù)的集成，IPA系統(tǒng)的復(fù)雜性增加，需要專業(yè)人員進(jìn)行維護(hù)和管理
數(shù)據(jù)隱私和安全：IPA處理大量敏感數(shù)據(jù)，需要加強(qiáng)數(shù)據(jù)保護(hù)和隱私措施
成本問題：引入IPA可能需要較高的初期投資，尤其是在采購高級分析工具和培訓(xùn)員工方面
變革抵抗：企業(yè)內(nèi)部對變革的抵抗可能會阻礙IPA的實(shí)施和成功

三、Agent階段 - 自主決策的實(shí)現(xiàn)

隨著大模型技術(shù)的興起，RPA也迎來第三次形態(tài)改變——Agent模式。大模型通常指的是使用大量數(shù)據(jù)訓(xùn)練而成的復(fù)雜機(jī)器學(xué)習(xí)模型，它們在自然語言處理（NLP）、圖像識別、語音識別等領(lǐng)域展現(xiàn)出強(qiáng)大的性能。

2023年上半年，實(shí)在智能自研的垂直大模型TARS（塔斯）在國內(nèi)大模型各類榜單名列前茅，具備“效果可用、成本可控、定制化訓(xùn)練、私有化部署”等差異化優(yōu)勢。

Agent的定義與原理

Agent可以看作是一種能夠感知環(huán)境、進(jìn)行決策和執(zhí)行動(dòng)作的智能實(shí)體，本質(zhì)是一種結(jié)合大模型和自動(dòng)化技術(shù)的AI助理，其自動(dòng)化的能力主要來源于AI模型推理。同時(shí)，Agent具備自主性和自適應(yīng)性，能在特定任務(wù)或領(lǐng)域中能夠自主地進(jìn)行學(xué)習(xí)和改進(jìn)，甚至能夠進(jìn)行創(chuàng)造性的任務(wù)，如內(nèi)容生成或復(fù)雜問題的解決。

在實(shí)在智能的AI產(chǎn)品矩陣中，實(shí)在Agent能夠展現(xiàn)出接近人類專家級別的認(rèn)知能力，可以很好地理解和解析人類語言，拆分為細(xì)小的自動(dòng)化步驟，通過RPA實(shí)現(xiàn)全流程的自動(dòng)化。簡單地說，用戶通過一句話描述任務(wù)，實(shí)在Agent就可以自動(dòng)執(zhí)行。

通過融入大模型技術(shù)，Agent能夠提供更加強(qiáng)大和靈活的自動(dòng)化解決方案，處理更加復(fù)雜和多樣化的業(yè)務(wù)需求。這不僅推動(dòng)了RPA技術(shù)的發(fā)展，也為數(shù)字化轉(zhuǎn)型提供了新的動(dòng)力。

技術(shù)集成

相較于IPA，Agent是在大模型技術(shù)的支持下，成為真正基于自然語言交互的數(shù)字員工或AI助理。以下是Agent模式RPA集成的一些關(guān)鍵技術(shù)：

自然語言處理NLP：NLP技術(shù)增強(qiáng)了RPA的文本處理能力，使其能夠理解和處理人類語言，包括語音和文本
大語言模型LLM：LLM技術(shù)使得Agent模式的RPA能夠進(jìn)行更復(fù)雜的語言處理和生成任務(wù)
深度數(shù)據(jù)分析：Agent模式的RPA可以分析大量數(shù)據(jù)，預(yù)測未來趨勢和行為，并據(jù)此做出決策

應(yīng)用場景

通過融合AI技術(shù)，尤其是大語言模型（LLM），RPA在多個(gè)領(lǐng)域?qū)崿F(xiàn)了廣泛的應(yīng)用。這種類型的Agent特別適用于人力資源管理、供應(yīng)鏈優(yōu)化、財(cái)務(wù)規(guī)劃和風(fēng)險(xiǎn)分析。由于其不斷增加的處理能力和知識，Agent能夠提供及時(shí)準(zhǔn)確的建議，以支持業(yè)務(wù)主管的決策過程。

客戶服務(wù)：作為虛擬助手，Agent能夠提供個(gè)性化的客戶服務(wù)和支持
金融服務(wù)：在風(fēng)險(xiǎn)管理、投資咨詢和個(gè)性化金融產(chǎn)品推薦中發(fā)揮作用
績效管理：Agent可以跟蹤員工的工作績效，通過數(shù)據(jù)分析提供客觀的績效評估
輔助教育：Agent可以根據(jù)學(xué)生的學(xué)習(xí)歷史和表現(xiàn)，推薦相關(guān)的學(xué)習(xí)資源、課程和活動(dòng)

局限性

目前，Agent作為一種新興技術(shù)，其發(fā)展前景廣闊，但同時(shí)也面臨著技術(shù)、市場和實(shí)施等方面的挑戰(zhàn)。隨著技術(shù)的不斷成熟和市場教育的深入，預(yù)計(jì)這些局限性將逐步得到解決。

技術(shù)成熟度：雖然Agent技術(shù)發(fā)展迅速，但仍有許多項(xiàng)目處于概念驗(yàn)證和demo階段
數(shù)據(jù)安全和隱私：隨著越來越多的敏感數(shù)據(jù)通過Agent處理，如何確保數(shù)據(jù)安全和隱私仍是一個(gè)挑戰(zhàn)
技術(shù)發(fā)展周期：AI和機(jī)器學(xué)習(xí)模型的發(fā)展需要時(shí)間，Agent在實(shí)現(xiàn)廣泛的商業(yè)應(yīng)用之前，可能需要經(jīng)歷一個(gè)相對較長的技術(shù)成熟周期

實(shí)在智能作為Agent領(lǐng)域的先行者，自成立之日起就專注于在AI算法上的持續(xù)投入，在解決數(shù)據(jù)安全方面做了很多創(chuàng)新和努力。比如，實(shí)在智能自主研發(fā)用于中文不當(dāng)言論判別和生成終止的Detoxify系統(tǒng)，提升模型的安全性和無害性，讓大模型“既懂事，又懂法”。此外，Agent支持私有化部署，在企業(yè)算力支持條件下，可以做到數(shù)據(jù)不上云，模型更可控、數(shù)據(jù)更安全！

四、RPA三階段比較與未來趨勢

為了更好地理解RPA、IPA和Agent三者之間的關(guān)系和差異，實(shí)在智能對它們進(jìn)行了對比分析：

技術(shù)復(fù)雜性：

RPA：相對較低，主要依賴于固定規(guī)則和直接的腳本執(zhí)行。
IPA：較高，需要集成多種AI技術(shù)以實(shí)現(xiàn)更高級的自動(dòng)化。
Agent：最高，需要復(fù)雜的AI和機(jī)器學(xué)習(xí)算法來支持自主決策和學(xué)習(xí)。

自動(dòng)化范圍：

RPA：主要適用于標(biāo)準(zhǔn)化、重復(fù)性高的流程。
IPA：適用于需要一定程度智能判斷和適應(yīng)性的場景。
Agent：適用于需要高度自主性和復(fù)雜決策支持的領(lǐng)域。

對人類干預(yù)的依賴：

RPA：在大多數(shù)情況下需要預(yù)先定義的規(guī)則和定期的維護(hù)。
IPA：雖然減少了對人類干預(yù)的依賴，但在某些復(fù)雜決策時(shí)可能仍需人類介入。
Agent：設(shè)計(jì)為最小化人類干預(yù)，能夠獨(dú)立執(zhí)行任務(wù)和做出決策。

成本與效益：

RPA：初期投資較低，易于實(shí)施，但可能需要持續(xù)的維護(hù)和更新。
IPA：初期投資和實(shí)施復(fù)雜性較高，但長期效益在于其智能化處理能力。
Agent：需要較大的初期投資和高度的技術(shù)專長，但能提供最大的自主性和靈活性。

整體而言，RPA、IPA和Agent三者并非相互獨(dú)立，而是存在一定的演進(jìn)和依賴關(guān)系。RPA作為基礎(chǔ)，為自動(dòng)化提供了一個(gè)起點(diǎn)，其技術(shù)相對成熟且易于實(shí)施；IPA作為擴(kuò)展，在RPA的基礎(chǔ)上，通過集成AI技術(shù)，提升了自動(dòng)化的智能化水平；Agent作為目標(biāo)，融合大模型技術(shù)，代表了自動(dòng)化技術(shù)的未來方向。

盡管AI Agent在當(dāng)下備受矚目，但我們?nèi)匀恍枰J(rèn)識到RPA技術(shù)的獨(dú)特優(yōu)勢。比如，RPA的集成過程相對簡單，這通常意味著在成本控制方面具有優(yōu)勢，對于智能化需求不高的自動(dòng)化場景，RPA依然是首選。此外，在短時(shí)間內(nèi)，AI Agent還無法用于操作成百上千的企業(yè)管理系統(tǒng)。

所以，Agent技術(shù)作為超自動(dòng)化的一部分，實(shí)在智能會將其與其他AI、iPaaS等集成，形成更加全面的自動(dòng)化解決方案。同樣，這個(gè)過程也面臨著一些可以預(yù)知的挑戰(zhàn)，如技術(shù)復(fù)雜性、倫理和責(zé)任以及用戶接受度等，這些挑戰(zhàn)需要實(shí)在智能與企業(yè)和整個(gè)行業(yè)共同努力解決。

[免責(zé)聲明]

原文標(biāo)題：大模型時(shí)代下，數(shù)字員工演進(jìn)全景圖：RPA/IPA/Agent

本文由作者原創(chuàng)發(fā)布于36氪企服點(diǎn)評；未經(jīng)許可，禁止轉(zhuǎn)載。