AIGC產業應用研究報告,一文讀懂AIGC的前世今生
研究方向及背景
AIGC是AI Generated Content的縮寫,指利用人工智能技術生成的內容。它也被認為是繼PGC,UGC之后的新型內容生產方式,AI繪畫、AI寫作等都屬于AIGC的具體形式。2022年AIGC發展速度驚人,迭代速度更是呈現指數級發展,這其中深度學習模型不斷完善、開源模式的推動、大模型探索商業化的可能,都在助力AIGC的快速發展。去年人工智能繪畫作品的奪冠、超級聊天機器人ChatGPT的出現,拉開了智能創作時代的序幕。
在人工智能發展的漫長歷程中,如何讓機器學會創作一直被視為難以逾越的天塹,“創造力”也因此被視為人類與機器最本質的區別之一。然而,人類的創造力也終將賦予機器創造力,把世界送入智能創作的新時代。從機器學習到智能創造,從PGC,UGC到AIGC,我們即將見證一場深刻的生產力變革,而這份變革也會影響到我們工作與生活的方方面面。本書將結合生動的比喻和有趣的案例,向所有關注未來科技的從業者、創業者、投資人、政府部門科普AIGC的商業落地場景和行業應用案例。
趨勢判斷:人工智能產業經過多年發展,技術實現將從感知智能升級成認知智能,從而引發了機器理解、分析和決策事物的深層次需求。AIGC就是實現認知智能產品化的重要方式。未來幾年內,AIGC技術將在多個領域落地。
切入形式:技術主體切入(以AIGC技術切入,研究基于此技術衍生出的各領域中的應用)
目標讀者群體:AIGC行業應用企業
商業化對象:AIGC服務商
報告框架:
一、AIGC發展現狀
與之前的PGC與UGC不同的,AIGC是利用人工智能技術自動生成內容的新型生產方式。按照模態區分,AIGC又可分為音頻生成、文本生成、圖像生成、視頻生成及圖像、視頻、文本間的跨模態生成,細分場景眾多,其中跨模態生成值得重點關注。
億歐智庫:從PGC到UGC再到AIGC的發展歷程
互聯網形態 |
Web1 |
Web2 |
Web3與元宇宙 |
內容生產方式 |
PGC(專業生產) |
UGC(用戶生產) |
AIGC(AI生產) |
生產主體 |
專業人 |
非專業人 |
非人 |
核心特點 |
內容質量高 |
內容豐富度高 |
生產效率高 |
來源:杜雨、張孜銘等《AIGC:智能創作時代》,億歐智庫整理
自然語言處理(NLP)賦予了AI理解和生成能力,大規模預訓練模型是NLP的發展趨勢。NLP的兩個核心任務分別是自然語言理解(NLU)和自然語言生成(NLG),ChatGPT是NLP發展中具有里程碑式意義的模型之一。ChatGPT是OpenAI從GPT-3.5系列中的模型進行微調產生的聊天機器人模型,能夠通過學習和理解人類的語言來進行對話,還能根據聊天的上下文進行互動,真正像人類一樣來聊天交流,甚至能完成撰寫郵件、視頻腳本、文案、翻譯、代碼等任務。
億歐智庫:自然語言處理(NLP)發展歷程
來源:德邦證券,億歐智庫整理
AIGC發展可分為三階段,早期萌芽階段(上世紀50年代至90年代中期),沉淀累積階段(上世紀90年代至本世紀10年代中期),快速發展階段 (本世紀10年代中期至今)。
2.1 早期萌芽階段(1950s-1990s)
由于技術限制AIGC僅限于小范圍實驗與應用,1957年出現首支電腦創作的音樂作品,弦樂四重奏《依利亞克組曲(Illiac Suite)》,80年代末至90年代中由于高成本及難以商業化,因此資本投入有限導致AIGC無較多較大成績。
2.2 沉淀累積階段(1990s-2010s)
AIGC從實驗性轉向實用性,2006年深度學習算法取得進展,同時GPU,CPU等算力設備日益精進,互聯網快速發展,為各類人工智能算法提供海量數據進行訓練。2007年首部人工智能裝置完成的小說《I The Road》(《在路上》)問世,2012年微軟展示全自動同聲傳譯系統,主要基于“深度神經網絡”(Deep Neural Network,DNN)自動將英文講話內容通過語音識別等技術生成中文。
2.3 快速發展階段(2010s至今)
2014年深度學習算法“生成式對抗網絡”(Generative Adversarial Network, GAN)推出并迭代更新,助力AIGC新發展。2017年微軟人工智能少年“小冰”推出世界首部由人工智能寫作的詩集《陽光失了玻璃窗》,2018年NVIDIA(英偉達)發布StyleGAN模型可自動生成圖片,2019年DeepMind發布DVD-GAN模型可生成連續視頻。2021年Open AI推出DALL-E并更新迭代版本DALL-E-2,主要用于文本、圖像的交互生成內容。我國AIGC市場在2022年底引起較大關注,2023年開年企業端躍躍欲試。雖然行業仍處于起步階段,距離大規模證明和體系化發展仍有距離,但從資本的加碼到應用場景的探索,距離的縫隙有望逐步填補,同時,“模塊分拆+個性化推薦”的“泛AIGC”形式有望持續發展。
二、AIGC技術基礎
1.1 圖靈測試與AI的誕生
1950年,人工智能的先驅艾倫·圖靈發表了一篇劃時代的論文《計算機器與智能》,文中提出了著名的圖靈測試:“如果一臺機器能夠與人類展開對話(通過電信設備)而保證其機器身份不被識破,那么就可以認為這臺機器具有智能。”此外文章還預言了在未來可能創造出具有真正智能的機器。
億歐智庫:圖靈測試最初版本的示意圖
來源:公開資料,億歐智庫整理
雖然圖靈測試從理論上驗證了機器擁有智能的可能性,但AI正式發展成一門專業學科則是在1956年的達特茅斯會議,會議的組織者與參與者都是數一數二的科學家,包括約翰·麥卡錫,馬文·閔斯基,納撒尼爾·羅切斯特,克勞德·香農等。在這次會議上,“人工智能”的名稱與概念正式確立,因此這次會議也被視為AI產業的起點。
1.2 人工智能發展的三種流派
1.2.1 符號主義
符號主義認為人類的一切活動(包括體力活動和智力活動)都是符合某種邏輯的,所有信息都可以用各種符號表示,人類的認知過程就可以視為基于邏輯規則的,操作這些符號的過程。根據這種理論,如果電腦能自動執行和人腦一樣的規則和過程,那么就可以視為實現了人工智能。
1.2.2 聯結主義
聯結主義與符號主義幾乎是同時提出的,人工智能的關鍵不在于讓電腦等機器實現智力活動,而應該模仿人腦的結構。這派觀點認為智能是人腦細胞與神經元彼此連接成網絡共同處理信息的結果,如果能在電腦中模擬這種結構再實現人工智能自然也更輕松。早在電腦發明前的40年代,就有持這種觀點的科學家進行了數學建模,奠定了后來人工神經網絡和專家系統的雛形。
1.2.3 行為主義
與前兩種流派不同的,行為主義于上世紀80年代提出,它倡導“感知+行動”。這種觀點源于“控制論”,強調模擬人在控制過程中的智能行為和動作。但是限于時代和科技發展,行為主義直到上世紀末,隨著智能控制與機器人逐漸興起才引起重視。截至目前的AI發展,幾乎都是三種流派的結合運用。
億歐智庫:專家系統結構示意圖
來源:杜雨、張孜銘等《AIGC:智能創作時代》,億歐智庫整理
2.1 機器學習的概念
在1950年,圖靈的論文《計算機器與智能》中提出了“學習機器”的概念,現在已經發展成AI科學中的一個獨立分支。機器學習主要是設計和分析一些讓電腦可以“自動學習”的算法,是一類從數據中自動分析和獲得規律,并利用規律對未知數據進行預測的算法。從技術角度說,這一理論關注可以實現的,行之有效的學習算法(要防止錯誤累積)。
億歐智庫:機器學習理論示意圖
來源:公開資料,億歐智庫整理
2.2 機器學習算法的分類
2.2.1 感知器算法
機器學習中最容易理解與實現的是監督學習與無監督學習,前者就是感知器算法的典型案例之一,它也是人工神經網絡的基礎。簡要說來,監督學習是從給定的訓練數據集中學習出一個函數,再接收到新數據時就可以根據這個函數預測結果。監督學習的訓練集要求包括輸入和輸出,也可以說是特征和目標,訓練集中的各項目標都是人為標注的。
與之原理類似的,無監督學習就是目標沒有人為標注,但還保有訓練集且同樣要求輸入和輸出。
億歐智庫:不同形態的機器學習對比
對比維度 |
監督學習 |
無監督學習 |
強化學習 |
學習對象 |
有標注數據 |
無標注數據 |
決策系統 |
學習反饋 |
直接反饋 |
無反饋 |
激勵系統 |
應用場景 |
預測結果 |
尋找隱藏結構 |
選擇系列行動 |
來源:杜雨、張孜銘等《AIGC:智能創作時代》,億歐智庫整理
2.2.2 神經網絡算法
這種算法可以視為多層感知器,除了輸入輸出層外,它還加入了若干隱藏層。隱藏層中的神經元節點可以與輸入輸出節點相連,每條鏈接上都有各自的權重系數,最終形成一個網絡結構。之所以要加入隱藏層,是因為現實中很多情況都不是簡單的二元對立,總有這樣那樣的變化需要考慮。
億歐智庫:單層人工神經網絡示意圖
來源:公開資料,億歐智庫整理
2.2.3 強化學習算法
與監督和無監督學習更重視學習數據不同,強化學習是在給定的數據環境下,讓機器學習如何通過選擇一系列行動來達成長期累計收益最大化的目標。從本質上說,這種算法學習的是一套決策系統而非數據,它在很多游戲中都有運用。著名的阿爾法狗(AlphaGo)就結合了強化學習與專家系統,能連續擊敗多位人類圍棋高手,名噪一時。
億歐智庫:強化學習構成元素及其關系
來源:杜雨、張孜銘等《AIGC:智能創作時代》,億歐智庫整理
通過前面的介紹可以發現,不論哪種機器學習算法,對特征的選取和處理在模型訓練中是很重要的,但在很多情況下要直接提取合適且有效的特征是很困難的,如提取海量圖片和句子的特征。此時的機器學習就不能只局限于圖片或句子的某一特征,而是它們背后隱含的復雜關系。因此需要結合深度模型進行自動計算,而模型主要是深度神經網絡,這是一種更復雜的神經網絡。深度學習算法就是采用類似的深層次結構進行機器學習的算法,目前大火的ChatGPT就運用了這種算法。
億歐智庫:不同形態的機器學習關系示意圖
來源:杜雨、張孜銘等《AIGC:智能創作時代》,億歐智庫整理
三、AIGC商業落地分析
2022年9月的AI繪畫作品《太空歌劇院》獲得美國科羅拉多州博覽會的藝術比賽的第一名,當時有人預測若未來五年有10%-30%的圖片在AI的幫助下誕生,那么AI繪畫則將創造超過600億元的市場空間,若考慮到下一代互聯網對內容需求的迅速提升,則可能創造更大的市場規模。隨后OpenAI的ChatGPT一問世就多次刷新之前APP注冊用戶數量突破的紀錄,業內預測帶動的市場規模將破萬億。
2.1 產業上游:數據服務
不論AIGC產業如何發展,人工智能的分析、創作、決策能力都依賴海量數據。因此決定不同機器間能力差異的就是數據的數量與質量。
2.1.1 數據查詢與處理
通常來說數據庫有兩種模型,一種像湖泊,匯聚來自各地的水源而不作區分;另一種像倉庫,分門別類的存儲數據。近幾年在科技的推動下,現代數據庫一般都是兩種模型的結合,兼具二者的易用性、規范性等特征,還為用戶帶來降本增效、省時省力等特點。根據對其中數據的查詢與處理等時效性,涉及其中業務的公司可分為異步處理型公司和實時處理型公司。
2.1.2 數據轉換與編排
數據的處理主要涉及提取,加載和轉換。根據海外市場研究企業Grand View Research的數據,2021年全球數據集成工具市場的規模約105億美元,在未來十年將以年復合增長率約12%的速度增長。根據處理方式的區別,這種公司可以分為本地部署型公司和云端原生型公司。
2.1.3 數據標注與管理
不論哪種機器學習模型,都可以簡化為“老師教學生知識”,其中對知識點等數據就需要標注與管理,從而進行監督,最終形成各種不同的算法模型。根據Grand View Research的數據,2021年全球數據標注市場規模約為16.7億美元,在未來十年將以年復合增長率約25%的速度增長。根據公司業務拓展程度的差異,這種公司可以分為基礎型公司和擴張型公司。
2.1.4 數據治理與合規
在數字經濟時代,數據是和土地、人力、資本一樣舉足輕重的生產資料。因此就需要保證數據資產在管理時預先設置質量規范,在后期的訪問和調取時也要做到合法合規,因此這項服務也就成為各大企業的必需品。根據海外市場研究企業ReporterLinker的數據,全球數據治理市場規模約18億美元,預計未來幾年將以年復合增長率約22%的速度增長.根據服務交付模式,這種公司可以分為工具型公司和定制型公司。
2.2 產業中游:算法模型
算法模型是AIGC最核心的環節,是機器學習的關鍵所在。它包含三類參與者:專門實驗室、企業研究院、開源社區。
2.2.1 AI實驗室
算法模型在AI系統中起決策作用,是它完成各種任務的基礎,可以視為AI系統的靈魂所在。很多企業為了更好地研究算法并推動商業化落地,在內部都設立專門的實驗室,因此這種實驗室可以分為獨立型實驗室和附屬型實驗室。
2.2.2 企業研究院
一些集團型公司或企業往往會設立專注于前沿科技領域的大型研究院,下設不同領域的細分實驗室,通過學術氛圍更濃厚的管理方式為公司的科研發展添磚加瓦。
2.2.3 開源社區
開源社區對AIGC非常重要,它提供了一個共享成果、代碼的平臺,還可以與其他人相互合作,共同推動AIGC相關技術的進步。根據覆蓋領域的寬度和深度,這種社區可以分為綜合型開源社區和垂直型開源社區。
2.3 產業下游:應用拓展
任何優秀的科研成果都需要最終落地部署才能產生實際意義和價值,算法模型也不例外。在AIGC產業鏈的下游,可以將相關應用拓展到四個主要場景:文本處理、音頻處理、圖像處理、視頻處理。
2.3.1 文本處理
目前,文本處理是AIGC相關技術距離普通消費者最近的場景,也是技術較為成熟的場景,許多應用公司都會從多個維度出發,輔助業務拓展與商業化過程中。一般說來文本處理可以細分為營銷型、銷售型、續寫型、知識型、通用型、輔助型、交互型、代碼型。
2.3.2 音頻處理
此處主要介紹由語音合成技術來生成的相關應用,與視頻相關的將放在視頻部分說明。目前的音頻處理主要分為三類:音樂型、講話型、定制型,很多公司都專注于此。AI的應用將優化供給效率,改善整體利潤水平。
2.3.3 圖片處理
圖片的創作門檻比文字高,傳遞信息也更直觀,所以商業化的潛力自然也更高。隨著AIGC應用的日益廣泛,圖片處理也就從廣告、設計、編輯等角度帶來更大更多的機遇。圖片處理可細分為生成型、廣告型、設計型、編輯型。
2.3.4 視頻處理
隨著時代的發展,人們在視頻上的投入逐漸超出了在圖片上的,視頻也日益成為新時代最主流的內容消費形態。因此將AIGC引入視頻將是全新的賽道,也是技術難度最大的領域。視頻處理可以細分為生成型、編輯型、定制型、數字虛擬人視頻。
3.1 AIGC+資訊行業
在信息化時代,社會中充斥著各種資訊,同時這些資訊也有高標準、需求大、時效強等特點。自2014年起,AIGC已開始用于新聞資訊領域,因此資訊行業是AIGC商業化相對成熟的賽道。
億歐智庫:新華社寫稿機器人“快筆小新”
來源:公開資料,億歐智庫整理
3.1.1 AIGC輔助信息收集,打造堅實基礎
優質的新聞產出必定需要全面、高效、準確的信息收集與整理的基礎上。按照傳統的作業模式,工作人員需要親臨現場,通過各種手段才能獲得足夠且扎實的信息。現在的AI已經能對該環節高效賦能,例如科大訊飛的AI轉寫工具可以幫助記者實時生成文稿,自動撰寫提綱、精簡語句等,進而提高工作效率,保證最終產出的時效性。
除幫助獲取一手信息外,AI也可以幫助精確檢索二手信息,收集素材。在高性能的AIGC工具如ChatGPT出現后,就可以像常人對話一樣直接提問并獲得答案。雖然難免還是會有這樣那樣的問題,但作為工具而言,AIGC的意義已經非常明顯了。
3.1.2 AIGC支持資訊生成,實現高效產出
在資訊寫作等生成環節,基于自然語言生成和自然語言處理技術,AIGC已經逐步得到從業者和消費者的認可,因此有不少企業積極參與其中。以產出數量為例,與美聯社、雅虎等外媒合作的Automated Insights,其撰稿工具Wordsmith能在一分鐘內生成兩千條新聞,且單條質量可比擬人類半小時的作品質量。
除了速度驚人,AI在準確度方面同樣優勢明顯,能夠很好的避免人類的粗心或計算等錯誤,在保證質量的同時減輕人類工作壓力。這方面國內企業頗多,如新華社自研的寫稿AI“快筆小新”、騰訊公司開發的Dream Writer、百度公司和人民網合作開發的“人民網-百度·文心”大模型都是其中的佼佼者。
3.1.3 AIGC助力內容分發,緩解人類壓力
在內容分發環節,AI除了常見的個性化內容推薦外,也在逐步開拓全新應用場景,如虛擬人主播,以視頻或直播的形式發放內容,打造沉浸式體驗。如新華社數字記者“小諍”、央視網虛擬主播“小C”、阿里巴巴數字人“冬冬”、百度智能云AI手語主播等等,在未來,AI虛擬主播可能發展成媒體行業的標配。
3.2 AIGC+電商行業
自網絡電商出現以來,社會的很多方面都被改變了,電商企業既是網絡時代的受益者,也在推動社會發展進程中扮演關鍵角色。自十年前網絡直播出現,帶動帶貨模式變革以來,各大企業都在或多或少的面臨轉型問題。在數字世界和物理世界快速融合的當下,AIGC走在時代前沿,可以賦能電商行業的多個領域,可能帶來新一輪的行業變革。
億歐智庫:每平每屋云渲染效果圖
來源:公開資料,億歐智庫整理
3.2.1 AIGC助力商品建模,改善購物體驗
對比傳統的購物模式,網購的一個典型問題在于只能通過圖片了解商品,難以觀察到全貌,也讓以次充好的不法商家有機可乘。而AIGC技術可以通過視覺算法生成商品的三維模型,提供多方位視覺體驗,節省溝通成本,改善用戶體驗,促成用戶成交與轉化。
除了三維建模,AIGC還有更高級的應用方式,如阿里巴巴的每平每屋業務就利用AIGC技術,實現線上“商品放家中”的模擬展示效果。這種業務是將AIGC功能植入手機淘寶和每平每屋APP端,用戶用手機掃描家居環境讓AI生成商品模型,在手機即可預覽實物效果,進而改善電商家居的購物體驗。
3.2.2 AIGC賦能服飾電商,助力降本增效
AIGC可以為商家提供大量創意素材,電商廣告正是對創意營銷素材需求量很大的領域,阿里巴巴的AI設計師“魯班”就是應用于此。除了通用型廣告,AIGC在電商服飾領域用途更多。一般說來,服飾領域都采用“小單快返”的模式,即先小批量生產多種樣式的服飾產品投入市場,快速獲取市場反饋,對優質產品加大投入,在試出爆款的同時減小庫存壓力。但這種方式對產品圖片的需求量很大,如果有上千種服飾產品分別找模特再牌照修圖,無疑會耗費極大的時間和成本。
成立于2020年的ZMO公司就運用AIGC解決這個問題,商家只需在ZMO平臺上傳產品圖和模特圖就可以得到展示圖。借助AIGC,更多服飾相關的市場策略都可以低成本的實現。即使沒有專業模特,虛擬人模特及廣告也可以發揮作用,甚至還可以調整虛擬人的相貌來適配不同風格的服飾。
3.2.3 AIGC打造虛擬主播,提升直播效率
隨著概念的傳播,虛擬主播正日益成為許多商家的選擇。與真人主播不同,虛擬主播可以全天無間斷的直播,突破時間和空間的限制。2022年2月28日,經典美妝超級品類日活動開啟時,京東美妝虛擬主播“小美”就出現在蘭蔻、歐萊雅、OLAY等超過二十個美妝大牌直播間,開啟直播首秀。虛擬人不僅五官形象由AI合成,嘴型也可以利用AI精確匹配臺詞,動作靈活且流暢,營造出極佳的真實感,為用戶帶來與真人無異的體驗。
不過目前的虛擬主播更多的是與真人主播形成互補,或者為沒有直播能力的的商家提供服務,還不能完全替代真人。虛擬主播要獲得更強的交互能力,更好的與觀眾互動,做出實時反饋,還需要AIGC相關技術的后續發展。
3.3 AIGC+影視行業
隨著虛擬技術的逐步到來,對影視內容的需求也在爆發式增長。為了滿足觀眾日益刁鉆的口味和挑剔的眼光,影視行業正全力提高產量,迭代技術,導致整個行業的工業化程度逐漸提高,同時變得精細且復雜,同時人的局限性也逐漸凸顯。AI的應用無疑可以降本增效,讓行業回歸本真。
億歐智庫:海馬輕帆官網“劇本智能評估”頁面
來源:海馬輕帆官網,公開資料,億歐智庫整理
3.3.1 AIGC協助劇本創作,釋放創意潛力
通過對海量優質劇本的學習,AI能根據特定需求快速生成不同風格或架構的劇本,在極大提高工作者工作效率的同時,AI也在激發創意,幫助產出更優質的作品。事實上,將AI引入劇本創作的做法早已有之。2016年,紐約大學研發的AI在學習了幾十部經典科幻電影劇本后成功編寫了劇本《陽春》以及一段配樂歌詞。經過修改、調整后的成品只有區區八分鐘,內容也平平無奇,但《陽春》在各大視頻網站最終收獲的百萬級播放量依然證明外界對AI創作的興趣很大。2020年,GPT-3被用于創作一個短劇,再次引發廣泛關注。
通過這些早期試驗可以看出AI在劇本創作方面的潛力,但要真正將其轉化為生產力,還要AI更貼合具體的應用場景,做針對性訓練,并結合實際業務需求開發或定制功能。海外一些影視公司如Final Write和Logline等都偏向垂直式工具,國內的海馬輕帆公司深耕中文劇本、小說、IP等領域,也已經收獲百萬級用戶。
3.3.2 AIGC推動創意落地,突破表達瓶頸
雖然AI能幫助人類更好的釋放創意,但從劇本到熒幕仍是一段漫長的距離。從創意到表達的跨越,AI可以保駕護航,幫助人類化不可能為可能。舉例來說,當前勞動密集型的影視生產方式難以滿足觀眾對質量日益提高的要求。2009年上映的《阿凡達》令全球觀眾首次了解3D電影的魅力,此后沉浸式觀影體驗成了影視產業鏈上共同的追求。為了滿足這種追求,影視特技與應用呈現井噴式發展,但后期制作與渲染,復雜程度也都水漲船高,傳統的作業方式已經難以為繼,而AI技術就有推動變革的潛力。
從技術角度來說,影視特技行業的作業流程是極為繁瑣的,比如場景中的建模就需要從一草一木、一人一物開始,逐漸打造世界的雛形,再通過骨骼綁定和動作設計讓模型活起來,之后的定分鏡、調燈光、鋪軌道、取鏡頭等等無不費時費力,后期的解算和渲染等工作同樣如此。可以說在影視工作的每個環節都有大量重復性工作或等待時間,無形中拖慢了工作節奏。因此現在就有企業致力于解封流程生產力,比如優酷的“妙嘆”工具箱,在動漫中實時渲染,幫助工作者實時把握效果或做出修改,節省了大量成本,減輕人員負擔,目前已被多家國漫企業采用。
3.4 AIGC+教育行業
技術的飛速發展也將為教育行業帶來顛覆,但是相比其他行業的快速發展,AI在教育中的落地部署似乎也慢了半拍。這其實是由教育行業本身的性質導致的,它的參與者眾多,時間跨度很大,個體的差異性也很大,這讓解決邊界清晰、定義明確的AI難以適應。另外教育更注重人與人的互動和聯結,也沒有統一的理論模型,這都為相關AI的開發訓練和落地部署增加了難度。但AI在教育行業絕非毫無用處,以技術手段推動行業進步也并非癡人說夢。
億歐智庫:“小花獅”中文寫作智能輔導系統
來源:“小花獅”官網,公開資料,億歐智庫整理
3.4.1 AIGC助力學習者,走向無限
生活經驗告訴我們,從降生起人類就開始通過各種手段建立對世界的認識。識字前的手摸嘴咬、拳打腳踢,識字后的課本習題、書籍影視、實地體驗等等無不如此。但是不論怎樣,每個人的學習過程總會遇到這樣那樣的阻礙,而AI對學習者的意義就在于盡量擺脫種種束縛,最終從有限的自身走向無限的世界。
互聯網時代的教育,是將部分內容轉化為數字化形式并公開分發,助力資源流轉。現在由AI輔助甚至主導的制作,整理學習資料,降本增效是顯而易見的,資源的豐富度和易用性都將提升到新的高度。AIGC也可以在一些特定領域,如兒童繪本等,加速知識的生產效率并接入網絡,最終提供給用戶。通過補充有限的學習資源將促進教育公平,AI也助力教育資源的生產與分發。微軟在這一領域就布局頗多,如微軟亞洲研究院與華東師范大學合作研發的中文寫作智能輔導系統“小花獅”,借助自然語言處理技術,實時為學生作文評分并分析原因,從而幫助學生進步。
3.4.2 AIGC賦能教育者,減負提效
老話說“師傅領進門,修行在個人”,教育者作為領路人的重要性不言而喻,對他們而言,AI就如同手上的火把,更好的幫助學習者引燃心中的學習火種。從目前的社會發展現狀來看,教育者數量不足將會是長期現象,一位老師帶幾十位學生的“大班制”還將長期存在,在各種瑣碎的答疑解惑,書山題海中奔波,AIGC就可以解決此類問題。現在作業/試卷自動批閱技術已經獲得了廣泛應用,AI不但可以判斷對錯,還可以生成針對性的評語,教師的作業批改用時大幅節約,可以更關注學生的個性化發展。除了助力解決重復性問題,AI還可以延伸感知。如基于電腦視覺技術,AI可以實時分析學生當前的情緒和狀態等,幫助教師更好的了解情況。
通過對教育者的賦能,AIGC最終可以幫助實現教育的終極理想:因材施教,推廣個性化教育。盡管AI還有可能加劇信息繭房的風險,以及對傳統理念的挑戰,甚至將人機器化,但就目前來看,未來還是值得期待的,以人為本的教育還是可能實現的。
3.5 AIGC+醫療行業
對醫患雙方而言,AIGC的應用與推廣都是福音,比如AI預問診的應用。雖然病人與病情千變萬化,但總是有重復的地方,因此在預問診階段,AI就可以先了解患者的既往情況,讓醫生的診斷更有針對性,既緩解了醫生的工作壓力,也更好的服務了患者,醫院內病人扎堆排隊的現象也得以分流,可以說是一舉三得。2021年,復旦大學附屬眼耳鼻喉科醫院與騰訊醫療健康簽署合作協議,全面打造數字化醫院新標桿、新范式,深入推進醫院數字化轉型,在預問診等業務上快速落地部署。
對于傳統醫學的難點:心理疾病領域,AI同樣可以參與其中。相較于過去的與人對話,AIGC聊天機器人只是個軟件程序,用戶不必擔心隱私被泄露,況且還可以預置海量數據或知識模型,可以在更新迭代中保持冷靜與中立。成立于2021年的聆心智能就是這方面的代表,基于生成式大模型開發的情緒療愈機器人Emohaa,可以構建以生成對話為核心的交互式數字診療方案,通過對話與患者共情,及時提供情緒支持與心理疏導,促進患者心理健康。
億歐智庫:受疫情困擾的用戶與Emohaa對話
來源:公開資料,億歐智庫整理
3.6 AIGC+金融行業
金融業天然與數據和信息密切相關,各類公司都要從繁復的市場上搜集信息,并加以利用,創造價值。基于這樣的現狀,金融行業的信息化一直走在其他行業之前,具備數據質量好、維度全、場景多等特點,因此也成為了AI最早落地的商業化場景之一。
一般說來,AI在金融行業最常見的應用是通過機器視覺和學習的方式捕捉市場的實時變化,并利用實時數據進行分析,以此提高金融公司的財務分析效率與能力。類似的,AIGC在金融行業的應用則是以智能客服和智能顧問兩種,基于自然語言處理技術與客戶互動,此外還可以快速高效地完成一些人工難以完成的任務,改善服務體驗。2017年4月,富國銀行開始試點一款基于Facebook Messenger平臺的智能客服,美國銀行很快也推出了類似的智能助手Erica。國內金融行業的相關產業應用也較為成熟,多家公司或商業銀行都推出過自己的AI業務,如2022年工商銀行的“工小智”,郵儲銀行的半年報顯示數字化轉型成績斐然,這些都表明AIGC應用于金融行業的巨大潛力。
億歐智庫:百信銀行數字虛擬人員工艾雅(AIYA)
來源:公開資料,億歐智庫整理
四、AIGC發展機遇與挑戰
作為尖端科技,AIGC正迎來全面商業化落地部署的今天,因此展望未來趨勢自然有助于更好的建設明天。
1.1 大模型的廣泛應用
AI發展至今已走過多次寒冬與春天,每次交織都與AI的“通用化”與“專業化”分歧息息相關,可以說“通用化”代表著人類對未來的暢想,“專業化”則能帶來更好的落地部署形式,但不論哪種都經常遇見這樣那樣的瓶頸。
21世紀的前二十年,是“通用化”大模型提出并獲得發展的時代,簡單說來它是通過“預訓練大模型+下游任務微調”的方式,先讓模型在大量標記與未標記的數據中學習知識,在將微調后的模型遷移到其他場景中,進而極大的擴展了模型通用能力。現在隨著模型規模的增長也讓大模型的能力水漲船高,比如GPT-3就包含高達1750億的參數量。
大模型之“大”,除了參數規模龐大,數據量同樣不能小視。過去有人說“人工智能就是大量人工才能換來的智能”,這是因為當時的機器學習依賴數據標注,一旦轉換場景就需要重新標注。現在的機器學習多采用監督與無監督學習相結合的方式,例如“無監督訓練,監督微調”。此外也利用互聯網上的PGC,UGC進行訓練,以獲得更豐富的數據與更自然的表達。
不論模型還是數據,大模型都為AIGC賦予了充分的想象空間,隨著時代的發展,它也許在未來能獲得更多應用場景。
1.2 全新的仿人模式
在AI產業剛起步時,一種非常簡單的思路是讓機器模仿人的學習方式,這種模式一直都是AI算法的重要思路來源,因此AI也經歷了從推理到知識再到學習的變化。從起初的微觀,機械性模仿,到現在宏觀的認知模式借鑒,技術哲學也在隨著時代而發展。
在AI發展早期階段,三種流派中的“符號主義”占據主導地位,這派觀點簡而言之就是“人類的一切智能源于某種邏輯規則”。雖然當時它的確取得了一定成績但這種觀點缺陷明顯,最易于理解的莫過于人類的很多智力行為都沒有邏輯可言,因此這一流派很快被淘汰,由從更高的抽象層次定義AI的“聯結主義”取而代之。這種觀點在發展初期遇到了諸多障礙,現在的形式也與當初的出發點相去甚遠,但AI神經網絡的蓬勃發展也在一定程度上驗證了這種高度抽象化模式的可行。
從AI開拓到應用,從模仿人類的學習過程到模仿人類的認知方式,AI的發展也逐漸變得宏觀,隨著未來科技的發展,AI還會迎來飛躍式發展,為AIGC帶來更多可能性。
1.3 技術倫理成為重點關注領域
AI的發展堪稱具有革命性,但本質上來說,任何科技都有倫理問題,并且逐漸受到關注。很多AIGC從學術研究轉向產業研究的第一步就是探索如何從技術角度解決可能的技術倫理問題。
比較典型的是AI生成內容的危險性,比如2016年微軟發布的Tay,它可以通過推特學習社會信息并與他人互動。但是在僅僅一天后,Tay就開始說出一些種族歧視之類的偏激言論,因此微軟暫時關閉了Tay的賬號。但這些言論明顯是和網絡上一些有偏激言論的人互動后,被刻意教導出來的,因為微軟當時還沒有讓Tay了解哪些言論是不適當的。
目前很多企業都在運用一些技術手段避免類似事件的發生,如改善數據集,或者增加限制性條件,微調模型,讓AI可以更少的接觸不良信息,但依然難以根絕有人刻意誘導AI。比如最近大火的ChatGPT就曾寫過步驟詳細的毀滅人類計劃書,后來發現是有一位工程師在故意為之。
除了技術倫理問題的預防,在使用時的及時警告及緊急關停措施同樣重要且必要。AIGC應該自帶對生成內容的檢測機制,確保不被用于危害社會。一旦發現可疑舉動AI可以迅速反應,暫停服務,并且給出警告甚至自動報警。這不僅依賴技術發展,相關的法律法規同樣必不可少,AIGC技術倫理問題需要社會各界的共同努力。
目前AIGC相關的挑戰主要集中在版權、欺詐、違禁內容三方面。
2.1 AIGC的版權問題
從本質上說,AIGC是機器學習的應用。而在模型的學習階段一定會使用大量數據,但目前對訓練后的生成物版權歸屬問題尚無定論。對此問題,業內一般有兩種觀點。其一認為內容由學習數據集后生成,那版權就歸數據集作者;另一種則認為AIGC的生產過程是完全隨機的,沒有版權問題,生成的版權屬于AIGC作者或平臺,具體規則由平臺制定。目前的實踐中,各平臺的版權條例也偏向后者。
但無論哪種都會引擎一些原創版權作者的不滿,比較常見的說法是“吃作者的飯,砸作者的碗”。很多人的憤怒點在于,為什么AI基于自己創作的作品生成的新作品卻與自己無關?而且現行法律都是針對人類的行為規范而設立的,AI只是一種工具,不受法律約束與審判。即便證據充分,作者的維權之路通常也難言順利。不過對于AIGC與作者的關系將會隨著時代發展而逐漸清晰,界定也將更有條理性。
2.2 AIGC的欺詐問題
近幾年高科技詐騙手段層出不窮,AI經過訓練后也可以創作出以假亂真的音視頻,同時制作門檻也在日益降低,既可用于修改作品,也可用于制作全新內容。比如現在很常見的“換臉”“變聲”等功能,一旦濫用就可能導致正規渠道信息的公信力減弱,久而久之危害甚大。
現在已有部分詐騙分子利用“換臉”技術實施詐騙,也有不法分子惡意偽造他人視頻,再轉手兜售到灰色市場,用于賭博、詐騙、非法集資等犯罪行為,極大的增加了執法機構的成本投入。
2.3 AIGC的違禁內容
從技術角度說,AIGC完全取決于使用者的引導,在安全措施不到位的情況下,AI對惡意誘導會不加分辨或判斷,只會根據學習到的信息輸出新內容,例如Tay的極端或暴力言論。一旦被人利用惡意造謠生事,或者編造花邊新聞,除了對社會人物名譽和形象的損害,更會導致許多不必要的麻煩。這類新聞此前就屢見不鮮,無疑是應該被打擊嚴懲的。
AIGC作為內容生產的新范式,在推動數字經濟快速發展的同時也對國家相關法律法規機構及監管治理能力都提出了更高要求。很多國家在打擊違法犯罪的同時也在不斷完善法律法規,盡力避免潛在的社會漏洞。
版權聲明
本報告所采用的數據均來自合規渠道,分析邏輯基于EqualOcean的專業理解,清晰準確地反映了作者的研究觀點。本報告僅在相關法律許可的情況下發放,并僅為提供信息而發放,概不構成任何廣告。在任何情況下,本報告中的信息或所表述的意見均不構成對任何人的投資建議。本報告的信息來源于已公開的資料,EqualOcean對該等信息的準確性、完整性或可靠性作盡可能的獲取但不作任何保證。
本報告版權歸EqualOcean所有,歡迎因研究需要引用本報告部分內容,引用時需注明出處為“EqualOcean”。對于未注明來源的引用、盜用、篡改以及其他侵犯EqualOcean著作權的商業行為,EqualOcean將保留追究其法律責任的權利。
關于EqualOcean
EqualOcean上線于2018年11月,是一家專注于服務中國企業全球化和幫助海外企業及機構把握中國發展機會的商業信息與研究公司。EqualOcean堅信全球化的價值,以連接中國與世界為使命。基于這樣的使命,EqualOcean的團隊十分多元;既有全球視野,又是各自領域的“中國專家”。
針對中國做全球化的客戶,EqualOcean提供海外市場和行業研究、國際品牌定妝照、數據產品、海外資源搭建等服務;針對海外想把握中國發展機會的客戶,EqualOcean提供中國市場和行業研究、中國投資標的盡調、數據產品、中國資源搭建等服務。
EqualOcean服務過的客戶包括華為、阿里集團、字節跳動、拼多多、貝殼找房、達達、安客創新、Intel、貝恩資本、SAP、Advance Group等。
本文來自微信公眾號“億歐網”(ID:i-yiou),作者:史林,36氪經授權發布。