

前段時間,國內知名搖滾樂隊萬能青年旅店的作品《殺死那個石家莊人》在B站火出圈了。原因很特別:這首歌的每一句歌詞,都被一個名為“Midjourney”的AI生成藝術工具配上了畫面。
AI根據歌詞含義生成的圖片
自此之后,“AI作畫”像病毒一般在B站蔓延。很快,《七里香》《孤勇者》《加州旅館》《波西米亞狂想曲》等傳唱度頗高的歌曲,無一例外都成了AI作畫的絕佳素材。
更為出名的要數今年8月,一幅名為《空間歌劇院》的美術作品在美國科羅拉多州博覽會上獲得一等獎。隨后其作者Jason Allen透露,這幅作品是出自AI之手。
通過AI繪圖工具Midjourney創作而成的獲獎作品《空間歌劇院》
有趣的是,大賽評委并未對該幅作品進行改判,并直言:即使它是AI生成的作品,也依舊配得上這樣的成績。但顯然其他藝術家對此憤憤不平,認為這屬于高科技對創意的“剽竊”。
曾幾何時,人們對AI在藝術場景上的落地前景嗤之以鼻,認為AI只能完成一些依靠算法實現的計算工作,而藝術創作是上帝賜予人類的獨有天賦。而如今顯而易見,人類這一點最后的驕傲,也正在被AI“吞噬”。
近兩年,DALL·E 2、GauGAN2、Stable Diffusion、Midjourney等各種AI作畫平臺快速崛起。去年1月,OpenAI推出了DALL·E,僅僅1年后,其升級版DALL·E 2的升級版便以4倍的分辨率開始生成更逼真、更準確的圖像,不到3個月注冊人數就突破100萬。
火的不只是AI作畫,還有AI生成視頻。距離Stable Diffusion的正式開源還沒過去多久,Meta就帶來了新產品Make-A-Video,它能夠直接通過文字生成視頻。隨后,僅不到半個月,谷歌又帶著從文本到高清視頻的AI模型Imagen Video和 Phenaki進場(前者傾向于打造視頻質量,后者傾向于視頻的邏輯與時長)。
顯而易見的是,隨著人工智能生成能力的突破進展,內容生產已經從用戶生成內容(UGC)、專業生成內容(PGC),進入到人工智能生成內容(AIGC,AI generated content)時代。從AI作畫到AI視頻的層出不窮,預示著AIGC時代已然拉開帷幕。
對于AIGC,百度創始人、董事長兼首席執行官李彥宏在今年百度世界大會上解釋:AIGC就是“人工智能自主生成內容”。
在李彥宏的判斷中,AIGC將迎來三個發展階段:
第一階段是“助手階段”,AIGC輔助人類進行內容生產;
第二階段是“協作階段”,AIGC以虛實并存的虛擬人形態出現,形成人機共生的局面;
第三階段是“原創階段”,AIGC將獨立完成內容創作。
事實上,AIGC并非新鮮事物,此前已經被探討過很久,例如微軟小冰等人工智能作詩、寫作、創作歌曲的產品,但始終沒有出現大規模普及的標準化to C產品。
但為什么幾年后的今天,AIGC又開始集中爆發,引來科技巨頭爭相布局?
據量子位AIGC圖譜顯示,現在AIGC主要用在文字、圖像、視頻、音頻、游戲以及虛擬人上,里面涉及的初創企業大多集中在A到B輪,包括DeepMusic、倒映有聲、聆心智能、彩云小夢、rct AI、影譜科技、超參數等。
我國AIGC產業鏈劃分 圖源:《AIGC/AI生成內容產業展望報告》
而國內大廠百度、騰訊優圖、阿里巴巴、快手、字節跳動、網易、商湯、美圖等也都在AIGC領域有所投入。
例如,百度推出的AI藝術和創意輔助作畫平臺文心一格;騰訊打造的寫稿機器人“夢幻寫手”;阿里巴巴旗下的AI在線設計平臺Lubanner,幫助營銷人員生產Banner;字節跳動旗下的剪映以及快手云剪都能提供AI生成視頻;網易推出的一站式AI音樂創作平臺“網易天音”等等。
國外在AIGC領域更是神仙打架。既有科技巨頭谷歌、Meta、微軟等,也不乏AIGC的新晉獨角獸Stability AI、Jasper、OpenAI等。并且科技公司很快又將AI作畫的熱度延續到了AI生成視頻。從Meta宣布由文本到視頻的系統Make-A-Video,到谷歌宣布的可以從簡單的文本提示中生成高清視頻的Imagen Video和Phenaki,AIGC在海外迅速發展。
國內外各大公司紛紛入局AIGC領域的一個重要原因,就是文本-圖像生成模型Stable Diffusion的正式開源。
此次開源,Stable Diffusion開放的不僅僅是程序,還有其已經訓練好的模型,這意味著后繼創業者能更好的借助這一開源工具,挖掘出更豐富的內容生態。Stable Diffusion的開源,為更廣泛的C端用戶普及起到至關重要的作用。
其次,AIGC的爆火,也得益于生成擴散模型和多模態預訓練模型等技術的快速發展,在圖文生成效果上有了顯著進步,讓AI可以快速、靈活地生成不同模態的數據內容。
在2021年之前,AIGC還主要是文字生成。而新一代的模型可以處理任何內容格式,包含文字、語音、代碼、圖像、視頻、3D模型、機器人的動作等等。比如近期以DALL-E2和stable-diffusion為代表的AIGC技術在圖文生成效果上,能夠廣泛應用于內容生成、編輯和創作等領域。
快手Y-tech AI技術中心負責人萬鵬飛告訴「甲子光年」,生成式技術的一大優勢在于,它不但能夠在工具層面提升內容獲取與編輯的效率,還能在創意和策略層面為人們提供參考。(注:生成式技術:即利用現有文本、音頻文件或圖像創建新內容的技術。通過生成AI,計算機檢測與輸入相關的基本模式并生成類似內容)
與此同時,如今各類社交和流媒體平臺的普及,也驅動著內容生產方式的演變。AIGC作為繼PGC、UGC之后的新一代內容生產方式,其中的底層原因肯定是需求驅動,隨著人們對內容的需求越來越旺盛,內容產業也必須去升級迭代。這讓AI從以往輔助內容創作的工具逐漸演變成可以直接創作,并且在寫作、繪畫、作曲、設計等諸多創意類上已經能夠勝任。
最后是外部環境因素,在經濟低迷時期,科技行業會選擇相應收斂開支,并將重點放在像是人工智能商業化這類更務實的地方。
疫情之下,企業更加強調降本增效,人工智能生成技術因此成為創造者和團隊在增強自身創作能力時的首選工具。所以當市場低迷需要內銷時,這項業務將加速爆發。正猶如每一次金融危機時,都會有一些做娛樂性的互聯網公司出現。
國際咨詢公司Analysis Group發布報告稱,到2031年,元宇宙對全球GDP的貢獻可達到3萬億美元。圍繞虛擬世界、元宇宙基礎設施建設而來的數字人生態和圍繞互聯網新媒介構建的音樂生態已初具雛形,AI技術規模化應用落地,也只是時間問題。
一個產業爆火后,最先嗅到“芬芳”的總會是資本。
10月19日,主打文字生成的AIGC公司Jasper.ai宣布完成了1.25億美元的A輪融資,估值達到了15億美元,而Jasper AI從產品上線到現在也就18個月時間。
而就在Jasper.ai宣布融資的前一天,AIGC領域的另一龍頭公司Stability AI則宣布獲得1.01億美元,來自Coatue和光速的投資,公司宣布會繼續研發用于生成圖片、語言、音頻、視頻和3D的AI生成模型。投后估值達到10億美元,成為新晉獨角獸企業。
不過,相較于海外市場已經出現數家獨角獸的情況,中國創投圈還沒有真正在出手上“熱”起來。截至目前,國內可以公開查詢到進入融資階段的AI作畫初創公司,只有在10月份獲DCM中國數百萬美元的天使輪投資的TIAMAT。其他該領域的公司或平臺如6pen、draft.art、大畫家Domo、盜夢師等,均未進入融資階段。
資深投資人高寧,最近一直在關注AIGC領域,他在與「甲子光年」進行交流時表示,AIGC確實是資本市場近期所重點關注的領域。
他認為如果在AIGC領域創業,最好是做全球市場,因為在這里面少不了中文或者是中國元素的文化載體,會誕生很多機會。
中國內容產業規模龐大,領域眾多,有超過5億用戶的中國網絡文學市場、千億的國漫產業、市場規模破萬億的中國廣告行業以及3萬億的中國傳媒產業等。
在當前新冠疫情反復的背景下,對數字內容的需求也更加強烈,紅杉資本預計生成式人工智能將“產生數萬億美元的經濟價值”。
實際上,近年來隨著全球信息化水平的加速提升,人工智能與傳媒業的融合發展不斷升級。AIGC作為當前新型的內容生產方式,已經率先在傳媒、電商、影視、娛樂等數字化程度高、內容需求豐富的行業取得重大創新發展。
除此之外,在推進數實融合,加快產業升級教育下,金融、醫療、工業等各行各業的AIGC應用也都在快速發展。
人工智能生成內容(AIGC)應用視圖圖源:中國信息通信研究院
總體來說,在當前數字經濟與實體經濟的合并、虛擬自我和真實自我合體的趨勢下,AIGC發展的前置條件已經具備,這極大帶動了相關產業的發展。
-
娛樂&影視產業:AI助力視頻劇本創作、打造虛擬偶像IP等
從今年9月以來,Meta和Google先后公布了自己在AIGC最前沿領域的最新成果。尤其是Google團隊推出的AI視頻生成模型Phenaki,能夠根據文本內容生成可變時長視頻的技術,在公布的DEMO中,Phenaki基于幾百個單詞組成一段前后邏輯連貫的視頻只需兩分鐘。可見,Phenaki瞄準的是長視頻制作。Phenaki的出現,勢必會對未來整個視 頻行業造成沖擊。
同時,運用AIGC技術能夠有效激發影視劇本的創作靈感,AI虛擬數字人也能夠出現在影視劇本中扮演不同角色,在短劇中極大地提升影視產品的后期制作質量,幫助影視作品實現文化價值與經濟價值的最大化。
當前AIGC在電商行業的應用已經比較廣泛,通過打造虛擬主播,電商能為觀眾提供24小時不間斷的貨品推薦介紹以及在線服務,商戶直播門檻因此降低。
除將數字人用于電商輔助帶貨之外,數字人還被用在諸如影視創作、動畫、VR\AR\MR、電視主持、虛擬偶像等場景。
「甲子光年」了解到,在AIGC領域,有不少企業選擇將落地場景放在數字人上,這里面既有像是亞馬遜、谷歌、蘋果、微軟小冰、百度、騰訊等中外互聯網大廠,也有不少創業公司。
數字人作為近兩年才開始出現的賽道,競爭遠還沒有像是TTS (語音合成技術) 那么“卷”。當前國內做數字人的企業,大多還在初創階段,這在一定程度上也意味著,創業公司的機會或許潛藏在更加垂直的應用賽道之中,找準方向十分關鍵。
倒映有聲是一家提供虛擬數字人技術解決方案的公司。其通過神經渲染技術,打造了眼科醫生陶勇的AI數字分身,實現AIGC在健康科普場景的落地。
憑借輸入文字即可生成科普音頻/視頻的內容生產方式,神經渲染技術充分解放了醫學專家的真人勞動力。相對于傳統的3D建模方式,神經渲染技術可以更快速地創建AI數字分身,降低時間成本與財務成本,這讓AI數字人擁有了更廣泛的落地場景,也更容易向C端用戶去下沉。
據萬鵬飛介紹,未來1-2年,數字人+AIGC是比較有前景的商業化方向。數字人是一種新的人機交互和人人交互模式,AIGC是一種新的內容生產模式,兩個概念可以互相組合并解鎖眾多有價值的應用場景,可廣泛應用于娛樂直播、電商直播、視頻制作、數字員工、虛擬偶像等領域。
在AIGC加成下,各行各業的創作者經濟迎來了新的增長點。比如有聲書的配音行業,影視配音行業、動漫制作畫師,或者是一個營銷廣告公司的設計師,都可能是未來AIGC的主要使用者,來輔助自己的產業去做效能優化。
另外,很多媒體機構開始用AIGC生成的圖片用作雜志封面,一些作家或者小說家也能夠用AI作畫來為自己的文章或者小說配圖。《經濟學人》前段時間就用Midjourney生成的圖片做了雜志封面,AI生成圖片,還將進一步在各行業普及。
經濟學人用Midjourney生成的圖片做的雜志封面
在AIGC領域,目前并沒有多少公司在垂直賽道里深耕。除去已經相對成熟的金融零售和客服賽道,心理健康是與AIGC深度融合的最具潛力的行業之一。但心理健康賽道雖然大,由于天花板高的原因,大部分AIGC公司都因受到了專業領域融合的限制而難以發揮技術優勢,行業內高質量解決方案供給嚴重不足。
實際上,通過AIGC的技術和手段,醫療行業能夠在供給側實現標準化地有效干預和治療。例如可以利用虛擬人來模仿心理治療師或是醫生助手,用AI生成的對話與用戶建立起深層次信任的基礎,再通過角色化、個性化的溝通去達到治療效果。
由清華大學計算機教授黃民烈所創辦的聆心智能,是典型的AIGC企業,深耕心理健康行業多年,沉淀了海量的中文對話數據,基于大模型在情緒支持、傾聽陪伴、角色扮演、開放閑聊等多個層面構建了特有模型框架,通過以生成式對話模型為內核驅動、其他AIGC能力為表現形態的產業應用邏輯切入心理健康賽道。
其研發的對話機器人“Emohaa”,主要用于構建以AI生成對話為核心的交互式數字診療方案,讓機器人能夠表達對用戶的理解和共情,并進行及時的情緒支持和心理疏導,來達到好的治療恢復效果。
游戲行業能夠利用文本生成能力創建豐富有趣的游戲NPC能力。根據游戲中的不同場景,來設置NPC的對應話術,所有NPC的回答都能夠根據設置詞語的提示實時生成。另外,將AIGC用于一些微觀素材創作上,也是短期可行的機會。
不過,從當前AIGC在產業中的發展來看,最大的一個問題在于行業尚未建立起明確的變現方式。
以寫作機器人、自動配音、AI作畫等場景為例,大部分產品仍處在流量吸引的免費試用階段,收費空間較小;且大多還是輕量級的工具產品,不具備更大的內容場景。能否在互聯網流量相對穩定的前提下有效接觸C端用戶,達到好的活躍度和留存率,依舊是一項挑戰。
但這也為AIGC帶來了廣闊的成長空間,使它可以朝著社交方向或者內容社區更大的產業方向去走。
當前,無論是巨頭互聯網公司還是創業公司,都在循序漸進地摸索AIGC方向,當前多集中在感知層面的AIGC方向,去探尋這上面的商業化落地場景。
黃民烈告訴「甲子光年」,從產業的角度看,雖然國外走的相對靠前,但是一些比較典型的公司,主要還是做視覺感知智能層面居多,比如文到圖的生成或者文到視頻的生成。
黃民烈認為,未來AIGC領域的商業化可能會朝著三個層次方向去發展。
第一層次在于感知層面,即直接簡單的、能夠帶來感官刺激的東西。前期更多還是聚焦在聽視覺層面的感知智能上,包括AI作圖作曲、AI視頻、3D等;第二層次會來到認知層面,跟對話、寫作、糾錯、語言生成相關,會逐漸成為趨勢;第三層次則是發展出面向特定行業的新生態鏈,為整個行業提供高質量的完整解決方案。
基于當前的現狀,黃民烈表示,未來AIGC可以考慮跟特定的場景和具體的應用的方向去關聯,即朝著場景和行業結合的方式去發展,這能讓AIGC成為一個很好的輔助工具與賦能手段。
從現在最火的AI作畫來看,正在不斷壓低作畫創作門檻,只需點擊進入生成AI作畫官網的服務器,然后在聊天框里輸入或者調用“ / imagine”選項,輸入一句你腦海中想要描繪的場景文字即可。
AI作畫強調對新內容的生成,而非對歷史數據的輔助分析和決策。畫師可以用其輔助作畫,輕小說家用其繪制人設,獨立的游戲制作人也能夠通過AI作畫大幅降低成本。
在文心一格平臺輸入“也無風雨也無晴”生成的像素風格作畫
高寧認為,圖畫本身就是一個偏殺手級的應用,雖然聲音或者文字的類型商業化不一定做得差,但是如果從傳播效應來講,圖像所帶來的視覺沖擊力,也是真正把這個應用普及起來的原因之一。
同樣,晨山資本吳文超也認為,互聯網時代開啟后,營銷是流量企業最主要的變現方式之一,而承載營銷一個重要方式便是更加具有視覺沖擊力的圖文、視頻等富媒體內容。
從AI生成圖像再到AI生成視頻,因為要用到大量數據訓練模型,對算力要求呈指數級的提升,這讓能夠提供GPU算力的芯片制造商嘗到甜頭,所生產的先進圖形處理器能夠成為訓練和部署人工智能模型的理想選擇。
就在不久前,英偉達首席執行官黃仁勛公開表示,生成性人工智能是該公司最新芯片的一個關鍵用途,這些程序可能很快就會“徹底改變通信”。
同時,人工智能生成公司產生的大量內容,也將推動云計算產業的發展。
云廠商希望企業在它搭建的平臺和框架上面做應用。據悉,Meta和谷歌已經聘請了該領域諸多專業人才,希望將這種先進技術整合到公司的產品中;而微軟將在其Office套件和Azure AI中添加DALL-E ,Adobe則計劃將生成AI工具添加到Photoshop中。對于中小型公司來說,在使用云服務的同時,也能夠利用這些平臺提供的AI系統完成自己所需要的功能架構。
隨著人工智能技術的發展,資本玩家加速落地各類AI應用,虛擬數字人、自動化應用等產品層出不窮,在“AIGC+藝術”領域,AI生成圖片、文字、音頻、視頻等內容也漸漸滲透進文學、繪畫、短視頻、教育等多個場景,進一步拓寬其商業化空間。
但從產品角度,AIGC的早期階段出現的眾多內容生成利器,由于使用門檻低,更多還是面向C端的產品,但大部分玩家僅僅是為了娛樂,難以轉化成真正的付費用戶。而如果將AIGC用在B端讓其輔助工作流程或實際提高工作效率,不管是用來寫營銷文案還是圖片生成,能夠產生價值,才能成為一個可持續的商業模式。
另一個難點在于,即便各家AI作畫公司制定了面向to B或to C的計算標準,短期內也很難靠作畫工作賺錢,原因在于模型的訓練成本太高。而國內很多作畫平臺采用的是自研模型,這就給AI作畫工具增加了訓練成本,對很多初創企業來說,這是一筆不小的成本。
而對于企業來說,本質永遠是盈利。階段性的人工智能成果,只有具備大規模商業應用,才能給企業帶來價值,否則也只能是停留在圈地自嗨的模式。
吳文超表示,現在無論國內外的獨角獸還是創業公司,AIGC在商業變現上還沒有一個成熟的商業模式,這跟原來工業領域驅動的技術有很大差別。
“比如原來CV有特別明確的場景就是要做人臉識別,即使AI沒出現,它也有人臉識別的場景,只不過有AI之后,能夠讓人臉識別變得更加精準。”
但是從內容生成的角度來講,本質上還是一個富有創造力的行業,以前工業領域并沒有這樣一個訴求,大家普遍認為無論是做設計還是3D模型都需要人工,而不是工業界內生的需求。
吳文超形容稱,現在倒過來拿著技術去找需求,有點類似拿著錘子去找釘子。這就意味著AIGC的發展比起原來CV領域的工業需求倒逼推動,更在于是人為的推動,所以商業模式就會顯得不夠清晰。
每家公司雖然模型架構不同,但技術上卻是大同小異。下一步怎樣產品化、怎樣做好社區、如何將用戶的反饋更好的落到模型上,以及同時做一些to B細分場景的落地,才是真正和競爭者之間產生區別的地方。
近年來,在大數據、大算力的支持下,人工智能的研究也被推向了一個新的高度,Jasper的首席執行官Rogenmoser認為,“世界上的每一個工具都將以某種能力內置生成人工智能。”
從技術的發展演變來看,每一次技術的變革都會交織倫理上的挑戰。當前,人工智能的法律法規和倫理準則規范并未成型,倫理問題將成為人工智能一個很大的發展阻力。
圖源:Getty Images
目前,關于AIGC的倫理問題主要體現在無法確權以及版權爭議上。雖然技術的發展與革命一定程度能帶來內容的繁榮,但市場收益來源于市場交易,市場交易的基礎在于確權。如果AIGC無法確權,一方面會導致侵權行為得不到有效解決,另外也會相應減少資本對AIGC領域的投入熱情。
在版權爭議上,已經能夠看到一些抄襲者的出現,試圖利用Stable Diffusion的開源技術去做一樣的產品化。此外,對于AI作畫所生成的圖片是否在模仿畫師風格上,也難以界定。
而隨著AI技術的發展進步,未來還會不斷提升自動化水平,也將會和現實結合的更加緊密,AIGC領域爆炸式的增長,會加劇數據隱私以及所有權的歸屬問題。
從目前探討最多的AI作畫、AI生成視頻來看,隨著生成工具逐步走向大眾和商業市場,內容造假的風險越來越高。在國外的諸多NFT平臺上,直接掛AI生成作品已經賣的泛濫無邊。而國內,在淘寶、閑魚等平臺,搜索AI作畫,會發現有很多人在利用AI作畫來謀利。但由于目前AI作品在版權法律層面還未有明確界定,所以讓其依舊游走在灰色地帶。
為此,文心一格的相關負責人告訴「甲子光年」,由于目前AI已經能生成和人類作畫質量不相上下的圖像,這就需要支持具有獨創性的繪畫作品依法享有版權。建議針對AI作畫在內的創新業務應用的治理,基于不同的細分應用場景和產品模式特點,來分類分級制定落地規則。
但由于行業還很新,以及各國的政策不同,每家AIGC公司在面對AI創作的版權問題上,各自處理方法也千差萬別,因此,全世界當前還都處在一個博弈過程之中。
比如在安全性上,Open AI直接過濾掉很多安全詞,禁止出現一些特定人物以及政治相關;Getty Images禁止用戶將生成式AI圖像上傳到其庫存圖像數據庫中;TIAMAT和Midjourney則一致選擇了在素材庫中使用無版權的圖片,規避版權糾紛。
對于AIGC面臨的倫理問題,黃民烈表示這是技術發展路徑上不可避免的一個問題,這是因為現在的大模型AI能力它很容易做到記住和模仿,但無法進行創造,因此就會不可避免地會面臨一些版權,甚至是反人類的倫理問題。
但是從整個技術發展的角度,還是要去樂觀看待,他表示可以讓技術發展一段時間,讓技術暴露問題,再想辦法從政策法律法規的角度去約束和規范它,形成一個更好的發展。總體目標還是秉持著讓技術和AI為人類服務這一前提下,倫理問題未來是可以解決的。
OpenAI現任CEO Sam Altman也曾在推特上表示過,“AI將對世界帶來巨大變革,而我們應該改變經濟系統以適應它”。AI仍在加速發展,未來還會碰到更多邊界,法規也會不斷進行完善,AI發展與法規會始終磨合。
正如同硬幣的一體兩面,不否定AI技術的發展讓人類更有生產力和效率。那么,就讓子彈再飛一會兒。
![AIGC爆火背后,錢都被誰賺走了?]()
微信掃一掃 使用小程序
: , 。 視頻 小程序 贊 ,輕點兩下取消贊 在看 ,輕點兩下取消在看
本文來自微信公眾號“甲子光年”(ID:jazzyear),作者:周曉莉,36氪經授權發布。