見實|一覽科技陳錫言: AIGC 新浪潮,不要怕,只是技術性調整

?時下,AIGC技術正在以驚人的速度在各個行業中爆發,這種新型技術正在帶來一場全新的行業變革大浪潮。越來越多的企業投入到新一輪的AI技術應用與研發當中,并取得了一定進展。預計未來它將對商業、崗位和職業造成更廣泛和深刻的影響。
為了更好地了解未來AIGC時代的商業新機遇和崗位新趨勢,并為行業提供更準確、更實用的建議,一覽科技聯合創始人&CTO陳錫言就《AIGC新浪潮,不要怕,只是技術性調整》進行主題分享。
陳錫言認為,大模型不同的發展路徑也可能有不同的涌現結果,當參數達到一定規模的時候,涌現是怎么發生的,以及如果繼續擴大參數規模是否能讓效果越來越好,對人類來說還是一個待解決的問題。
他還表示,AI和AIGC的確會改變我們的生活和工作,這幾乎是不可避免的,但不要怕,這只是一次技術升級,或者叫內容創作升級。作為內容從業者,我們應該對AIGC技術保持開放的態度,學會利用AIGC工具來提高工作效率,投資自己,提升自己,解決問題,提供價值。
以下為陳錫言分享內容全文:
大家好,我是一覽科技聯合創始人&CTO 陳錫言。
我名字的三個首字母分別是 “C”,“X”,“Y”,每個人都會喜歡和自己名字有關的東西,我也一樣,后來我就真的成為了一名程序員。
在十幾年的職業生涯中,我一直都在做著同一個行業,它就是網絡視頻。從網頁端到客戶端,從 PC 端到移動端,從影視劇到短視頻,從橫屏到豎屏,從 PGC 到 AIGC,從一小時到 15 秒,我親身經歷了這個行業的整個發展歷史。
我此次的分享主題是《AIGC新浪潮:不要怕,只是技術性調整》
首先介紹一下AIGC的概念,AIGC是一個相對于PGC和UGC的概念,人工智能生產內容。
早期互聯網以PGC為主,都是由專業機構生產和發布信息,例如Yahoo,搜狐等等,他們都是單向發布內容,普通用戶只能單向接收內容,總內容量也比較少。
在互聯網中期,出現了普通用戶貢獻內容。比如貓撲天涯,也有QQ微信,再到后來的公眾號、微博、抖音。一方面是動態頁面技術的發明,另一方面是制作工具的快速發展,讓創作和發布成本越來越低,內容生產質量卻越來越高。這個質量達到什么水平呢?一些專業電視工作者投身于短視頻創作,而一些自媒體制作的短視頻可以進入電視臺播放,也就是說,優質的自媒體短視頻已經達到了電視臺的標準,所以有人把這叫做PUGC,也就是P和U之間的界限越來越不明顯了。
那么現今的互聯網,機器作為區別于P和U的第三方也可以大量生產信息和內容,這里面有兩個含義。
一、機器聽從人的命令生產內容。
二、機器直接生產內容。
未來會有越來越多的信息和內容是由人工智能生產的。
想象一下,會不會已經有一臺計算機,它會自動在自媒體號上發表文章,然后根據閱讀反饋數據,調整選題,調整內容,它能夠自學習,然后讓后面的發表數據表現更好,那它真的是一個從零開始的AI大V。
最近AI技術的發展,讓我們重新看到了AIGC的可行性,肉眼可見的AI已經能做很多我們人類的工作了。AI是怎么突然變得這么強呢?
這還得說到大語言模型,ChatGPT讓人類看到了AGI的可能性。AGI是通用人工智能的意思,表示機器可以完成各種不同類型的任務。比如ChatGPT并不是為法律工作特別訓練的,但是它卻可以非常好的完成法律任務。這就是AGI的表現。
大模型有四大: 數據量大,運算量大,參數規模大,花錢規模大。
GPT1和GPT2能力其實并不好,但是GPT3參數達到1750億的時候,突然涌現出許多強大的能力,可以學習和模仿人類的思考過程。
OpenAI做出了一個典范,在OpenAI之前,沒有一個人愿意相信原來大力花錢真的可以出奇跡。
大模型不是一個新技術,只不過沒有人愿意為一個不確定的目標,投入如此之大。就像哥倫布發現新大陸,他告訴人們一直劃一直劃就會有收獲,后面的人從此愿意為此投入。當然大模型也不是全是因為花錢,算力和數據量也恰好達到了一個臨界點。不同的發展路徑也可能有不同的涌現結果,當參數達到一定規模的時候,涌現是怎么發生的,以及如果繼續擴大參數規模是否能讓效果越來越好,對人類來說還是一個待解決的問題。
大模型的涌現主要帶來以下方面的變化:
-
泛化能力:大模型能夠在訓練數據范圍之外的情況下生成高質量的內容,這被稱為“泛化能力”。這使得大模型能夠應用于廣泛的任務和領域。
-
語言生成能力:大模型能夠生成流暢、準確、富有創造性的語言,這使得它們在自然語言處理、文本生成、機器翻譯等領域有著廣泛的應用。
-
交互性能力:大模型能夠理解人類的自然語言輸入,并產生符合語境的響應,這使得它們在聊天機器人、語音助手等領域有著廣泛的應用。
感覺AI這么強,會很快搶走我們的工作,尤其是內容創作者對AIGC產生很多的擔憂,下面我們看看AIGC對內容創作產業了哪些的影響
3.1. 取代部分文字工作者和設計師的工作
它將改變內容創作的工作方式,如果僅僅是簡單可重復性的工作,那肯定是要被取締的,具有創造力的做作AI取代不了。每位編輯或者設計師有自己的風格,這種風格的形成需要很長時間,這也是優勢。但在處理復雜任務時,我們可能就需要具有各類不同優勢的人組成的一個團隊。但如果出現一種AI工具,它具有各種各樣的風格和能力, 那么有了AI輔助,效率和風格的廣度會大大提高。
3.2. 取締大部分快消品內容生產
大部分互聯網內容不是作為藝術品存在,甚至不是作為信息存在的,它們是一種快消品。制作快,生命周期短,在短暫的生命周期內爭取最大的流量是他們生命的意義,爆款率極低,只能靠數量爭取更多流量。所以這類業務KPI一般都會是成本控制,這類工作大概率會被AIGC所取締。
3.3. 促進版權法升級
之前在圖庫中找到一張完美的圖片并不容易,而且費用還是很貴的。現在AI工具可以直接從文本內容生成對應的圖片。AI作品的版權還處于灰色地帶,這是版權法最高級的部分。但這個狀態不會太久,當未來越來越多的人使用時,這部分法律會得到完善。
3.4. 內容爆炸
我們并不想讓他發生,但是一定是要發生了。互聯網內容數量可能會至少是現在的10倍甚至更多,但總人數和總時間只有那么多。如何分辨內容是由AI生產還是由人類生產,以及如何選擇更有價值的內容來填充有限的時間,將成為所有人的難題
AI正在影響我們的工作和生活,它很強大,但我們也要了解它具有哪些局限性。
4.1 內容風格有限
目前,AIGC最適合生成八股文等特定風格的內容,而對于更加創新和多樣化的內容,AIGC的表現可能不盡如人意。AIGC模型只能基于已有的數據進行訓練,而且數據的質量和數量對模型的性能有著決定性的影響。內容創作需要創意,優秀的藝術家需要形成自己的風格,這一點AI很難做到。
4.2 有限的知識
ChatGPT的知識只到2021年,目前還無法做到知識和信息實時更新。AIGC模型可能無法獲取到一些人類知識領域的新發現和進展。AIGC模型雖然可以生成新的內容,但其缺乏真正的創造力和人性化,無法創造出從未出現過的完全新穎的概念或想法。
有人曾提出一個問題:如果500年前,就發明了ChatGPT,是不是人類永遠不知道地球是圍繞著太陽轉的。這是一個值得令人深思的問題。
4.3 缺少驗證和實施的能力
前幾天有新聞說AutoGPT已經可以開公司了,但都是停留在紙面上的,真正實現還很遙遠,現在的實際情況是,訪問網站就很厲害了,除非雇人去辦,否則怎么把真實公司注冊下來呢?麥哲倫船隊繞了地球一圈,才證明了地球是圓的,這并不能靠AI系統得到。科學發展需要大量的實驗,AIGC跨越不了。
4.4 可信度問題
我讓ChatGPT給我規劃一條路線,他大概率會一本正經地胡說八道,AIGC模型的生成結果可能存在誤差和不合理的情況,需要進行人工審核和驗證,以確保其準確性和合理性。嚴格確定性內容不適合由AI生成。
4.5 數據偏差
AIGC模型需要大量的數據集進行訓練,但這些數據可能存在偏差和隱私問題,如性別歧視、種族歧視等。因此,需要加強數據管理和隱私保護,建立透明度和問責制機制。根據公開資料,GPT3的訓練集大部分來自英語,漢語預料可能不超過0.3%,所以很多價值觀一定是偏西方的。這也是受訓練數據集干擾比較大,且不容易被解決的問題。訓練數據集需要非常長期的積累,可能真的不是直接砸一大筆錢就能解決的問題。
4.6 缺乏情感
內容是需要注入情感的,這是一個有爭議的問題,AI能解決已知的邏輯,比如色彩是什么情緒,語音語調表示的情感,文字表示的情感。但更高級的內容是一種情緒的組合,這是AI無法感知到的,也缺少足夠多的數據集,因為同一個內容,一萬個人有一萬個感受,所以在數據集中很難被標注出來。
4.7 難以控制
AIGC模型的運作方式是基于訓練數據的自動化過程,因此很難對其生成的內容進行精確控制,可能會產生一些不適當的內容,引發社會或道德問題。比如,AI繪畫雖然可以生成超越想象力的精美圖片,但我認為仍然是一種“先開槍,再瞄準”的結果,因為我們腦海中的畫面,轉化成自然語言就是一種信息缺失,傳遞給AI理解又是一種信息缺失,可能最終AI畫出了一幅很好看的圖片,但早已經不是我們腦中的那幅畫面了,過度依賴AIGC會讓我們丟失很多腦中的景象。自然語言不是一種確定性的人機交互方式,而且為了讓AI變得越來越強,它就必須產生新的隨機、學習和反饋,目前大部分AI系統是不區分開發環境和生產環境的,生產環境的數據是開發環境最好的飼料。所以具有一定概率產生不合適內容,也是AI系統必要的工作之一。
4.8 AI無意識
如果幾年前,兩波程序員在群里吵起來,一定是因為討論PHP是不是世界上最好的語言,現在兩波程序員在群里吵起來,大概率是因為“AI是否具有意識”。這是一個哲學問題,咱們不做過多討論。但人類為什么會如此關注“AI是否具有意識”,是因為人類認識世界的過程是將事物擬人,太陽公公,月亮姐姐,機器人一定要兩條腿才叫機器人,四條腿就叫機器狗,人類更喜歡和自己相似的東西,所以人魚一定要上半身是人,下半身是魚;上半身是魚,下半身是人就是怪物。將萬事萬物擬人化是一種哲學上的本質主義錯誤,因為“意識”對于”人工智能“來說是非必要的。
說了這么多AIGC不足的地方,但所有AI不足的地方都是人類的機會。
AIGC還在快速地發展,每周都有新產品發布,新論文發表,根本看不過來。那么AIGC在未來會有哪些可能性呢?
5.1 內容生產成本繼續降低
AI現在在快速生產創意,以及技法上已經超過人類。未來AIGC生產內容時間會越來越快,成本會越來越低,這會導致新一輪的信息爆炸,這似乎是一個必然會發生的事情。
5.2 多模態模型的發展
當前的AIGC模型主要依賴于文本數據來生成內容,GPT4號稱多模態但還一直未發布,文心一言的多模態其實也僅限于接口調用,我認為真正多模態應該是機器自主使用多模態的表達,由AIGC自己來結合多種類型的數據,例如圖像、音頻、視頻等,生成多模態內容。
5.3 互動內容成為可能
很多年之前,我們就設想過互動內容,根據觀眾的反饋產生不同的下一內容,但是由于復雜度過高,只能制作有限的分支劇情,效果都不是很理想,AIGC可以有效解決這一點。我們不需要提前制作好所有分支劇情,可以在發生時再制作。舉例來說,現在推薦系統是根據人的喜好來推薦已有內容,未來有可能實現AIGC根據人的喜好實時生產內容。
5.4 個人AI助理
AI會成為一個基礎設施,所有人未來可能都要人手一個AI助理。未來可能只有兩類公司,AI基礎設施維護公司,和AI應用公司,而完全和AI無關的企業將會被淘汰。未來公司中可能只有兩種崗位,一種是數據標注類崗位,另一種是使用AI工具工作的崗位,而完全和AI無關的崗位可能也會被逐漸淘汰。“通用人工智能成為可能”不是一句危言聳聽的話。我們身邊的小度小愛天貓精靈可能很快會變成Jarvis。無論設計師、編輯、工程師還是什么工作崗位,因為“個人AI助理”的出現,對效率和質量的要求會建立在一個新的標準上,就像幾百年前工廠的出現一樣,這個過程似乎也是不可逆的,我們只能接受。
5.5 AI對齊
AI對齊指的是確保人工智能系統的目標和行為與人類價值觀一致,因為AI如果濫用其強大的計算和學習能力,造成人類無法控制的后果。比如說,我們給AI定一個改善地球自然環境的目標,AI最后得到的方法是減少人類數量,這就是比較可怕的結果。AI對齊的最基本目的是保障人類社會的利益和控制權。未來的研究可能會集中于開發更加可解釋的AIGC模型,這將使人們更加理解模型是如何生成內容的,并且更加信任模型的結果。任何時候,AI對齊的追求是使得人工智能系統成為有益的工具,為人類創造價值,與人類和諧共處。
前面介紹了本次AI浪潮中AIGC的優勢、問題和發展方向,作為互聯網內容從業者,我們該如何應對這次浪潮呢?
首先,不要害怕。我們需要認識到AIGC只是一次技術性調整,而不是對傳統內容創作產業的完全顛覆。AIGC系統可以快速幫助人類拓寬知識廣度,但它并不會取代人類的智慧和創造力。這次AI浪潮是一次偉大的進步,但它不會讓我們失去飯碗。相反,它需要我們自我反思,找到自己的核心競爭力。
其次,擁抱變化。學會利用AIGC工具,設計師和內容從業者可以考慮利用AIGC的優勢來提高工作效率。例如,利用AIGC生成的文字和圖像可以完成一些基礎工作,從而節省時間和資源。這將允許他們更好地專注于更高級的工作,如創新思考和策劃。
第三,投資自己。與此同時,設計師和內容從業者可以把注意力放在提高他們的技能和知識上。學習新的技術和工具,如AIGC和其他人工智能技術,可以幫助他們更好地適應未來的工作要求。此外,提高溝通和協作能力也非常重要,因為這些技能不可能被機器人取代。
第四,了解市場。了解市場和客戶的需求是成功的關鍵,而AIGC可以提供有用的信息來提供幫助,AI不能幫你做決策。我曾經表達過一個觀點“AIGC并不會帶來爆款率提升”,未來不是擁有流量紅利的時代,但爆款內容會一直稀缺。如何制造爆款內容取決于人對市場判斷,以及后續一系列的運作。大數據監測只能算是蹭熱點,不能稱為創作爆款。
最后,我總結四種AI替代不了的能力提供給大家參考:
「創造力」「情感」 「解決問題」「提供價值」
AI和AIGC的確會改變我們的生活和工作,這幾乎是不可避免的,但不要怕,這只是一次技術升級,或者叫內容創作升級。作為內容從業者,我們應該對AIGC技術保持開放的態度,學會利用AIGC工具來提高工作效率,投資自己,提升自己,解決問題,提供價值。
謝謝大家!
