AI Art 實現作畫自由?你需要知道這六大隱形門檻
最近,以“零門檻”“好上手”著稱的AI Art在社交平臺廣泛引起關注,不少人熱衷于將真實照片通過AI作畫平臺轉成“漫畫風”。在B站,以《殺死那個石家莊人,但是每句歌詞都是AI作畫》為代表的“歌曲+AI Art”的視頻動輒幾十萬甚至上百萬的播放量。但,AI Art真的已經強大到足以幫助非美術專業用戶實現“作畫自由”了嗎?懷著這一疑慮,筆者試用了文心一格、6pen Art等AI作畫產品,卻發現“買家秀”和“賣家秀”還存在一定差距。
在兩個國內較熱門的AI作畫平臺上輸入“江南水鄉,撐著油紙傘的姑娘行走在雨巷”后,筆者期待得到的畫作是這樣的:
但,等待幾分鐘后,得到的AI作品是這樣的。
即使這兩幅作品并不能代表AI作畫的真實水平,但至少說明當前AI Art尚存在一定的使用要求。所謂“器欲盡其能,必先得其法”,那么,AI Art的準入門檻有哪些呢?帶著這樣的疑惑,筆者進一步采訪了相關專業人士的AI Art使用經驗,他們嘗試過的平臺主要有Stable Diffusion、Novel AI和Disco Diffusion等。
1.編解碼門檻
因語意誤讀而影響生成結果的現象多發生在國產的AI Art平臺。這是因為,當前AI作畫的核心模型CLIP模型只支持英文版,而國內尚未開發出能與CLIP模型的生成能力相媲美的模型,因此國內的AI Art平臺在底層模型的選擇上無非有兩條路徑:
一是使用自研的算法模型(如百度的文心·一格就是依托于百度自研的飛槳、文心跨模態大模型),但這類模型與國外的Stable Diffusion相比還有一定差距,且其訓練成本往往極其高昂,動輒數百萬的成本和技術壁壘在一定程度了上阻礙了國內算法模型的進步。
二是使用Stable Diffusion等國外開源模型。由于這類開源模型的基礎語言是英語,因此需要將用戶輸入的中文通過映射表的匹配來轉換成英文。這一轉換過程并非中譯英那么簡單,會導致AI生成圖像的隨機性進一步增強,讓AI作畫的規則與邏輯變得更加難以捉摸。
此外,由于表達習慣等方面的差異,使用者表達和機器理解之間的也會存在一定的折扣。例如,小慈是一名媒體行業的內容創作者,他第一次與AI作畫的近距離接觸是源于AI Art平臺“6pen”來公司做的一次交流推廣會。會后小慈抱著好奇的心理嘗試輸入“汗血寶馬圖”,結果卻得到了一輛汽車的寫實圖。該圖像生成不準確就是由于,在AI現有的概念框架下,更傾向于將關鍵詞拆解為“寶馬”牌汽車、汗與血。
2.應用門檻
要想在Novel AI等國外的AI Art平臺上生成一幅好的畫作,需要對藝術風格、創作流派、美術甚至是所在平臺的模型運算法則有一定的了解。為此,有人專門整理了Prompt(提示詞)的入門工具書。以PromptBase代表的一些公司甚至靠專門兜售AI Art平臺的“高質量”提示詞而發家致富。
就詳細規則而言,給定關鍵詞的精確程度會影響AI作畫的生成結果。如何穗創作的這幅“80年代好萊塢女星即視感”的作品,其中的關鍵詞就包括1980s'。因此,普通人如果想創造出觀感很棒的作品,需要先學習大佬整理的元素法典的關鍵詞,在不斷嘗試的過程中掌握基本邏輯,再次基礎上加入自己的獨特構思。這是AI Art設置的第一道應用門檻。
其次,關鍵詞的排列順序和權重是AI Art的第二道應用門檻。排序越靠前,則該關鍵詞對應的內容在畫面中出現的權重越大。部分AI繪畫平臺需要同時設置正反兩種關鍵詞,反向關鍵詞(如lowres, bad anatomy, bad hands等)會減少這類內容在畫作中出現的比率。此外,需要通過特定的符號設置權重。以Novel AI為例,括號越多,表示括號內的詞越重要。
3.配置門檻
除了“技術門檻”外,“配置”往往也是用戶們逃不開的硬傷。這種配置方面的門檻又可以分為硬件配置門檻和軟件配置門檻。
就硬件配置而言,本地版AI作畫對電腦GPU的要求較高。以Novel AI為例,針對不同的電腦配置提供了不同的bat,有顯存4GB、6GB、8GB之分,顯存越高,出圖越快、越清晰。當前,6G的顯卡幾乎已經是本地版AI作畫的基礎配置,RTX計算卡的運行效果最為理想,而AMD顯卡、10系及以下老顯卡的體驗效果較差。這對于電腦配置有限的普通用戶而言無疑是一種新的鴻溝——如同電腦剛普及時對沒有電腦、網絡的人群的數字鴻溝那樣。
就軟件配置而言,由于不同AI創作平臺之間的壁壘還沒有打通,因此有時需要與其他設計類軟件配合來使用。比如,如果想提升畫質,需要移步到其他專業性的AI修復畫質的軟件上進行操作。再比如,當前的AI作畫平臺上還難以進行特別專業化的后期操作,需要將圖片下載、畫質修復或增強后再轉接到PS等軟件進行后期完善。這要求使用者在軟件配置上有較為完善的圖片設計生態,才能生產出較高水平的畫作。
4.技術門檻
在2022年7月的百度世界大會上,CEO李彥宏預測了AIGC將走過的三個發展階段,分別是輔助人類進行內容生產“助手階段”、人機共生的“協作階段”和AIGC獨立完成內容創作的“原創階段”。目前AI作畫尚處于第一階段,因此盡管AI Art可以進行創意生成,但更多地還是扮演著輔助性工具的角色,需要人為對創作過程進行干預。廣為詬病的“AI畫手”就充分暴露了AI作畫的短板——不少AI作品都需要人工后期修改潤色,而這一環節恰恰也是最考驗創作者技術水平的環節。
今年8月,AI作品《空間歌劇院》由于獲得美國科羅拉多州博覽會一項美術競賽的一等獎而引起了不小爭議,但這幅畫作也經過了其“主人”將近80小時的后期修圖。人工后期修圖的需求在一定程度上還是將不懂美術創作的人群拒之門外。
相較于普通用戶,專業人士在面對技術門檻時顯得游刃有余。動畫專業的何穗在利用Novel AI進行創作時,對于不滿意的部分會導入inpaint反復修改,將不滿意的地方摳掉而保留其他部分。何穗在對繪制人物肖像畫的少女腰帶和頭飾比較吃力,因此她選擇將自己創作的半成品畫導入Novel AI,通過設定關鍵詞讓AI沿著她的創作思路繼續補充,最后再把想要的腰帶和頭飾部分摳圖到原作中,讓自己與AI之間“取長補短”。不難發現,這種“AI+人腦”的創作方式對創作者的審美水平和繪畫水平都有一定的要求。
5.時間門檻
在創作體驗上,AI作畫就像是一個“抽卡游戲”,輸入同樣的關鍵詞很可能得到完全不同的創作效果,且有無窮無盡的可能性。這是由于,AI作畫隨機性是由隨機種子來控制的,而隨機種子的可能性達四十億種之多。這也意味著AI作畫水平并不穩定,因此要想得到一幅理想畫作,可能需要不斷進行嘗試,要求使用者愿意付出足夠的時間成本。對此,平面設計專業出生的小唯表示,只要AI生成的畫作能達到自己心理預期的一半以上就已經非常滿意了,而要想達到這個標準,她一般需要嘗試數十張到幾百張圖片。
沿著這一思路,筆者在文心一格平臺上重復輸入多次相同文案(“江南水鄉,撐著油紙傘的姑娘行走在雨巷”)后,得到了較為滿意的水墨畫。
“一般是R(普通卡)多,SSR(稀有卡)少,但只要抽的次數足夠多,爆率調的精確,總會有光影好看、結構正確又精美的SSR出現”。何穗拿游戲“陰陽師”的抽卡游戲來形容AI作畫的不確定性。
6.版權門檻
當前,AI生成的作品在版權上存在較大爭議,不同平臺對版權歸屬有著不同的規定,但卻難以形成一致意見。如,Stable Diffusion表示“版權歸公共所有”;Midjourney的付費用戶與平臺共同擁有畫作版權;百度的文心一格聲明“知識產權歸平臺所有,且在沒有授權的情況下無法商用”;6pen則“不保留任何版權,生成的圖片版權都歸屬生成者,可隨意自用商用”
這種不一致的版權歸屬根源在于,當前并沒有立法對AI作品的版權歸屬做出明確規定,也因而產生了種種亂象。從技術角度來考慮,這種侵權在開發前期幾乎是不可避免的。因為AI Art能夠進行畫作輸出的前提是有足夠多的學習樣本作為數據庫,但由于數據庫的樣本量太大,根本無法征得數據庫中每一幅作品的主人的同意。連開發算法的后臺人員也表示“無法保證未經授權的畫作一定不被學習”。
在采訪過程中,筆者發現,版權方面的爭議在一定程度上“勸退”了部分使用者。插畫師小輝從今年6月起開始嘗試AI繪圖+人工精修的創作模式,但11月的一天,他偶然發現自己的作品在小紅書上被“掛”了出來,原因是這幅被小輝打上“原創”標簽的作品有AI作畫的痕跡。對此,小輝覺得很委屈,因為那幅畫從前期的關鍵詞組織到后期的調色都是自己完成的,甚至還對作品進行了大范圍的手工修改。至此之后,小輝就減少了AI Art平臺的使用頻率。
由此可見,盡管AI的智能作畫機制已經較為成熟,但要想實現“人均藝術家”,還需要跨過多個隱形門檻。對于普通用戶而言,需要根據自己的實際訴求來針對性地解決這些問題,以便AI更好地服務于畫作創作的需要。同時,從宏觀角度來看,如何與這些門檻“和解”,甚至突破這些門檻,事實上也是“人機共生”在內容創作層面不斷探索的一種體現。
(本文中何穗、小慈與小輝均為化名)