国产精一区二区_午夜视频99_免费白白视频_中文字幕一区免费

“早期”的AIGC,已在“中途”

我思鍋我在
+ 關注
2022-11-04 12:18
1206次閱讀

今年6月11日,經濟學人第一次采用了非人類設計的插畫作為封面,作品名為“AI's new frontier(AI的新邊界)”。畫面里這個“人像”是位女性,讓我想起那部關于AI的經典科幻電影《Her》,而眼部左上角那抹紅色又像《2001太空漫游》里的機器人“HAL 9000”的眼睛一樣深邃。

編輯僅僅在類似搜索網站的文字框里敲入這三個提示詞(Prompt):AI's new frontier,就在幾秒鐘內得到四組方案,最后選定了以上這幅作品。

“早期”的AIGC,已在“中途”

三個月后在美國科羅拉多州博覽會的藝術比賽上,“數字藝術/數字修飾照片”類別里的第一名頒給了一幅充滿科幻和中世紀風格的作品“Théâtre D’opéra Spatial(太空歌劇院)”,這是一位游戲工作室的行外人用AI“創作”的。

盡管他拒絕透露向機器輸入的準確提示詞,但表示是經過多次修改并用Photoshop等工具進行“人工”加工后,提交了三幅作品,最終只有這幅獲獎。

有人說,藝術已死,似乎折射出《Her》里的主題:AI永生。而這兩個事件,指向了背后同一個臺“機器”——Midjourney,直譯為“中途”

Midjourney的背后不是算法,是十個人,創始人David Holz身上有無數標簽:Leap Motion創始人、曾兩次拒絕蘋果收購以及估值縮水十倍慘淡收場等等,而這次重新出發,又引發社交媒體上無數討論。但最吸引我的,是他如此評論AI:

AI is water, rather than tiger.(AI是水,而不是老虎)

“早期”的AIGC,已在“中途”

在野外,人遇到老虎,極有可能被老虎吃掉,老虎是危險的,為了安全我們會把他殺掉。而水,同樣可能是危險的,湍急的河流可能會把人沖走,會淹死人,但我們會因此“禁用”水嗎?

“Water is dangerous, yes, but you can also swim in it, you can make boats, you can dam it and make electricity. Water is dangerous, but it’s also a driver of civilization, and we are better off as humans who know how to live with and work with water. It’s an opportunity.” (水固然危險,但你可以學著游泳,可以造舟,可以造堤壩還能以此發電。水盡管危險,卻是文明的驅動力,人類之所以進步正因為我們知道如何與水相處并利用好他。水給予更多的是機會。)

那如何定義Midjourney及與AIGC(AI Generated Content,AI內容生成)相關的一系列應用?

在David看來,他們是在引導人類不僅不要害怕水,還啟發大家怎樣更好利用水,如何建大壩,如何造船,如何利用浮力和水流等等——

去探索AI的一切潛在價值和機會。

協作,讓藝術“走下神壇”

如投資實習所在《Adobe 200億美金收購Figma,是協同的勝利》里所說,“Figma讓與產品相關的所有人都能參與到設計里,更重要的是讓團隊以設計優先的方式去思考、感覺和工作”,最終協同帶來的價值不僅僅是網絡效應,而是徹底拓寬了場景,進而用戶群,最后是市場規模。
當年經歷過投資Figma,并寫下著名博文《Why Figma Wins(為什么Figma會贏)》的Kevin Kwok也提出:
“Figma changes the game.(Figma改變了設計里的‘游戲規則’)”
同樣, AIGC changes the game
AIGC最大的革命是將協同和創作融合在一起,并且從最源頭的靈感開始,在開放的機制下激發全社會的創作力。
大多數情況下,用戶基于開源的預訓練模型,數據集都來自公開網絡,更重要的是在Discord或開源社區里,遵循一套鼓勵分享的操作守則,最后將成果也反饋于全社區。
Midjourney的社區向個人提供每月10美元和30美元的兩檔套餐,對應不同次數的標準生成或放大請求,每次生成會獲得四組結果。使用這兩檔服務,用戶的提示詞和圖片都會暴露在瀑布流式的公開頻道里,除非每月再花20美元獲得私密通道。
因此,在公共頻道每秒鐘都可以看到哪位用戶用了什么提示詞創作了什么樣的作品,他對其中哪幅圖放大或再調整。在版權歸屬上,Midjourney在服務條款里規定了“如果你是付費用戶,雖然擁有著作權,但在公共頻道里的作品和提示詞仍是免版稅(Royalty-free)的資源,任何人都可以在你的作品進出上重混和修改。”
雖然David沒有透露是如何借鑒CLIP-guided diffusion算法,但CLIP與被視為當下最強的生成模型Stable Difussion(簡稱SD),都是完全開源和開放。
特別是SD背后的研發團隊Stability.AI(本周宣布獲得1億美金融資,估值10億美金),其標語就是“AI by the people, for the people(AI來自于人類,為了全人類)”,強調對開放的承諾和協作的重視。更多歷史故事,參考《當下最強的 AI art 生成模型 Stable Diffusion 最全面介紹》。
基于SD的在線圖像生成網站Dreamstudio都有相似的社區規則和版權歸屬解釋,在公共頻道生成的圖像以及相關操作都會再次被反饋到數據集里。
只有將“協同”和“創作”融為一體,每個人才能機會創作自己的“神作”。
不過,當普通人通過AI創作獲得了榮譽,一定有已經在“神壇”的人不樂意,有網友(想必是位藝術從業者)說“我們正眼睜睜看著藝術的倒塌”,也有人說“這就好比一場馬拉松比賽,到最后一個人開著蘭博基尼闖過終點線”。
“早期”的AIGC,已在“中途”
但正如1913年福特發明第一條汽車制造流水線后,就意味著馬車夫這個職業的逝去,一個叫“司機”的職業和新時代的到來——
新技術及其帶來的新產物終將是不可逆的。
網上已經有眾多自稱“AI Artist(AI藝術家)”的人出現了,我相信這只是開始,繪畫只是藝術表達的一種形式,關于AI Art的應用絕對不僅是一種“繪畫”神器。
在Midjourney里,僅有30%是職業藝術家,他們把AI生成融入到商業創作的流程里,在初期就展示給客戶以便選擇后面優化的方向。即便在藝術創作中,各家在模型選擇上的不同,也會在表現效果和應用場景中體現出差異。
YUAN初 是ZMO.ai旗下的AIGC內容生成平臺(點擊左下角“閱讀原文”嘗鮮),他們基于Implicit Style Difussion模型在現實場景的成像上會更加逼真,因此有包裝設計師直接用來生成巧克力盒的包裝圖案,還有動畫設計師從生成的動漫形象里尋找靈感等等。
“早期”的AIGC,已在“中途”

(左:超寫實的漂亮的大地女神,周圍有植物和花朵;右:生活就像一盒巧克力,你永遠不知道下一塊是什么,來自:YUAN初)

 

創作是探索無限可能和釋放想象力的過程,正如“水”對于人類的啟發一樣,創作“門檻”被降低了,靈感在開放的世界不斷被激發。
更多普通人因此進入以往“高高在上”的領域,更會誕生全新的職業。

 

藝術外,才是AIGC的天堂歌劇院

紅杉近期發表的題為《生成式AI:一個嶄新的充滿創意的世界》的文章引發了熱議,不僅文中的配圖是通過Midjourney生成的,更“擊中”我的是最后的附言:
“This piece was co-written with GPT-3. GPT-3 did not spit out the entire article, but it was responsible for combating writer’s block, generating entire sentences and paragraphs of text, and brainstorming different use cases for generative AI.(文章也是與GPT-3模型共同撰寫的,盡管GPT-3沒輸出全篇,但全程配合作者,包括生成整段語句或文字,以及腦暴生成式AI的不同場景)”
在文字創作領域,AI已經學會在一定“提示”下幫助人類思考了。
由于工作原因,一款叫Copy.ai的產品成了我的日活工具。它利用AI生成文字內容,包括網站,Facebook頁面甚至產品描述,幫助用戶用“自己”的語言快速抓住客戶眼球。
“早期”的AIGC,已在“中途”
只需要輸入產品名稱和描述,選擇友善、休閑、職業等不同語氣或場景,它會在幾秒鐘時間生成在11個場景和接近百個細分場景下的文字段落:
  • 比如在“數字廣告”類別里,你可以針對Facebook廣告選擇生成“文章標題”,或“鏈接描述”,還有“圖文列表”甚至“首頁頭文”等細分類目。
  • 或者在“郵件”類別里,無論是“訂閱取消”,“確認郵件”還是“感謝郵件”等場景都有針對的范本可選。
  • 如果你是SaaS產品的博客寫手,Copy.ai還能提示哪些關鍵字應該出現,并且避免語法和拼寫錯誤。
這些還不是讓我最佩服的,CEO把整個創業過程、業務數據和發展策略都公開透明地分享在了推特和Facebook社群里,這種方式在推上有特殊的標簽叫“ #buildinpublic ”,許多創業者開始擁護這樣大膽且自信的方式,本身就是一種“市場推廣(Go-to-Martket)策略”。
CEO在推特上月更公司進展:
  • 創立10個月,注冊用戶超過25萬,每月訂閱收入超過15萬美金,融資290萬美金,全職12人。
  • 截止今年8月,注冊用戶突破200萬,月活近40萬,ARR達到870萬美金,全職27人。
有時候他會向粉絲發起對未來發展的投票,從中聽取最真實的反饋。有一次還讓粉絲私信自己現在最痛恨產品的地方在哪里,越“狠”越能獲得更高獎勵。并且,公司的前三位外部員工也都從推上招來的。
這又是開放與協作的一次勝利,志同道合的一群人,為一個產品和一份事業。
其次,紅杉一文里提到的“Paradigm of Interaction(交互范式)”的改變讓我意識到AIGC最有意思的地方還在于所有過程行為和數據都會最終回饋到最開始的動作——創作
以往如人臉識別,AI唯一任務是完成正確匹配,輸入是人為的清晰人像,機器學的是人為告知的結果是否正確,這是單向的訓練。而在AIGC的任務里,輸入是人的模糊想象,輸出的是一系列選擇,并且可以不斷修改,提示詞都能像A/B測試一樣,即調整一個詞,其他詞不變,多次嘗試生成。
AI的學習范式貫穿了從創作到反復修改,再到定稿等與人交互的整個過程。
在商業場景,用戶最終選擇了哪幅作品,復制了哪段話,導出了哪段視頻,并且曝光在特定應用里獲得了什么效果,例如關注度,點擊率或完播率等,都可能成為機器的輸入。在這基礎上,我們還能試圖建立生成結果和效果的關系,或者說期望機器告訴我們她是怎么理解這里面的因果關系。
比如YUAN初曾服務的客戶里,有服裝電商賣家想在同一款服飾上測試幾十種花紋,短時間內人工不可能做幾十款樣品進行拍攝、修圖和投放。但AI可以快速生成無限圖案,再經過優化和打標,由市場部投放并監測相關指標如CTR(Click-through Rate,點擊率),在特定場景下便能逐漸訓練出針對某個人群的“ 爆款”模型
不僅圖文生成,前段時間一款AI視頻生成工具Runway也在網上得到眾多關注,創始人在官推上發布了一段教科書級的Demo,很好詮釋了如何用文字和想象力驅動視頻從靈感, 到創作和剪輯,最后成片的過程。
Runway研究院的科學家Patrick Esser,也參與了與慕尼黑大學機器學習研究小組和AI開源研發團隊EleutherAI等諸多非盈利組織一起訓練Stable Diffusion的任務。
Facebook也很快加入AI視頻生成大軍,9月29日母公司Meta發布了Make-A-Video應用,可以實現直接將文字生成視頻,單張或多張圖片流動或者輸入一個視頻并生成變體。隨后GoogleAI也發布了兩段AI自動生成的視頻,比Meta的案例更高清。
其中一段文字描述的是“在暴雨交加的海面上,穿過一場海盜船間的激烈海戰(Flying through an intense battle between pirate ships in a stormy ocean)”,AI用第一視角自動生成了以下內容。
各個垂直領域的影響力飛輪在不斷提速——
更多人參與和創作→更多作品反哺模型訓練和調參→更好的效果和體驗吸引更多人加入
Copy.ai成立不到兩年,8月注冊用戶達到200萬。Midjourney在今年2月底開始公測,到現在Discord里成員已超過350萬。Stability.AI成立兩年,Dreamstudio已經被150多萬用戶使用,所有渠道的日活用戶已超過了1000萬。
最后,我們回到AI創作的源頭——Prompt,提示詞。前面講過,用戶只需要輸入幾個單詞,當然可以為了更精確的效果增加描述性語句,然后讓AI發揮聯想。但對普通人而言,顯然單詞的門檻是最低的,就像在搜索網站里的敲入關鍵詞一樣。
上一家利用好關鍵字并在商業領域大獲成功的公司就是谷歌了。
并且搜索這個模式,是基于有限數據集找到最匹配的有限內容,而AIGC是:
無限搜索→自由聯想→無限生成
文字、圖片、視頻、3D...AIGC未來的商業模式和市場空間,一定是“生成”出來的。

不能缺少的中國元素

“早期”的AIGC,已在“中途”
以上是我用Midjourney創作的彩色山水畫,提示詞是“mountain and villages, farmers and their dogs, Chinese painting, 4K, with some details(群山與村莊,農夫和他們的犬,中國畫,4K畫質,帶上細節)”。當我選擇左下角進行放大,獲得了更多精妙且帶水墨風格的細節,連畫布也呈現被畫筆浸染后的紋理。
不過有點遺憾的是,據這段時間在Midjourney社區里的觀察,并沒有太多中國元素的作品,三百多萬用戶群里中國人的比例仍較低
但在AIGC正潛移默化影響著每個跟創意相關的產業之時,不敢想象缺少了如此龐大的人群和文明體參與會是什么后果。如今當我們與全球化“漸行漸遠”之際,天然繼承開放和協作精神的AIGC如果能在國內引起廣泛用戶的參與,將是年末最讓我期待的事情。
現在中國設計師上網常聚的地方在站酷社區,不久前他們上線了AI創作實驗室Beta版。讓設計師和藝術家了解AI,從不懼怕到不抵觸,直到逐漸明白該怎么運用到自己的創作或工作中來,這是一次非常有趣且重要的社會性實驗。
“早期”的AIGC,已在“中途”
(提示詞:群山與村莊,農民與他們的犬,中國畫,4K,來自:站酷AI創作實驗室)
目前海外設計師會光顧Behance,中國設計師會瀏覽站酷尋找靈感,我們常聽說某位藝術家的作品受到了某位前輩的風格影響,AIGC的魅力在于很多時候你無法描述作品具體來自哪一位大師,我們站在“一群巨人”的肩膀上,并且每個人的每個舉動都可能影響后面的風格。
這種交互范式的轉變,意味著在未來的社區里,可能不再是用戶對其他用戶作品的瀏覽、評論與點贊等單向互動,大家可以彼此實時地參與到對方的創作里,這才是真正意義上的“交互”。
設計師間的社交就變成了設計師、AI和多位設計師的共創, 社區形態或將發生革命性改變
這場社會性實驗除了專業設計師,更需要在生活或工作里對視覺創作感興趣的普通用戶加入。“YUAN初在海外運營時發現,到商用場景時人對現實真實圖片的敏感度更高,而基于自己獨特的模型能更好提升真實場景、工業設計甚至未來3D的生成效果。
此外,這次上線了生成器和編輯器兩款工具,編輯器的特點也是通過文字告訴機器如何修改,即模擬Photoshop的體驗實現文字驅動編輯,包括用畫筆替換背景,增減元素或憑空生成以替換某些元素等。
在海外還有20%的用戶把作品當做“Art therapy(藝術治療)”,比如有用戶創作出已經去世的寵物狗,用來撫慰自己和家人。還有人會把作品里的形象作為自我安慰和反省的對象。
在YUAN初社區有小孩和年輕人用來生成一長排貼紙,打印出來分享給伙伴。還有烘焙師用來生成動物形狀的面包,以此為原型來制作糕點,場景不一而足。
我并不認為國人缺乏想象力,有時候只是缺少巧妙的引導。 “YUAN”可以指源頭、愿景、遠方、淵源甚至緣分, 寓意一切想象的開始
相比于海外討論得如火如荼,AIGC在國內將引發的關注和潛在商業價值遠沒正式開始。

我們準備好了嗎?

有人認為AIGC尚處早期,就像第一代智能機iPhone面世時——有些噱頭但單薄。
隨后的發展大家都知道了,我們根本沒想到移動互聯網的腳步會這么快奔跑而至。而如今算力的提升、數據的累積和成本的下降也在加速,當你們閱讀這篇文章的時候,AI又學習了萬篇名著和名畫,還有來自全球用戶的創作。
“早期”的AIGC,已在“中途”
Stability.AI的創始人預言“遲早我們會到達每天生成10億張圖片的階段,尤其當動畫生成的功能被解鎖后...”,而全世界最大的商業圖庫Shutterstock目前的存量“僅為”4億張。
我的意思是,在此刻人類理解的“早期”與AIGC的“早期”可能早就不一致了。
換句話說,我們的確還在探索如何優化提示詞,調節參數,改善效果,以便讓AIGC真正融入每個人的生活和工作中。
但這臺機器可能已經準備好了。

特別鳴謝:Copy.ai、YUAN初(ZMO.ai)、Midjourney、站酷等與我一起完成了這篇創作。

參考資料:

  • https://www.theverge.com/2022/8/2/23287173/ai-image-generation-art-midjourney-multiverse-interview-david-holz

  • https://www.theregister.com/2022/08/01/david_holz_midjourney/

  • https://midjourney.gitbook.io/docs/

  • https://waxy.org/2022/08/exploring-12-million-of-the-images-used-to-train-stable-diffusions-image-generator/

  • https://techcrunch.com/2022/08/02/ai-art-generated/

  • https://techcrunch.com/2022/08/12/a-startup-wants-to-democratize-the-tech-behind-dall-e-2-consequences-be-damned/

本文來自微信公眾號“我思鍋我在”(ID:thinkxcloud),作者:我思鍋我在GN,36氪經授權發布。

0
消息通知
咨詢入駐
商務合作