強人工智慧驅動下的Web3.0“美學大爆炸”

語言: CN / TW / HK

作者:劉秋杉,杭州時戳資訊科技有限公司 首席研究員

“隨著新的 AI 影象工具越來越多越來越強大,未來普通人也可以一個人完成過去需要一整個專業團隊的‘創意到影片製作’的工作,讓更多人的想象力釋放出來。AI 不僅會幫助人類跳出自己的審美意識創作一些超越我們理解的藝術作品和影象,也可以幫助我們成為‘人類風格’創作的大師。 AI 正在引發一場想象力革命。”

(影片國內連結: https://video.weibo.com/show?fid=1034:4802295599398982

近期一段由頂級 AI 藝術工具 Stable Diffusion 輔助生產的短影片火爆了推特,它的名字叫“穿越時間”——由數百張精美絕倫的圖片串幀而成,完美再現了地球從最早誕生生命時刻起到構想人類未來世界的全過程,數十億年濃縮為短短兩分鐘。看過該影片的人無不為之震撼,不禁聯想到《愛,死亡和機器人》第一季中的“冰河時代”,而那個承載濃縮文明的“冰箱”便是今天的 Stable Diffusion。人類的想象力和創造力竟然可以如此輕鬆地落地成像,AI 正在引發一場超越邊界的全民美學革命!

Stable Diffusion 帶給人的認知衝擊不止於此,再來看一看它的一鍵“文字轉影片”功能。也是一段火遍推特的短影片:原始片段為一個網球教練在打球的動態,創作者使用 Stable Diffusion 輸入文字改變了背景,從沙灘、月球、火山邊,一路到了冬天的森林、鄉村、城市……令人驚訝的是,背景的變換都是在文字輸入的瞬間實時完成的,而且這是動態的影片。這令很多專業的特效行業從業者都感到震驚,因為即便對他們來說,做這樣的一個背景切換影片也是十分耗時耗力的,而今天只需要任何小白使用者動動鍵盤、說說話便能夠瞬間完成,且效果好無 PS 痕跡。

從第一性原理角度看待未來,Stable Diffusion 既然能夠將圖片生成做到“登峰造極”,而電影的本質其實是序列幀,序列幀就是圖片,因此從圖片原子不斷組合成電影級的影片片段便順理成章。這個過程不僅極大地解放了枯燥的生產力,似乎也預示了一個充滿新創業機遇的未來。今天的人們已經習慣了人類基於現實生活創作的短影片消費,未來應該還有一片更加無限廣闊的影片消費領域亟待開發,那便是人與 AI 共創出現實世界不存在的“平行宇宙”。

歡迎來到由“巨石強森”主導的“賽博朋克 2077”世界。很抱歉沒有徵得強森本人的同意,便被小紅書上的天才創作者們用 Stable Diffusion 寫進了一個 2077 年的平行時空,而該“強森”的靈魂本質其實是一段輸入 Stable Diffusion 的文字(專業叫法為 prompts)。是的,你所看到的這幾張強森是由純文字生成的。你也可以在自己構建的平行宇宙(假如叫 1880 年的偵探懸疑世界)中使用這個強森,但前提是你需要向原始的創作者索要到“靈魂文字 prompts”,並且學會使用 Stable Diffusion 吧。

這真的很令人產生無限遐想啊!似乎有個更大膽的(但在法律範圍並不被提倡的)想法:聚集起所有名人和經典英雄形象,發起全民連載漫畫,依託小紅書、抖音等元宇宙平臺,還原真正的“頭號玩家”。不過因此可能面臨老美各大經紀公司的強烈封殺,最終或許真的走出一條去中心化創作之路。好在“時空締造利器” Stable Diffusion 選擇站在與千千萬萬創作者們同一條陣營,完全開放了圖片版權,甚至開放了原始碼,並允許使用者免費使用該工具,允許後繼的創業者們使用開源框架構建起更加開放而生猛的內容大生態。正如 Stability AI(Stable Diffusion 公司實體)執行長和創始人 Emad Mostaque 在一篇博文中寫道:“我們期待著圍繞這個和進一步的模型出現的開放生態系統,以真正探索潛在空間的邊界。”使影象生成民主化!多麼令人嚮往的新新世界啊。

美好的路上總是充滿荊棘和不確定性,強大的 Stable Diffusion 也迎來了第一次正面挑戰。由社群粉絲們構建的推特賬戶近日遭到了封禁,而該賬號一直以來都是最強有力宣傳 Stable Diffusion 作品的“Meme 媒介”。全球幾百萬人正是通過在推特上看到這些無比華麗的圖片作品而對 Stable Diffusion 產生了濃厚興趣,進而加入到社群成為使用使用者和堅定的 AI 藝術傳播者。Stable 創始人 Emad 在社群裡解釋了封禁的原因:藝術家們認為 AI 畫得更好,生產的很多圖已經分辨不出 AI 的痕跡,藝術家們很反感,便舉報了它。是的,你也會在推特上經常看到很多藝術家到處貼宣告,讓人們不要“親近” AI 作品,因為“太可惡了”。這是一個很顯著的人與 AI 對立的場景,但我們期待的世界不應該如此,AI 會是可以幫助這些藝術家們變得更加強大和更具傳播性的一種工具,而非“反叛者”。

人們只看到了生產結果的震撼,但卻忽略了生產的過程,其實也是極具辛苦和專業性的創造。相比於小白使用者,專業的藝術家和設計師更懂得如何把一幅高質量的畫作描述得更加清楚,比如構圖、畫風修飾詞、畫家名字。而這些文字 prompts 才是決定一副 AI 作品是否優質、與眾不同的關鍵所在,這些文字 prompts 也才是圖片背後真正的價值載體和版權載體。更關鍵的是,也只有專業的藝術家和設計師才能對生產出來的 AI 畫作進行二次修改,以去除不合理、不美觀的地方,並增加自己獨到的藝術理念。

(專業的中國山水畫藝術家比小白玩家更能生產出一副優質的 AI 山水畫)

其實大多數專業藝術家們對 AI 創作抱有理解與合作的心態,因為它可以啟發到人們認知邊界未能觸碰的更廣闊的想象力空間,帶給藝術家源源不斷的靈感,解放大量的前期工作,並且可以嘗試拓寬自己的固有畫風,尋求更高階的創作之路。就像在阿爾法狗席捲世界棋壇之後,雖然大多數頂級棋手開始了心灰意冷,但仍有奮發的後人選擇與 AI “和解”,藉助 AI 之手磨練棋技。出生於 2000 年的申真諝是第一位成為圍棋世界冠軍的 00 後,並在今年 2 月 25 日擊敗了中國選手柯潔。如柯潔賽後所言申真諝的全盤棋路有 71% 的 AI 吻合率,是的,申真諝的棋王之路離不開 AI 這個“一生的對手”和“老師傅”,並給他留下了“申真智慧”的棋壇外號。申真諝每天都要花費 5 個小時與 AI 對練,會仔細學習 AI 的棋路,在《柯潔輸了!但他不是輸給了韓國人,而是這個AI圍棋時代》一文解釋道:

“訓練時,他偶爾也看不懂 AI 的棋路,剛開始會堅持自己的風格,拒絕相信 AI,但後來發現,往往都是 AI 棋高一著。於是在與 AI 下棋訓練的過程中,他會仔細學習 AI 的棋路,盯著勝率分佈圖,當有一手導致勝率驟降的時候,他就會停下來仔細研究那一手,直至搞清楚為何出現勝率下降。另外,當一場比賽結束後,他會把比賽過程匯入 AI 系統進行分析,看看 AI 會怎麼下,然後從中學習,與自己的落子進行比較。在他看來,AI 能極大擴充他對圍棋的想象力,打破了他對圍棋的固有觀念。”

也正如柯潔賽後發聲:“太難了,我依舊很努力,但申真諝太強了,我下的時候,完全不知道怎麼輸的!”畫外音我們斗膽補充一句,小申比阿法狗強,圍棋沒法下了。

同樣的道理還發生在歷史上照相機誕生的時刻,雖然當時任何人都可以用照相機完成之前藝術家耗費心血才能完成的寫實肖像畫,但肖像藝術家卻比普通人更懂得用照相機拍出更好的圖片,因為他們更懂構圖,更會觀察,也正是由於他們的推動,才使得攝影成為一門真正的藝術。在今天的時代,很多設計師不得不為甲方的需求奔波勞神,被不斷地催稿,根本沒有時間和心力進行優質創作,而 AI 完全可以幫助他們應對甲方早期的需求變更,直至確定後,才開始真正的潛心創作。同時在 AI 的加持下,很多一般水平的設計師也有望贏得大甲方的青睞。所以 AI 其實讓更多的設計師“腰桿子挺起來了”,正如公眾號“槽邊往事”的《AI繪畫會不會搶畫師飯碗》一文提出的觀點:

“頭部畫師忙不過來,腰部以下畫師沒啥大活。有了AI繪畫之後,其實真正受益的是頸以下畫師,因為他們得到了一個效率工具。在非常短的時間內,他們就可以說生成過得去的影象,PS小修小改一下,就可以交給甲方。甲方爸爸要求再多,AI改得快啊,二次生成又不是多麻煩的事情。

生產效率釋放了,需求同樣會得到釋放。這等於是憑空多出一個市場來,提供了大量的新工作機會。

AI繪畫不單不會搶走畫師飯碗,難說還能提供更多大米,讓更多人吃上飯,甚至吃上飽飯。”

不止於幫助專業藝術家,AI 藝術也能啟迪專業的作家成就更好的文字想象力和配圖,同時優秀的配圖還能具備文字傳播所不具備的“Meme”屬性,吸引更多的讀者“聞圖而來,帶字而歸”。究其本質,文字和圖片背後的共性便是“想象力”。非常贊同 Midjourney(另外一個頂級 AI 藝術工具)創始人 David Holz 的觀點:

“我們認為,(AI繪畫工具)不是關於藝術或深度偽造(deepfake)的問題,而是,我們如何擴大人類物種的想象力?當計算機比 99% 的人類更擅長視覺想象力時,這意味著什麼?這並不意味著我們將停止想象。汽車比人的速度快,但並不意味著我們不再行走。遠距離移動大量物體時,我們需要發動機,無論是飛機、船隻還是汽車。我們認為這項技術是想象力的發動機。因此,這是一件非常積極和人性化的事情。”

並且,Midjourney 真的做到了,它構建了一個容納 100 萬人的“想象力加速器”——

大多數人不知道他們想要什麼。你說:“這裡有一臺機器,你可以用它畫任何東西,你想要什麼?”他們說:“狗”。你說:“真的嗎?”然後他們說:“粉紅色的狗”。所以你給他們一張狗的圖片,他們就說“好吧”,然後去做別的事情。

我被“你正在創造一種被增強的想象力,大約有 100 萬人在這些共享空間中共同想象”這句話給震撼到了,彷彿看到了那個具有無限可能性的嶄新未來,整個人也變得精神抖擻、激情四射。這個世界不需要內耗與熵增,需要的是科技的創新和想象力的進步。

一個由百萬人組成的社群,他們的想象力被人工智慧增強了

想象力在公共領域被增強後,可以創造出前所未有的“影象物種”,就像 David Holz 向人們介紹的 Journey 小姐——

它(Midjourney 工具)喜歡使用很多藍色和橙色,有一些最喜歡的顏色和最喜歡的面孔。如果你給它一個非常模糊的指示,它會用它喜歡的方式來創作。所以,我們不知道為什麼會發生這種情況,但它喜歡畫一張特別的女人臉——我們不知道它來自哪裡,來自我們的 12 個訓練資料集之一——但人們只是稱它為 Miss Journey。

Journey小姐的油畫肖像

我們彷彿離“數字原生”的時代不遠了。人們曾暢想元宇宙會經歷三階段:

1、 數字孿生(Digital Twin)

現實物理世界向數字世界的對映,以數字化方式建立物理實體的虛擬實體。

2、 數字原生(Digital Native)

完全超脫於現實世界的認知,直接在數字世界中創造現實世界從未有過的虛擬實體。

3、數字永生(Digital immortality)

人類的意識與記憶可以上傳到元宇宙當中,最終實現數字世界與現實世界的二元融合,人類在元宇宙中數字化永生,即虛擬人創造虛擬實體。

《元宇宙:通往無限遊戲之路》指出元宇宙三階段

除了現實世界不存在的“人類”,頂級 AI 藝術工具還能重塑“歷史”,比如在元宇宙中製造並永久留存完全不一樣的“清明上河圖”。不禁令後世人深思,到底該相信那個世界的“清明上河圖”;“張擇端,你永生了嗎”?

微軟最新推出的頂級AI藝術工具女媧輸出的“新清明上河圖”

(用 Stable Diffusion 和 Dalle2 在元宇宙中重新創造出一個地球上從未有過的新世界影像吧!)

AI 在數字原生藝術和元宇宙構建領域的“潘多拉魔盒”已經正式開啟,吸引了無數創業者將其商業化——

(1)可以即時賣錢的“提示工程”

如前所述,AI 工具需要的文字 prompts 是生產優質作品的關鍵所在,也是日後構建巨集大元宇宙世界的真正“原始碼”,而一家名為 PromptBase 的初創公司便打起了它的主意。PromptBase 直接構建了一個交易市場,允許使用者通過交易平臺買賣提示詞(Prompt),目前每個提示詞售價 1.99 美元,同時平臺向賣家抽成 20%。正如“量子位”介紹的——

平臺上已上架不少提示詞,生成內容範圍從新聞標題、運動隊標誌、針織娃娃到動物的正裝照,應有盡有。

拿“Knitted Doll”這款來說,它能保證讓AI生成可愛且風格一致的針織娃娃,但每次生成的具體樣式則是隨機的。

宛如一款AI盲盒。

目前,PromptBase 僅託管在 DALL·E 2 和 GPT-3 上測試的提示,但創始人 Ben Stokes 對外稱,未來平臺將拓展到其它系統,最終目的是服務於一種全新的職業——提示工程師(Prompt Engineers)。

未來的提示工程師們,你們準備好賺錢了嗎!元宇宙不僅屬於像抖音短影片一類的創作者,還屬於啟發人們接力創作的“提示者”。

(2)一張 AI 圖成本 0.03 美金 VS 傳統付費圖片版權庫

在中國,很多企業和商用創作者都需要從專門的商用圖片版權平臺(如視覺中國)付費購買圖片作品,成本花銷比較高,而且難以隨心所欲地找到完美契合的圖片。今天,起碼在真實風景和人物攝影這個版塊,人們只需要向 Dalle2 支付兩毛錢便能立即獲取跟自己需求完美定製的 AI 風景。

相信,這一切剛剛開始!

(3)傳統社交平臺煥發新的活力

近日全球最大的短影片社交平臺 TikTok 集成了“AI 綠幕” (AI Greenscreen) 的新選項,即 AI 藝術創作。使用者現在可以在對話方塊裡輸入一段文字,不到 5 秒,TikTok 便能生成一張豎版畫作,用作短影片的背景。

具備社交屬性的 AI 藝術有望帶來裂變式的 meme 傳播效應。我們稱之為,強大的 AI 生產力與最大創作者網路組織的結合會帶來“美學的暴力傳播”。

AI 藝術生產力的意義在於——既成就專業,也普惠大眾。讓專業的更接近大眾,讓大眾的更理解專業。站在一個平等的平臺上,才能開展相互理解的對話。Web3.0 和元宇宙需要共創,但這個“共”字,我們之前太過狹隘了,總以為人是主角,同樣這個“創”字,我們總以為是創作,實際上應該是創造。創造意味著所產出之物可影響萬物,具有無邊界的滲透力。藉助 AI 的力量,讓我們一起迎接 Web3.0 時代下的“美學大爆炸”!

「其他文章」