從 AI 繪畫到 ChatGPT,聊聊生成式 AI

語言: CN / TW / HK

我們小時候經常有幻想,未來不用再去上班了,在工廠工作的都是機器人。在家也不用打掃衞生,機器人可以包攬一切。不知不覺間,我們小時候的幻想已經慢慢變成現實,工廠裏有了多種型號的機械臂,代替了部分流水線功能。家裏也有了掃地機器人,不用再一遍一遍地掃地了。

這些技術實現的背後都有 AI 的身影,2022 年 AI 行業更是熱鬧非凡。2022 年 9 月,由 Midjourney 創作生成的畫作《太空歌劇院》在科羅拉多州博覽會數字藝術創作類比賽中獲得一等獎,AI 繪畫進一步破圈,受到大眾關注。

畫作《太空歌劇院》(圖片來源於互聯網,侵刪)

什麼是生成式AI?

就在大家都認為 AI 繪畫是 AI 發展的里程碑級應用,可就在短短 2 個多月後,ChatGPT 橫空出世,到今年 1 月,平均每天約有 1300 萬獨立訪客使用 ChatGPT,累計用户超 1 億,創下了互聯網最快破億應用的紀錄。而 ChatGPT 的“智慧”也再一次刷新人們對 AI 的認知。

無論是 AI 繪畫,還是現在風靡全球的 ChatGPT,它們都屬於 AI 的一個分支——生成式AI(Generative AI)。生成式 AI 可以通過讓機器學習模型研究歷史數據,並且利用先進的深度學習技術來創造一個全新生成的作品,這作品可以是一段文字、一張圖片、一段音頻或者是一部影片。

相較於傳統的 AI 模型,生成式 AI 是一種特定類型的 AI,它專注於創建新內容。

生成式AI的簡單原理

生成式 AI 的工作原理,是從大量數據中集中學習,並使用這些知識產生與訓練數據相似的新數據。這通常是使用一種生成模型的機器算法來完成的,生成式模型有許多不同類型,每一種類型都使用不同的方法生成新數據。其中常見的生成模型類型包括 GAN、VAE 和迴歸模型。

聊這些模型之前,我們先簡單説下深度學習。深度學習其實是一種模仿人腦思維過程的方法,利用多層神經網絡進行學習,通過組合低層特徵形成更加抽象的高層表述屬性類別和特徵,最後作出判斷。舉個例子,你要讓 AI 認識一隻貓,需要給它提供大量的樣本學習,而 AI 在學習了大量的基礎之後,建立起一個模型,來判斷圖片中有沒有貓。要訓練一個 AI 能夠順利實現對貓的識別,可能需要上百萬張,甚至上千萬張與貓相關的圖片。

如果沒有那麼多的數據該怎麼辦呢?大家可能有聽過這麼個玩笑,程序員對 AI 説,“你已經是個成熟的 AI 了,應該自己生成數據,自己訓練自己了。”這也就是我們前面提到過生成模型 GAN 的基本原理了。

GAN 的全稱為對抗生成網絡,最早是由著名的深度學習理論專家伊恩·古德費洛(IanJ.Goodfellow) 在 2014 年提出的。在原理上,生成式對抗網絡使用兩個神經網絡相互對立,一個生成器和一個判別器。生成器或生成網絡是一個神經網絡,負責生成類似於源數據的新數據或內容。判別器或判別網絡是負責區分源數據和生成數據之間的神經網絡。這兩個神經網絡都經過交替週期訓練,生成器不斷學習生成更逼真的數據,判別器則更善於區分假數據和真實數據。

GAN 基本原理(圖片來源於互聯網,侵刪)

古德費洛打了一個形象的比方:GAN 就像是構造了一個警察抓小偷的遊戲。小偷不想被警察抓住,因此他需要不斷揣摩警察的行為,並據此來隱藏自己是小偷這個事實。而警察則想要抓住小偷,因此他就需要不斷學習小偷的偽裝辦法,並據此調整自己的抓捕策略。這樣,經過不斷地“鬥法”,小偷的偽裝技巧和警察的抓捕策略都可以得到大幅改善,並且這種迭代的速度會非常快。

當然,GAN 只是其中一個生成模型。以 ChatGPT 為例,GAN 難以保證回答內容的準確性。要對回答內容準確性進行驗證,必須依靠人力。用户在使用 ChatGPT 的同時,其實也充當着免費 AI 訓練師的角色,幫助 ChatGPT 成長。這也就為什麼 OpenAI 會把 ChatGPT 放到網上讓用户免費使用的原因之一。

生成式AI未來趨勢

既然生成式 AI 這麼強大,那麼它會跟文章開頭一樣取代現有的一些崗位嗎?針對大眾普遍擔心的失業問題,ChatGPT 有分享一篇帖子寫到:“AI 不會取代你,一個使用 AI 的人可能會取代你。”

那生成式 AI 會在未來帶來什麼呢?我們來簡單暢想下:

生成式 AI 可用於創造很多新內容,例如音樂、文字或者圖像,為創意人員提供更多的想象力。例如,作者可以使用生成式 AI 創造的文章,對其進行編輯和完善,可以讓自己更專注於需要想象力和創作的地方。這樣創造出來的作品可能更上一層樓。同樣,生成式 AI 可以將創作者的作品轉換成任意語言,讓創作者的作品一開始就在全球流行。

生成式 AI 也有可能會被應用於未來的機器人。相比較現在的機器人,未來的機器人在好看的皮囊下,提供類似於ChatGPT 這樣的模型對話能力,能讓未來的機器人更加聰明、智慧,更像人,也更好地陪伴、服務於人類。

生成式 AI 也有可能被應用於遊戲,創建新關卡和地圖,生成新的對話或故事線,以及創建新的虛擬環境等。現在已經有利用生成式 AI 來生成紋理和天空盒藝術。在未來,遊戲可能會使用生成式 AI 模型為玩家每次玩遊戲時創建一個全新的獨特關卡,或者根據玩家的行動為 NPC 角色生成新的對話選項。它可以用來增加遊戲體驗的活力和多樣性,讓玩家感到更有吸引力和沉浸感。

現在生成式 AI 仍然非常早期,Midjourney 和 ChatGPT 讓我們看到了未來的無限可能,相信在幾十年後,生成式 AI 將深深融入我們的工作、創作和娛樂方式。雖然這在現在看起來仍然非常不可思議,但科技進步的速度是驚人的,上面這些遙不可及的暢想,可能用不了多少時間,就能變得觸手可及。