遊戲+與通用人工智慧的實現

語言: CN / TW / HK

演算法、算力與場景,是AI研究的關鍵要素。AI 對資料要求量極大,否則無法達到人類正確識別的程度。自 AlphaGo 一鳴驚人後,越來越多AI 研究團隊意識到,遊戲是 AI 的絕佳訓練場之一。

遊戲推動科技創新上行

一直以來我們很少把活潑輕鬆的遊戲娛樂與嚴肅嚴謹的科學探索關聯在一起。但是如果我們回顧人類各種職業的發展史,確可以發現遊戲與科學研究恰恰有著最密切的關係。種地,捕獵,養牛,抓魚,在人類最初的職業中,一定沒有科學這個職業,只是當人類有了更多的糧食後,無聊之餘產生各種遊戲。講故事,賽跑,摔跤,石頭剪刀布,數星星,看螞蟻,這些娛樂後來就分裂成人類的不同職業, 比生產更有趣的活動,譬如講故事變成了戲劇。賽跑摔跤變成了體育運動,石頭剪刀布變成了賭博,而數星星看螞蟻就演變成了科學研究。

無論是伽利略為了更好的看星星發明瞭望遠鏡,達爾文通過環遊世界觀察到不同的動植物從而提出進化論,還是盧瑟福帶著學生們興致勃勃的用阿爾法粒子轟擊金屬板,發現原子的有核結構。科 學的突破往往與科學家們像小孩子玩遊戲一樣做著自己感興趣的事情有關。

當21世紀人類進入到人工智慧時代後,業界普遍認為:下一個 AI 里程碑可能會在複雜策略遊戲中誕生。若 AI 能在如此複雜的環境中,學會人一樣實時感知、分析、理解、推理、決策到行動,就可能在多變、複雜的真實環境中發揮更大作用。通用人工智慧的實現也許就在AI+遊戲中悄然實現。

從遊戲AI邁向通用AI

AI+遊戲究竟能不能實現通用人工智慧,我們首先從什麼是通用人工智慧說起。人工智慧源於要製造“可與人類相媲美的‘思維機器’,由於實現能夠通過圖靈測試的有思維人工智慧面臨巨大困難,甚至人工智慧本身在開始都被認為是誤用的騙局,上世紀七八十年代主流AI逐漸避離通用目的的智慧系統,轉向特定的領域問題並尋找專用目的的解決方案。

這種轉換逐步讓社會認識到人工智慧的用處,但也導致“AI”的領域被分割為許多關聯鬆散的子領域。這些子領域之間沒有共同的基礎或框架,並遭受著統一性的挑戰。在2004年至2007左右,在主流AI領域內外,研究通用目的系統的呼聲再起。許多重量級的AI研究者提出了通用和類人智慧(Human-level)的議題。通用人工智慧(Artificial general intelligence),簡寫AGI ,是指研製像人一樣思考、像人一樣從事多種用途的機器。這一單詞源於AI,但是由於主流AI研究逐漸走向某一領域的智慧化(如機器視覺、語音輸入等),因此為了與它們相區分,增加了general。

天普大學計算機與資訊科學系王培教授在文章《通用人工智慧導航:AGI的歷史與現狀》中提出”籠統地說,通用人工智慧(AGI)的研究具有下列特點:強調智慧通用目的的特點;基於整體或綜合的智慧觀;相信打造可媲美人類智慧AI的時機已經成熟”。

企業對“AI+遊戲”的探索與實踐

很多研究團隊投入到通用人工智慧的研究中來,利用遊戲對通用人工智慧進行探索是其中一個熱點。譬如DeepMind推出了一款新的具備通才的AI智慧體Gato,它受大規模語言建模的啟發而構建,不僅能作用於遊戲,還能作用於影象,不僅能作用於NLP,比如用來聊天,而且還能作用於操作,比如用機械臂堆疊積木。在AI+遊戲方面,2019年DeepMind在《自然》發表論文,指出DeepMind已經到達了一個新的里程碑,他們開發的遊戲AI AlphaStar在暴雪的即時戰略遊戲《星際爭霸2》中達到了大師級水平,也就是超過了99.8%的人類玩家。

OpenAI 成立於 2015 年目標是以安全的方式實現通用人工智慧(AGI),使全人類平等收益,2017年,OpenAI設計的智慧體,就曾與Dota的人類頂級玩家Dendi進行過巔峰對決,並且最終AI大獲全勝。2018年),OpenAI再次派出OpenAI Five,以5V5模式對戰人類頂級陣容。結果,又是以AI100%勝率告終比賽。而就在這些比賽結果出來之前,沒有人曾想過AI會贏。最近幾年,OpenAI推出的自然語言處理大型預訓練模型GPT-3、AI影象生成器Dall-E兩大代表性研究,引領了業界新的技術潮流,也被認為是創造AGI(通用人工智慧)最有實力的公司之一。

在中國代表性的企業的騰訊,2018 年王者榮耀職業聯賽(KPL)秋季賽總決賽上,王者絕悟首次露面,接受前KPL職業選手和職業解說組成的人類戰隊(平均水平超過99%玩家)的5V5水平測試,並取得勝利。這標誌著騰訊 AI Lab 與王者榮耀共同開 啟了對“ AI+遊戲 ”的全新探索,向AI技術走向產業化應用這一命題進一步邁進。騰訊的“王者絕悟”的自我強化學習,也正在為前沿人工智慧技術的核心研究領域的多智慧體系統提供有效的參考範本,推動產業技術發展。

對於不少研究人員和開發者來說,多智慧體技術研究依然存在顯著的現實困難, 基於此,在王者絕悟的基礎上,2019 年 8 月,王者榮耀與騰訊AI Lab 攜手共建“開悟”AI 開放平臺, 利用雙方核心技術,為研究者打造低成本的科研教學平臺,推動多智慧體人工智慧演算法研究、教學和驗證。如今,圍繞“開悟”平臺,王者已與清華、北大等十餘所高校開展教學合作,共同培養AI人才,同時面向國內外高校,構建多層級AI賽事體系,進一步完善高新人才培育體系,深化“產學研”一體化。今年,還面向全球高校,逐步開放“開悟”平臺,助力行業開展科研技術。

6月24日,以“向善同行,以悟丈量世界”為主題的第二屆騰訊STAC科創聯合大會在成都舉行。大會聚焦人工智慧技術,研討人工智慧未來發展和產業趨勢,分享人工智慧的科研成果和實踐案例,全方位呈現人工智慧從底層共性技術到行業、場景應用,以及對產業升級與轉型帶來的深刻影響。

其中騰訊通過王者絕悟、開悟平臺推動的AI+遊戲戰略,是大會的一個亮點。在人類與前沿技術相互擁抱和促進的時代,騰訊不斷加大對王者 AI 的建設,讓 AI 從 0 到 1 去學習進化,並發展出一套合理的行為模式,短期看,可以給遊戲行業、電競行業帶來直接的推動和幫助,中期看,有望在大範圍內,如醫療、製造、無人駕駛、農業到智慧城市等領域帶來更深遠影響。長期來看,AI+遊戲的研究,會推進 AI 的終極目標——通用人工智慧問題的探索和發展。

對通用人工智慧的探索推動著人類進步

但也應該指出,通用人工智慧為未來發展依然存在諸多不確定性因素。迄今為止人類還沒能創造出可以解決多種多樣不同型別問題的人工通用智慧。還沒有聽一兩年人類對話的錄音就能自己說話的機器。儘管 AlphaGo 通過分析數千局比賽然後又進行更多的自我對弈而「學會」了下圍棋,但這同樣的程式卻不能用來掌握打籃球的祕密。

我們目前最好的成就離真正的通用智慧還很遠——真正的通用智慧能靈活地無監督地學習,學習,或能足夠靈活地選擇自己想要學習的內容,不管那是玩棋盤遊戲,還是設計 PC 板。

由此人們對通用人工智慧的各種質疑聲便不絕於耳。比較常見的包括“計算機必須遵循程式,因此不可能有靈活性和創造性”“計算機只能根據形式來使用符號,但無法獲得其意義”“有些真理人能發現,但計算機永遠不能”,一些人聲稱他們已經證明,受制於計算機的某些基本限制,AGI或之類的東西理論上都是不可能的。人工智慧領域的專家對這個問題同樣意見不一。一份最近的專家調查(Future Progress in Artificial Intelligence: A Survey of Expert Opinion)顯示,通用人工智慧可能是 2040-2050 年左右(概率為50%)。正如 LeCun 所言,人類水平的通用智慧距離我們幾十年。

雖然通用人工智是否能真正實現,在科學界依然沒有明確的答案,但是包括Deepmind,OPenAI,王者AI在內團隊用遊戲+的方式對通用人工智慧進行探索,無論最終的結果如何,在這個過程中不斷挖掘出的科學問題,不斷取得的科技成果對人類的未來進步都將是重要的推動力。

(作者:劉鋒 遠望智庫數字大腦研究院院長,南京財經大學教授,中國科學院虛擬經濟與資料科學研究中心研究組成員。)

參考文獻:

1.https://zhuanlan.zhihu.com/p/37416905,王培,通用人工智慧導航:AGI的歷史與現狀。