GPT-4 VS 文心一言,百度的未來在哪裏?

語言: CN / TW / HK

隨着AI的大火,最近AI圈可謂風雲際會,各方大佬紛紛登場。在3月14日,GPT-4的發佈會圓滿結束,3月15日,百度的李彥宏也做了文心一言的發佈會,沒看過的小夥伴,可以在網上搜搜發佈會的視頻。

“文心一言”各種梗圖

百度真“人工”智能

機智的網友讓GPT-4評價文心一言,上演現實版的同行相輕

發佈會上李彥宏步履蹣跚,表情略顯緊張,沒有往日的自信從容。那麼百度的文心一言和GPT相比到底實力如何?是騾子是馬,咱們拉出來遛遛。

GPT-4 VS 文心一言

接下來主要從

多模態生成,數理邏輯推算,編程方面,擬人化,算力方面,中文理解,應用生態

等方面分析下到底誰強誰弱

GPT-4

OpenAI老闆Sam Altman評價GPT-4是目前為止最強的AI,根據OpenAI官方的介紹,GPT-4是一個超大的多模態模型,它的輸入可以是文字(上限2.5萬字),還可以是圖像

最令人驚訝的是隻需要簡單在紙上畫一個網站的草稿圖,拍一張照片上傳給GPT-4,它就可以立馬生成網站的HTML代碼!(以後程序員真要失業了

OpenAI自稱:在各種專業和學術基準上和人類相當!敢這麼狂妄,背後還是有東西的!

多模態能力

所謂多模態能力,即可以接受圖像輸入並理解圖像內容,並且可接受的文字輸入長度也增加到3.2萬個字符(約2.4萬單詞)。比如模擬律師考試,GPT-4取得了前10%的好成績,相比之下GPT-3.5是倒數10%,做美國高考SAT試題,GPT-4也在閲讀寫作中拿下710分高分、數學700分(滿分800)

看圖能力可以用來解釋表情包、梗圖

提問這張圖哪裏好笑?GPT-4可以按順序描述出每一格的內容,並總結出笑點:

用巨大的過時VGA接口給小巧的現代智能手機充電

數理邏輯推算

發GPT-4可以理解圖表中數據的含義,並做進一步計算

編程方面

發佈會直播上,OpenAI總裁現場表演了一波GPT-4給代碼修Bug

出現問題啥也不用想,直接把2.4萬字的程序文檔一股腦扔給GPT-4就行。你只需要精通CV(複製粘貼)大法即可

並且能在幾秒鐘內瞬間得到解決辦法

擬人化

GPT-4還開放了一個使用功能,允許修改“系統提示”,使其感覺更像真人一樣!之前ChatGPT的回答總是宂長而平淡,這是因為系統提示中規定了“你只是一個語言模型……你的知識截止於2021年9月。現在通過修改“系統提示”,GPT-4就可以展現出更多樣的性格,比如扮演蘇格拉底

應用生態

必應早就用上了GPT-4,並得到了微軟方面的證實

微軟給OpenAI提供超算服務吸引企業來使用Azure訓練自己的大模型,同時直接在Azure中提供OpenAI模型服務(Azure OpenAI Service),此前包括GPT-3、Codex和DALL·E 2等模型,都已經接入Azure

中文理解

GPT-4在中文理解方面的確稍遜一籌。

文心一言

和GPT-4一樣,文心一言是一個多模態大模型。李彥宏會上展示了文心一言具備的5種能力,包括

文學創作、商業文案創作、數理邏輯推算、中文理解、多模態生成

文學創作

在文學創作上,李彥宏先來了一個最簡單的提問,問《三體》作者是哪裏人?先讓文心一言介紹一下大劉,“畢竟我(文心一言)和劉慈欣是老鄉嘛,都來自陽泉”

結果大錯特錯,直接把劉慈欣的老家張冠李戴到了湖北省洪湖市

商業文案創作

比如給新公司起個名字,並且這個名字它還有理有據,有跡可循

中文理解

發佈會上,李彥宏向觀眾展示了文心一言對中文的理解能力,並自信地説:文心一言對中國文化的瞭解,理應超出任何一個預訓練大模型

為了證明這一點,李彥宏輸入了一個問題:“洛陽紙貴。到底有多貴?”,文心一言不僅展現了歷史淵源,還介紹了這個成語背後的經濟學原理

我們再來問問GPT-4呢

在標準化的回答方面兩者似乎旗鼓相當

那麼,難度再提高下,看看二者寫藏頭詩的能力

GPT-4沒有真正理解“藏頭詩”的含義

在中文理解上,屬實是文心一言“小勝一籌”了。不過在英文上,李彥宏也承認,雖然文心一言也能處理,但能力是顯著不如中文的。

數理邏輯推算

數學思維能力方面,文心一言處理的數學問題不算複雜,是小學常見的雞兔同籠問題

有趣的是,李彥宏現場展示的第一題,引得文心一言説出了《狂飆》裏高啟盛的經典台詞:這題出得不對。看起來更具擬人化

李彥宏表示,這些題“不敢説百分之一百能做對,但至少體現了文心一言的思考歷程”

在邏輯推理方面相比GPT-4,個人覺得文心一言處理的還是有點小兒科了,擬人化方面暫時先對半分吧

多模態能力

為即將到來的2023世界智能交通大會創作海報,並且支持文字轉視頻,文字轉語音能力

相比GPT的強大,文心一言差的不是一星半點

編程方面

有些遺憾的是,在ChatGPT被頻頻稱讚的編程方面,文心一言並沒有現場展示相關能力,只能認為目前不具備或者只具備很弱的能力,和GPT不能相提並論

算力方面

文心一言底層算力支持,是位於李彥宏老家陽泉的百度陽泉智算中心,專門為自家大模型產品文心一言提供計算推理的算力需求,陽泉智算中心是亞洲單體最大的智算中心,算力規模可達4EFLOPS(每秒400億億次浮點計算)

但相比微軟的大投入,上萬張英偉達A100芯片,幾十萬張GPU還是稍遜

應用生態

目前,文心一言在百度內部已經接入百度搜索,小度和自動駕駛Apollo等產品,外部包括愛奇藝等650家公司也已經接入

生態方面也僅限國內相比還是不足

文心一言背後原理

據王海峯(百度首席技術官(CTO),深度學習技術及應用國家工程研究中心主任)介紹,文心一言主要脱胎於兩大模型,六項核心技術。

兩大模型:

百度ERNIE系列知識增強千億大模型,以及百度大規模開放域對話模型PLATO

六項核心技術:其中三個是廣為人知的大模型技術,包括有監督精調、人類反饋強化學習和提示構建。另外三個,則是“百度特色”的技術,

包括知識增強、檢索增強和對話增強技術

總結

誠然,文心一言和GPT-4還有很大差距。雖然網上很多人對文心一言抨擊的一文不值,批評的體無完膚,但是這也是大家對百度的期望太高。對比GPT-4的光芒萬丈就顯得自慚形穢了,但百度作為國內AI的頭部企業實力還是不容小覷的,在中文處理方面有着得天獨厚的優勢,而且在AI的很多應用場景也有着自己的貢獻。

希望大家能理性看待百度的文心一言,雖然還有缺陷,但隨着時間的流逝,我相信國產AI會有着屬於自己的輝煌,讓AI真正的服務給更多的人。

就像有句話説的,世界上不能只有一種聲音,一枝獨秀不是春,百花齊放才是春。