隨着AI的大火，最近AI圈可謂風雲際會，各方大佬紛紛登場。在3月14日，GPT-4的發佈會圓滿結束，3月15日，百度的李彥宏也做了文心一言的發佈會，沒看過的小夥伴，可以在網上搜搜發佈會的視頻。

“文心一言”各種梗圖

百度真“人工”智能

機智的網友讓GPT-4評價文心一言，上演現實版的同行相輕

發佈會上李彥宏步履蹣跚，表情略顯緊張，沒有往日的自信從容。那麼百度的文心一言和GPT相比到底實力如何？是騾子是馬，咱們拉出來遛遛。

GPT-4 VS 文心一言

接下來主要從

多模態生成，數理邏輯推算，編程方面，擬人化，算力方面，中文理解，應用生態

等方面分析下到底誰強誰弱

GPT-4

OpenAI老闆Sam Altman評價GPT-4是目前為止最強的AI,根據OpenAI官方的介紹，GPT-4是一個超大的多模態模型，它的輸入可以是文字（上限2.5萬字），還可以是圖像

最令人驚訝的是隻需要簡單在紙上畫一個網站的草稿圖，拍一張照片上傳給GPT-4，它就可以立馬生成網站的HTML代碼！（以後程序員真要失業了

）

OpenAI自稱：在各種專業和學術基準上和人類相當！敢這麼狂妄，背後還是有東西的！

多模態能力

所謂多模態能力，即可以接受圖像輸入並理解圖像內容，並且可接受的文字輸入長度也增加到3.2萬個字符（約2.4萬單詞）。比如模擬律師考試，GPT-4取得了前10%的好成績，相比之下GPT-3.5是倒數10%，做美國高考SAT試題，GPT-4也在閲讀寫作中拿下710分高分、數學700分（滿分800）

看圖能力可以用來解釋表情包、梗圖

提問這張圖哪裏好笑？GPT-4可以按順序描述出每一格的內容，並總結出笑點：

用巨大的過時VGA接口給小巧的現代智能手機充電

數理邏輯推算

發GPT-4可以理解圖表中數據的含義，並做進一步計算

編程方面

發佈會直播上，OpenAI總裁現場表演了一波GPT-4給代碼修Bug

出現問題啥也不用想，直接把2.4萬字的程序文檔一股腦扔給GPT-4就行。你只需要精通CV（複製粘貼）大法即可

並且能在幾秒鐘內瞬間得到解決辦法

擬人化

GPT-4還開放了一個使用功能，允許修改“系統提示”，使其感覺更像真人一樣！之前ChatGPT的回答總是宂長而平淡，這是因為系統提示中規定了“你只是一個語言模型……你的知識截止於2021年9月。現在通過修改“系統提示”，GPT-4就可以展現出更多樣的性格，比如扮演蘇格拉底

應用生態

必應早就用上了GPT-4，並得到了微軟方面的證實

微軟給OpenAI提供超算服務吸引企業來使用Azure訓練自己的大模型，同時直接在Azure中提供OpenAI模型服務（Azure OpenAI Service），此前包括GPT-3、Codex和DALL·E 2等模型，都已經接入Azure

中文理解

GPT-4在中文理解方面的確稍遜一籌。

文心一言

和GPT-4一樣，文心一言是一個多模態大模型。李彥宏會上展示了文心一言具備的5種能力，包括

文學創作、商業文案創作、數理邏輯推算、中文理解、多模態生成

文學創作

在文學創作上，李彥宏先來了一個最簡單的提問，問《三體》作者是哪裏人？先讓文心一言介紹一下大劉，“畢竟我（文心一言）和劉慈欣是老鄉嘛，都來自陽泉”

結果大錯特錯，直接把劉慈欣的老家張冠李戴到了湖北省洪湖市

商業文案創作

比如給新公司起個名字，並且這個名字它還有理有據，有跡可循

中文理解

發佈會上，李彥宏向觀眾展示了文心一言對中文的理解能力，並自信地説：文心一言對中國文化的瞭解，理應超出任何一個預訓練大模型

為了證明這一點，李彥宏輸入了一個問題：“洛陽紙貴。到底有多貴？”,文心一言不僅展現了歷史淵源，還介紹了這個成語背後的經濟學原理

我們再來問問GPT-4呢

在標準化的回答方面兩者似乎旗鼓相當

那麼，難度再提高下，看看二者寫藏頭詩的能力

GPT-4沒有真正理解“藏頭詩”的含義

在中文理解上，屬實是文心一言“小勝一籌”了。不過在英文上，李彥宏也承認，雖然文心一言也能處理，但能力是顯著不如中文的。

數理邏輯推算

數學思維能力方面，文心一言處理的數學問題不算複雜，是小學常見的雞兔同籠問題

有趣的是，李彥宏現場展示的第一題，引得文心一言説出了《狂飆》裏高啟盛的經典台詞：這題出得不對。看起來更具擬人化

李彥宏表示，這些題“不敢説百分之一百能做對，但至少體現了文心一言的思考歷程”

在邏輯推理方面相比GPT-4,個人覺得文心一言處理的還是有點小兒科了，擬人化方面暫時先對半分吧

多模態能力

為即將到來的2023世界智能交通大會創作海報，並且支持文字轉視頻，文字轉語音能力

相比GPT的強大，文心一言差的不是一星半點

編程方面

有些遺憾的是，在ChatGPT被頻頻稱讚的編程方面，文心一言並沒有現場展示相關能力，只能認為目前不具備或者只具備很弱的能力，和GPT不能相提並論

算力方面

文心一言底層算力支持，是位於李彥宏老家陽泉的百度陽泉智算中心，專門為自家大模型產品文心一言提供計算推理的算力需求，陽泉智算中心是亞洲單體最大的智算中心，算力規模可達4EFLOPS（每秒400億億次浮點計算）

但相比微軟的大投入，上萬張英偉達A100芯片，幾十萬張GPU還是稍遜

應用生態

目前，文心一言在百度內部已經接入百度搜索，小度和自動駕駛Apollo等產品，外部包括愛奇藝等650家公司也已經接入

生態方面也僅限國內相比還是不足

文心一言背後原理

據王海峯（百度首席技術官(CTO)，深度學習技術及應用國家工程研究中心主任）介紹，文心一言主要脱胎於兩大模型，六項核心技術。

兩大模型：

百度ERNIE系列知識增強千億大模型，以及百度大規模開放域對話模型PLATO

六項核心技術：其中三個是廣為人知的大模型技術，包括有監督精調、人類反饋強化學習和提示構建。另外三個，則是“百度特色”的技術，

包括知識增強、檢索增強和對話增強技術

總結

誠然，文心一言和GPT-4還有很大差距。雖然網上很多人對文心一言抨擊的一文不值，批評的體無完膚，但是這也是大家對百度的期望太高。對比GPT-4的光芒萬丈就顯得自慚形穢了，但百度作為國內AI的頭部企業實力還是不容小覷的，在中文處理方面有着得天獨厚的優勢，而且在AI的很多應用場景也有着自己的貢獻。

希望大家能理性看待百度的文心一言，雖然還有缺陷，但隨着時間的流逝，我相信國產AI會有着屬於自己的輝煌，讓AI真正的服務給更多的人。

就像有句話説的，世界上不能只有一種聲音，一枝獨秀不是春，百花齊放才是春。

GPT-4 VS 文心一言，百度的未來在哪裏？

“文心一言”各種梗圖

GPT-4 VS 文心一言

GPT-4

多模態能力

數理邏輯推算

編程方面

擬人化

應用生態

中文理解

文心一言

文學創作

商業文案創作

中文理解

數理邏輯推算

多模態能力

編程方面

算力方面

應用生態

文心一言背後原理

總結