GPT-4 VS 文心一言,百度的未來在哪裏?
隨着AI的大火,最近AI圈可謂風雲際會,各方大佬紛紛登場。在3月14日,GPT-4的發佈會圓滿結束,3月15日,百度的李彥宏也做了文心一言的發佈會,沒看過的小夥伴,可以在網上搜搜發佈會的視頻。
“文心一言”各種梗圖
百度真“人工”智能
機智的網友讓GPT-4評價文心一言,上演現實版的同行相輕
發佈會上李彥宏步履蹣跚,表情略顯緊張,沒有往日的自信從容。那麼百度的文心一言和GPT相比到底實力如何?是騾子是馬,咱們拉出來遛遛。
GPT-4 VS 文心一言
接下來主要從
多模態生成,數理邏輯推算,編程方面,擬人化,算力方面,中文理解,應用生態
等方面分析下到底誰強誰弱
GPT-4
OpenAI老闆Sam Altman評價GPT-4是目前為止最強的AI,根據OpenAI官方的介紹,GPT-4是一個超大的多模態模型,它的輸入可以是文字(上限2.5萬字),還可以是圖像
最令人驚訝的是隻需要簡單在紙上畫一個網站的草稿圖,拍一張照片上傳給GPT-4,它就可以立馬生成網站的HTML代碼!(以後程序員真要失業了
)
OpenAI自稱:在各種專業和學術基準上和人類相當!敢這麼狂妄,背後還是有東西的!
多模態能力
所謂多模態能力,即可以接受圖像輸入並理解圖像內容,並且可接受的文字輸入長度也增加到3.2萬個字符(約2.4萬單詞)。比如模擬律師考試,GPT-4取得了前10%的好成績,相比之下GPT-3.5是倒數10%,做美國高考SAT試題,GPT-4也在閲讀寫作中拿下710分高分、數學700分(滿分800)
看圖能力可以用來解釋表情包、梗圖
提問這張圖哪裏好笑?GPT-4可以按順序描述出每一格的內容,並總結出笑點:
用巨大的過時VGA接口給小巧的現代智能手機充電
數理邏輯推算
發GPT-4可以理解圖表中數據的含義,並做進一步計算
編程方面
發佈會直播上,OpenAI總裁現場表演了一波GPT-4給代碼修Bug
出現問題啥也不用想,直接把2.4萬字的程序文檔一股腦扔給GPT-4就行。你只需要精通CV(複製粘貼)大法即可
並且能在幾秒鐘內瞬間得到解決辦法
擬人化
GPT-4還開放了一個使用功能,允許修改“系統提示”,使其感覺更像真人一樣!之前ChatGPT的回答總是宂長而平淡,這是因為系統提示中規定了“你只是一個語言模型……你的知識截止於2021年9月。現在通過修改“系統提示”,GPT-4就可以展現出更多樣的性格,比如扮演蘇格拉底
應用生態
必應早就用上了GPT-4,並得到了微軟方面的證實
微軟給OpenAI提供超算服務吸引企業來使用Azure訓練自己的大模型,同時直接在Azure中提供OpenAI模型服務(Azure OpenAI Service),此前包括GPT-3、Codex和DALL·E 2等模型,都已經接入Azure
中文理解
GPT-4在中文理解方面的確稍遜一籌。
文心一言
和GPT-4一樣,文心一言是一個多模態大模型。李彥宏會上展示了文心一言具備的5種能力,包括
文學創作、商業文案創作、數理邏輯推算、中文理解、多模態生成
文學創作
在文學創作上,李彥宏先來了一個最簡單的提問,問《三體》作者是哪裏人?先讓文心一言介紹一下大劉,“畢竟我(文心一言)和劉慈欣是老鄉嘛,都來自陽泉”
結果大錯特錯,直接把劉慈欣的老家張冠李戴到了湖北省洪湖市
商業文案創作
比如給新公司起個名字,並且這個名字它還有理有據,有跡可循
中文理解
發佈會上,李彥宏向觀眾展示了文心一言對中文的理解能力,並自信地説:文心一言對中國文化的瞭解,理應超出任何一個預訓練大模型
為了證明這一點,李彥宏輸入了一個問題:“洛陽紙貴。到底有多貴?”,文心一言不僅展現了歷史淵源,還介紹了這個成語背後的經濟學原理
我們再來問問GPT-4呢
在標準化的回答方面兩者似乎旗鼓相當
那麼,難度再提高下,看看二者寫藏頭詩的能力
GPT-4沒有真正理解“藏頭詩”的含義
在中文理解上,屬實是文心一言“小勝一籌”了。不過在英文上,李彥宏也承認,雖然文心一言也能處理,但能力是顯著不如中文的。
數理邏輯推算
數學思維能力方面,文心一言處理的數學問題不算複雜,是小學常見的雞兔同籠問題
有趣的是,李彥宏現場展示的第一題,引得文心一言説出了《狂飆》裏高啟盛的經典台詞:這題出得不對。看起來更具擬人化
李彥宏表示,這些題“不敢説百分之一百能做對,但至少體現了文心一言的思考歷程”
在邏輯推理方面相比GPT-4,個人覺得文心一言處理的還是有點小兒科了,擬人化方面暫時先對半分吧
多模態能力
為即將到來的2023世界智能交通大會創作海報,並且支持文字轉視頻,文字轉語音能力
相比GPT的強大,文心一言差的不是一星半點
編程方面
有些遺憾的是,在ChatGPT被頻頻稱讚的編程方面,文心一言並沒有現場展示相關能力,只能認為目前不具備或者只具備很弱的能力,和GPT不能相提並論
算力方面
文心一言底層算力支持,是位於李彥宏老家陽泉的百度陽泉智算中心,專門為自家大模型產品文心一言提供計算推理的算力需求,陽泉智算中心是亞洲單體最大的智算中心,算力規模可達4EFLOPS(每秒400億億次浮點計算)
但相比微軟的大投入,上萬張英偉達A100芯片,幾十萬張GPU還是稍遜
應用生態
目前,文心一言在百度內部已經接入百度搜索,小度和自動駕駛Apollo等產品,外部包括愛奇藝等650家公司也已經接入
生態方面也僅限國內相比還是不足
文心一言背後原理
據王海峯(百度首席技術官(CTO),深度學習技術及應用國家工程研究中心主任)介紹,文心一言主要脱胎於兩大模型,六項核心技術。
兩大模型:
百度ERNIE系列知識增強千億大模型,以及百度大規模開放域對話模型PLATO
六項核心技術:其中三個是廣為人知的大模型技術,包括有監督精調、人類反饋強化學習和提示構建。另外三個,則是“百度特色”的技術,
包括知識增強、檢索增強和對話增強技術
總結
誠然,文心一言和GPT-4還有很大差距。雖然網上很多人對文心一言抨擊的一文不值,批評的體無完膚,但是這也是大家對百度的期望太高。對比GPT-4的光芒萬丈就顯得自慚形穢了,但百度作為國內AI的頭部企業實力還是不容小覷的,在中文處理方面有着得天獨厚的優勢,而且在AI的很多應用場景也有着自己的貢獻。
希望大家能理性看待百度的文心一言,雖然還有缺陷,但隨着時間的流逝,我相信國產AI會有着屬於自己的輝煌,讓AI真正的服務給更多的人。
就像有句話説的,世界上不能只有一種聲音,一枝獨秀不是春,百花齊放才是春。
- GPT-4 VS 文心一言,百度的未來在哪裏?
- 漫畫:什麼是IaaS、PaaS、SaaS?
- 我英語不好,能學編程嗎?
- 我數學不好,適合做程序員嗎?
- 漫畫:什麼是“元宇宙”?
- 算法的本質是什麼?程序員如何學好算法?
- 漫畫:什麼是“貪心算法”?如何求解“部分揹包問題”?
- 漫畫:什麼是 “建造者模式” ?
- 漫畫:什麼是 “幼態持續” ?
- 開一間蜜雪冰城能掙多少錢?
- 一座適合躺屍的低房價、慢節奏小城
- 漫畫:Object類很大,你忍一下(完結篇)
- 我永遠不會忘記你,送外賣的好哥哥!
- 這個行業徹底涼了。。
- 我在國企外包一年的經歷和感受
- 認知水平越低的人,越喜歡回覆“收到”
- 兄弟們,可以學!但別亂用!!
- 不論跳不跳槽,簡歷越早寫上這個,越穩!!!
- 什麼是 “分佈式鎖” ?
- 項目做的再多有什麼用?還不是拿不到offer