百度的文心一言 沒有想象中那麼差

語言: CN / TW / HK

robin 的演示

我們用 robin 的演示例子來對比一下 文心一言和 ChatGPT 的真實表現(畢竟釋出會上是錄的)。 注意,我使用的 GPT 版本是 4.0

文學創作

1 三體的作者是哪裡人?

文心一言:

ChatGPT:

嗯,中文表現上文心一言更好。

2 電視劇三體的演員都有誰?

文心一言:

ChatGPT:

關於這個問題 ,由於 ChatGPT 的資料只能查到 2021 年的,所以它不知道是正常的。

3 主演 於和偉 和 張魯一 誰更高?

文心一言:

ChatGPT:

4 可以總結一下《三體》的核心內容嗎?如果要續寫的話,可以從哪些角度出發?

文心一言:

ChatGPT:

雖然網路出一點兒問題,但我更喜歡 ChatGPT 的回答。

商業文案創作

1 如果要成立一個用大模型服務中小企業數字化升級的科技服務公司,可以起個什麼公司名?

文心一言:

ChatGPT:

顯然我更喜歡文心一言的,但如果你跟 ChatGP 繼續聊下去,它可能提供更進一步符合你需求的答案。

2 數智雲圖這個名稱不錯,給我起一個公司的服務 Slogan,表達共贏的概念

文心一言:

ChatGPT:

這一輪文心一言的回答更好。

3 幫我生成一篇公司成立的新聞稿,數智雲圖以共贏的服務理念用大模型服務中小企業數字化升級。字數 600 字

文心一言:

ChatGPT:

ChatGPT 試了幾次網路都有問題,這一輪不好評價。

數理邏輯推算任務

1 雞兔同籠問題

文心一言:

ChatGPT:

這一輪沒有意外,我更喜歡 ChatGPT 的回答。

中文理解能力

1 “洛陽紙貴”是什麼意思?

文心一言:

ChatGPT:

感覺差不多。

2 當時洛陽的紙到底有多貴?

文心一言:

ChatGPT:

那麼這一題,ChatGPT 開始一本正經的胡說八道了。

3 這個成語在現在的經濟學原理裡,對應的理論是什麼?

文心一言:

ChatGPT:

4 用洛陽紙貴四個字寫一首藏頭詩。

文心一言:

ChatGPT:

ChatGPT 給出的結果明顯不對。

多模態生成

目前文心一言的測試版本並不能生成語音和視訊,但是可以直接生成圖片,圖片的質量比想象中的要好,而且還有很多的風格可以選擇,比如說卡通風格,油畫風格,還有很多的風格,可以滿足不同的需求。

繪畫能力應該是集成了現成的文心一格。

以下是我試的幾個例子

描述: 請為 2023 世界智慧交通大會創作一張海報。

描述:“灌木叢中的一朵機械花,有金屬花瓣,周圍環境和人的鏡面反射,鳥瞰圖。 構圖誇張,具有強烈的視覺衝擊力和敘事性”

描述:“雨天香港、哥特式建築 3D 畫風”

描述:“一隻睡在櫃子上面的貓,卡通風格”

描述:“麥田中的少年,油畫風”

坦率講與 midjourney 的繪畫能力相比,文心一格的繪畫能力還是有差距的。

程式設計

1 請幫我寫一個網頁版的貪吃蛇遊戲

文心一言:

ChatGPT:

雖然又遇到了網路問題,但各位開發老鐵們,不用我說了吧,都知道該選啥哈

2 生成測試資料

文心一言:

ChatGPT:

ChatGPT 完勝

文心一言使用注意事項

在使用過程中出現了排隊的情況:

這我在使用 ChatGPT 的時候可沒有遇到過。

可以輸入“/” 來獲取模版

繪畫的例子上文舉過了,我們來看看剩下 2 個:

查一個知識

寫一篇報告

總結

經過試用文心一言,再對比 ChatGPT,我認為:文心在中文語料上應該是更豐富些。多語言上目前一定不如 ChatGPT 優秀。雖然這兩個模型在某些方面有所重疊,但它們在應對特定語言和領域問題時具有各自的優勢。

其實最令我意外的是,文心一言並沒有釋出會時讓人感覺的那麼差。它不是 chatPPT, 至少目前看不是,它完成了從 0 到 1 的過程 ,雖然有差距,但還是真心地希望國內的企業能夠在 AI 的領域做出一些成績,而不是一味地跟風。

我現在理解了 😊