國內有哪些對標 ChatGPT 的大語言模型? 5 大競品

語言: CN / TW / HK

ChatGPT 是基於 大語言模型 的聊天機器人,而這個大語言模型是一個人工智慧領域概念、技術。

大語言模型通常有十億、百億級的引數,需要非常強大的算力、和非常多的用於訓練的資料資源。它對海量的無標註資料進行預訓練、通過微調和零樣本學習來變形、應用。

對大模型的“變形”(DIY),不僅能增強 AI 技術的通用性,還能擴充套件應用場景、人人都可以用“大模型”,這樣也利於形成了一個開放的生態,激發大眾創新。

GPT 時代,國內學界和企業也相繼基於大語言模型推出自研的大模型。比如:

百度的“文心一言”、復旦大學的“MOSS”、騰訊的“HunYuan大模型”、阿里的“通義大模型”、華為的“盤古大模型”等等。

| 自研單位 | 大模型| | --- | --- | | 百度 | 文心一言 | | 復旦大學 | MOSS | |騰訊|HunYuan| |阿里|通義| |華為|盤古|

本篇就將簡要介紹這 5 個國內的這些大語言模型~ <喜歡三連👍👍👍筆芯>

百度-文心一言

以上這麼多國內大語言模型,目前,最引人注目的就是“文心一言”,它也可以生成各種型別的文字,比如詩歌、小說、新聞等。同時,它被認為是中國 AI 新舊時代劃分里程碑式的產品。

怎樣體驗?

1.通過百度智慧雲 API 介面呼叫文心一言的服務;

2.進入官網 https://wenxin.baidu.com/ 體驗;

image.png

image.png

文字的理解和創作還是“敬請期待”。。

在開放 API 體驗 AI 根據文字、風格作畫:

image.png

前的產品中心只有“文心百中”和“文心一格”兩個產品。

看下“文心百中” 提供的體驗示例:

image.png

實際用起來,跟 ChatGPT / New Bing / Notion AI 比,感覺差距還很大~ 文心百中還是停留在搜尋結果上,沒有做到聯絡上下文整合。

image.png

文心一格主要提供一些:聯想腦洞生成相關圖片推薦,試了下,也不夠準確。。

用一成語小結:任重道遠

復旦大學-MOSS

MOSS 命名上和電影《流浪地球》的 AI MOSS 同名,寓意人和人工智慧共同拯救地球。目前,它的引數規模約是 ChatGPT 的 十分之一,仍處在內測階段,預計三月底開源。

image.png

MOSS 的優勢是什麼?

MOSS 因為引數規模小,所以更節省計算資源和儲存空間,易於部署和應用。

另外,MOSS 在設計時還考慮了人類的倫理道德準則,不會產生有偏見或可能有害的回答,這樣可以避免一些潛在的法律風險和商業倫理問題。這點上,ChatGPT 則沒有明確地處理。

騰訊-HunYuan

HunYuan 利用了騰訊的研發力量,完整覆蓋 NLP 大模型、CV 大模型、多模態大模型及其它行業領域任務模型,可謂是:集大成者。

它的目標是打造行業領先的 AI 預訓練大模型,以統一平臺,對技術複用,使 AI 技術適用於更多場景,並且降低成本。

HunYuan 的引數量級是 萬億!從這點看,騰訊的 HunYuan 格局(畫餅)就比 文心一言、MOSS 要大的多的多~~

對於公眾 HunYuan 目前也是在內測優化中,未來值得期待。

但 HunYuan 的 NLP 部分,HunYuan-NLP 已經在多個騰訊產品中得到應用,一樣也是用於生成文字,比如對話生成、小說續寫、廣告生成等。

image.png

阿里-通義

阿里的通義模型是一系列基於【自然語言處理和多模態理解與生成】的 AI 模型,旨在打造國內首個 AI 統一底座。

它包括以下幾個核心模型:

1.AliceMind-PLUG:語言大模型,能夠在多箇中文語言理解任務上超越人類水平。

2.AliceMind-mPLUG:多模態理解與生成統一模型,能夠處理圖文、視訊等多種資料型別,並進行跨模態搜尋、生成等任務。

3.M6-OFA:多模態統一底座模型,能夠根據不同的場景和裝置動態調整模型大小和效能。

4.S4:超大模型落地關鍵技術框架,能夠支援百億級別引數的訓練和推理。

image.png

阿里的這個部署算是最早一批了,值得期待。

目前,我們可以在 魔搭社群 https://modelscope.cn/home 找到通義大模型的部分開原始碼。比如你可以體驗中文版的GPT-3 等。

華為-盤古

盤古,這個大家也常聽到吧?也屬於是大名鼎鼎。

盤古大模型是一系列超大規模的預訓練模型,包括NLP、CV、多模態和科學計算等。

其中,盤古NLP大模型是 全球最大 的千億引數中文語言預訓練模型,它能夠進行內容生成和內容理解等任務。

盤古CV大模型是 全球最大 的30億引數視覺預訓練模型,它能夠進行分類、分割和檢測等任務。

這兩個全球最大是亮點~ 目前,盤古大模型在華為雲:https://www.huaweicloud.com/ 上提供服務。

image.png

小結

整個看完下來,我的感覺就是:雖然我們現在的 大模型 GPT 商用還沒有像 ChatGPT 或 New bing 或 Notion AI 那麼直接能給到大眾去使用,但是國內這些最優秀的一批企業/高校也一直在推進這個事情。

技術存在差距,不承認也不行,就像之前所分享的,ChatGPT 能站到大眾面前,也經過了美國各科技公司十多年的沉澱、演進,所以我們可能還是起步有點遲了。

但不怕慢就怕站,我們知道訓練 AI 大模型 是個方向,就走起來就好了,加油吧~ Maybe 頂峰再見~


OK,以上便是本篇分享,希望各位工友喜歡~ 歡迎點贊、收藏、評論 🤟

我是掘金安東尼 🤠 100 萬人氣前端技術博主 💥 INFP 寫作人格堅持 1000 日更文 ✍ 關注我,安東尼陪你一起度過漫長程式設計歲月 🌏

😹 加我微信 ATAR53,拉你入群,定期抽獎、粉絲福利多多。只學習交友、不推文賣課~


本文正在參加「金石計劃」