国内有哪些对标 ChatGPT 的大语言模型? 5 大竞品
ChatGPT 是基于 大语言模型 的聊天机器人,而这个大语言模型是一个人工智能领域概念、技术。
大语言模型通常有十亿、百亿级的参数,需要非常强大的算力、和非常多的用于训练的数据资源。它对海量的无标注数据进行预训练、通过微调和零样本学习来变形、应用。
对大模型的“变形”(DIY),不仅能增强 AI 技术的通用性,还能扩展应用场景、人人都可以用“大模型”,这样也利于形成了一个开放的生态,激发大众创新。
GPT 时代,国内学界和企业也相继基于大语言模型推出自研的大模型。比如:
百度的“文心一言”、复旦大学的“MOSS”、腾讯的“HunYuan大模型”、阿里的“通义大模型”、华为的“盘古大模型”等等。
| 自研单位 | 大模型| | --- | --- | | 百度 | 文心一言 | | 复旦大学 | MOSS | |腾讯|HunYuan| |阿里|通义| |华为|盘古|
本篇就将简要介绍这 5 个国内的这些大语言模型~ <喜欢三连👍👍👍笔芯>
百度-文心一言
以上这么多国内大语言模型,目前,最引人注目的就是“文心一言”,它也可以生成各种类型的文本,比如诗歌、小说、新闻等。同时,它被认为是中国 AI 新旧时代划分里程碑式的产品。
怎样体验?
1.通过百度智能云 API 接口调用文心一言的服务;
2.进入官网 http://wenxin.baidu.com/ 体验;
文本的理解和创作还是“敬请期待”。。
在开放 API 体验 AI 根据文字、风格作画:
前的产品中心只有“文心百中”和“文心一格”两个产品。
看下“文心百中” 提供的体验示例:
实际用起来,跟 ChatGPT / New Bing / Notion AI 比,感觉差距还很大~ 文心百中还是停留在搜索结果上,没有做到联系上下文整合。
文心一格主要提供一些:联想脑洞生成相关图片推荐,试了下,也不够准确。。
用一成语小结:任重道远
复旦大学-MOSS
MOSS 命名上和电影《流浪地球》的 AI MOSS 同名,寓意人和人工智能共同拯救地球。目前,它的参数规模约是 ChatGPT 的 十分之一,仍处在内测阶段,预计三月底开源。
MOSS 的优势是什么?
MOSS 因为参数规模小,所以更节省计算资源和存储空间,易于部署和应用。
另外,MOSS 在设计时还考虑了人类的伦理道德准则,不会产生有偏见或可能有害的回答,这样可以避免一些潜在的法律风险和商业伦理问题。这点上,ChatGPT 则没有明确地处理。
腾讯-HunYuan
HunYuan 利用了腾讯的研发力量,完整覆盖 NLP 大模型、CV 大模型、多模态大模型及其它行业领域任务模型,可谓是:集大成者。
它的目标是打造行业领先的 AI 预训练大模型,以统一平台,对技术复用,使 AI 技术适用于更多场景,并且降低成本。
HunYuan 的参数量级是 万亿!从这点看,腾讯的 HunYuan 格局(画饼)就比 文心一言、MOSS 要大的多的多~~
对于公众 HunYuan 目前也是在内测优化中,未来值得期待。
但 HunYuan 的 NLP 部分,HunYuan-NLP 已经在多个腾讯产品中得到应用,一样也是用于生成文本,比如对话生成、小说续写、广告生成等。
阿里-通义
阿里的通义模型是一系列基于【自然语言处理和多模态理解与生成】的 AI 模型,旨在打造国内首个 AI 统一底座。
它包括以下几个核心模型:
1.AliceMind-PLUG:语言大模型,能够在多个中文语言理解任务上超越人类水平。
2.AliceMind-mPLUG:多模态理解与生成统一模型,能够处理图文、视频等多种数据类型,并进行跨模态搜索、生成等任务。
3.M6-OFA:多模态统一底座模型,能够根据不同的场景和设备动态调整模型大小和性能。
4.S4:超大模型落地关键技术框架,能够支持百亿级别参数的训练和推理。
阿里的这个部署算是最早一批了,值得期待。
目前,我们可以在 魔搭社区 http://modelscope.cn/home 找到通义大模型的部分开源代码。比如你可以体验中文版的GPT-3 等。
华为-盘古
盘古,这个大家也常听到吧?也属于是大名鼎鼎。
盘古大模型是一系列超大规模的预训练模型,包括NLP、CV、多模态和科学计算等。
其中,盘古NLP大模型是 全球最大 的千亿参数中文语言预训练模型,它能够进行内容生成和内容理解等任务。
盘古CV大模型是 全球最大 的30亿参数视觉预训练模型,它能够进行分类、分割和检测等任务。
这两个全球最大是亮点~ 目前,盘古大模型在华为云:http://www.huaweicloud.com/ 上提供服务。
小结
整个看完下来,我的感觉就是:虽然我们现在的 大模型 GPT 商用还没有像 ChatGPT 或 New bing 或 Notion AI 那么直接能给到大众去使用,但是国内这些最优秀的一批企业/高校也一直在推进这个事情。
技术存在差距,不承认也不行,就像之前所分享的,ChatGPT 能站到大众面前,也经过了美国各科技公司十多年的沉淀、演进,所以我们可能还是起步有点迟了。
但不怕慢就怕站,我们知道训练 AI 大模型 是个方向,就走起来就好了,加油吧~ Maybe 顶峰再见~
OK,以上便是本篇分享,希望各位工友喜欢~ 欢迎点赞、收藏、评论 🤟
我是掘金安东尼 🤠 100 万人气前端技术博主 💥 INFP 写作人格坚持 1000 日更文 ✍ 关注我,安东尼陪你一起度过漫长编程岁月 🌏
😹 加我微信 ATAR53,拉你入群,定期抽奖、粉丝福利多多。只学习交友、不推文卖课~
本文正在参加「金石计划」
- ChatGPT 不过如此,Kosmos-1 更胜一筹?微软这波又赢了
- “ChatGPT 们” 所需算力真是“贵滴夸张”!
- 国内有哪些对标 ChatGPT 的大语言模型? 5 大竞品
- 常用!提前 reject promise 的 2 种场景,收藏等于学会
- 编程开发新朋友 —— ChatGPT 和 NotionAI 实战
- 为什么我更推荐 Notion AI 胜于 ChatGPT ?
- 推荐 5 个你大概率没见过的免费 API ,一键获取数据!
- ✨从纯函数讲起,一窥最深刻的函子 Monad
- 神马?要退役 JavaScript ?!谁人出此狂言?!
- 写出干净的 JavaScript 5 个小技巧
- 想要白嫖正则是吧?这一次给你个够!
- 浅聊缓存函数
- JavaScript 中如何取消请求
- 知其然,而知其所以然,JS 对象创建与继承【汇总梳理】
- 10 个 Reduce 常用“奇技淫巧”
- 万字年中总结,共勉
- 4 个 JavaScript 最基础的问题 —— Eric Elliott
- 日拱算法:搜索二维矩阵 II
- 日拱算法:多数元素
- 日拱算法:只出现一次的数字