ChatGPT 不過如此,Kosmos-1 更勝一籌?微軟這波又贏了

語言: CN / TW / HK

就在上週,微軟繼推出 new bing 之後,在 AIGC 領域再爆重磅炸彈:推出比 ChatGPT 更加全能的 AI —— AI--Kosmos-1

image.png

Kosmos,該詞源於希臘語 kosmos,意思是:宇宙、和諧、表示一個有序且和諧的系統,與另外一個單詞 chaos (混亂)相對。

怎麼讀?

image.png

本瓜:科哦日摸斯~~

ChatGPT 只能是純文本對話,而這個 Kosmos-1 可以處理文本、音頻、圖像和視頻等內容!!

ChatGPT 是【大型語言模型】(LLM) ,Kosmos-1 是【多模式大型語言模型】(MLLM)

來看看它的表現,一圖勝千言:

image.png

CRAZY,在原先文本對話的基礎上,再加圖片的理解、音頻的理解等,確實更進一步。

它原理如何?

咱們用魔法打敗魔法,讓兄弟產品 new bing 來作解釋:

image.png

image.png

image.png

image.png

原理還是有點複雜,主要的觀點:

KOSMOS-1 主幹基於 Transformer 的因果語言模型,整合了語言、視覺、語言等模態的輸入,對於連續信號模態(例如圖像和音頻),將輸入表示為離散編碼。

KOSMOS-1 藉助了 PyTorch 框架,這個框架是一個深度學習的優化張量庫,可使用 GPU 和 CPU 進行計算。

PyTorch 提供了靈活的動態計算圖、自動求導功能、分佈式訓練和部署等特性,我們可以用它來構建各種神經網絡模型,如卷積神經網絡、循環神經網絡、變分自編碼器等。。。

image.png

Kosmos-1 在哪體驗?

image.png

目前它還只是一個研究項目,未商用。最新進展在:

別的不説,微軟這波確實走在了前頭,首先它們以最快的速度引入 GPT 3.5 到自家 Edge 瀏覽器中,推出 new bing ,狂拉一波瀏覽器的使用率,之前這個基本被 Google 吞佔了。

而後,又推出 Kosmos-1,將 AI 與圖片分析、音頻分析結合,可看出其野心。

前兩天在 YOUTUBE 上看到一個博主説:微軟正準備將 GPT 整合到自己的各類工具中,比如文檔寫作 office、onenote 等等,這必將帶來又一波波爆炸式的產品增長。

憑藉 AIGC,微軟這波或能彎道超車,在 AI 應用上,超越谷歌、甲骨文等公司。

微軟這波又贏了~~

image.png


OK,以上便是本篇分享,希望各位工友喜歡~ 歡迎點贊、收藏、評論 🤟

我是掘金安東尼 🤠 100 萬人氣前端技術博主 💥 INFP 寫作人格堅持 1000 日更文 ✍ 關注我,安東尼陪你一起度過漫長編程歲月 🌏

😹 加我微信 ATAR53,拉你入羣,定期抽獎、粉絲福利多多。只學習交友、不推文賣課~


本文正在參加「金石計劃」