Meta 開源業界首個同時適用於影象、音訊和文字的自我監督演算法
Meta AI(前身為 Facebook AI,雖然已改名三個月時間,但說到 Meta 很多人還是無法第一時間反應過來)近日詳細介紹了「首個高效能自我監督機器學習演算法」——data2vec,該演算法可以應用於語音、影象和文字。
自我監督學習演算法 —— 是一種機器通過直接觀察環境進行學習的演算法,而不通過由人工標記過的影象、文字、音訊和其他資料來源來學習,這種演算法能夠大大推動人工智慧的發展。
從人類自身學習的角度來看,我們日常都在使用視覺和聽覺等感官知覺來了解和學習身邊的事物,但目前市面上普遍存在的自我監督學習演算法通常只能針對某一個單獨的領域(如:僅限影象、語音和文字中的一種,而不能用於所有情景),這一點也正是 data2vec 和其他自我監督演算法最大的不同之處。
data2vec 提供一個能夠用於語音、影象和文字的單一自我監督演算法 —— 這意味著它不依賴於人工標記的資料集,而且還能夠跨語音、影象和文字使用。除了這個優勢以外,data2vec 與以前的演算法相比,還具備經過簡化的訓練方式,並且在演算法速度和準確性上還能夠與特定模式的對手相匹配或略勝一籌。
Meta AI 為了證明這個演算法的可行性,在流行的 ImageNet 計算機視覺基準上對 data2vec 進行了測試,結果顯示它在流行的模型大小上比現有的方法表現更好。
而在語音方面,data2vec 的表現則優於 wav2vec 2.0 和 HuBERT(錯誤率越低越好),他們兩個是 Meta AI 所開發的另兩個語音自我監督演算法。
對於文字的處理,經過 GLUE 基準套件測試,它的表現與 RoBERTa 基本一致。
Meta AI 指出,Data2vec 的誕生表明,同樣的自我監督演算法可以在不同的模式中很好地工作 —— 而且往往比現有的單一最佳演算法更好。這為更普遍的自我監督學習鋪平了道路,使我們更接近人工智慧可以使用影片、文字和聲音來學習這個複雜世界的願景。
詳細介紹 data2vec 的論文可從 Meta AI官網獲得,與此同時他們還在 GitHub 上釋出了 data2vec 的原始碼和預訓練模型,該演算法沒有建立單獨的倉庫,而是位於 PyTorch-Fairseq 倉庫之下,演算法採用 MIT 許可。
- 俄羅斯的 Android 裝置無法獲取 Chrome 更新
- 使用開源天文應用程式 KStars 探索夜空 | Linux 中國
- 管理 crontab 的開源工具 | Linux 中國
- 第十版 LoongArch 補丁已更新至 Linux 核心
- Meta 將其流行 JS 測試框架捐贈給 OpenJS 基金會
- LibreOffice 7.2 生命週期即將結束
- MySQL-Seconds_behind_master的精度誤差
- 2022年5月中國資料庫排行榜:墨天輪榜單榜首易位,前九三商三雲三開源
- PHP 8.2 棄用通過${} 在字串插入變數語法
- Go 專案配置檔案的定義和讀取
- Ubuntu 創始人解釋為什麼 Ubuntu 不支援 Flatpak
- Goscript:Rust 實現的 Go 語言規範
- 改善開源作者收入不足問題,Appwrite 設立開源基金
- 微軟繼續拆分 VS Code Python 擴充套件,再推三款獨立擴充套件
- 微軟元宇宙或將基於 Web
- Android 13 引入新的限制,惡意軟體將無法使用輔助功能 API
- 文件並不是開源專案開發的附屬品 | Linux 中國
- 在虛擬機器中執行 Linux 的十大優點 | Linux 中國
- 埃隆·馬斯克開源推特演算法的計劃存在缺陷
- 9 個去中心化、端到端、開源的主流社交媒體平臺替代品 | Linux 中國