為什麼說 AI 標準化和規模化應用來臨?

語言: CN / TW / HK
袁進輝

一流科技 CEO & 創始人,兼任之江實驗室天樞開源開放人工智慧平臺架構師、北京智源研究院大模型技術委員會委員。

近日,OSCHINA 和 Gitee 聯合釋出了《2022 中國開源開發者報告》一流科技 CEO & 創始人袁進輝在報告中對開源 AI 領域進行了解讀,以下為原文。


開源吞噬軟體 1.0,“開源 AI ”運動也正在席捲以資料驅動程式設計為特點的軟體 2.0 時代。

從框架開源,資料集、演算法開源,再到模型開源,開源極大推動了 AI 在技術、應用等方面的發展。比如,基於開源社群的孵化,2022 年最火熱的 Stable Diffusion 模型在不到兩個月的時間便流行開來,國內企業和研究機構也迅速跟進,比如 OneFlow 將 Stable Diffusion 的圖片生成速度加速到 1 秒以內,IDEA 和智源研究院分別釋出了中文版的 Stable Diffusion 和支援多種不同語言的 AltDiffusion。

更重要的是,開源模式使得 AI 標準化和規模化趨勢開始成型,從演算法的標準化開始,帶來了軟體標準化的機會,而硬體、技術平臺、最佳實踐也在標準化。

在 AI 演算法模型方面,資料驅動人工智慧的演算法統一為神經網路,完成了演算法的標準化。其中,Transformer 的發展呈現了統一深度學習演算法的苗頭,而依靠 Transformers 庫起家的 HuggingFace 平臺已釋出超 10 萬個開源預訓練模型,大大降低了使用者使用門檻,而當 AI 模型足夠多時會進一步標準化,進而推動 AI 產業化程序。

在開源深度學習框架層面,API 介面正在標準化。其他框架的 API 設計都在學習 PyTorch。而在分散式程式設計方面,PyTorch 等其他框架的分散式程式設計介面也參考了 OneFlow 的 Global Tensor、SBP 的設計思路,這也彰顯了國產框架的創新性和影響力。

硬體層面,雖然晶片市場打得如火如荼,但 API 設計層面也越來越類似。多數硬體廠商 API 的設計會參考英偉達的軟體介面。圖編譯器層面也有一些通用元件出現,比如 MLIR,越來越多專案開始基於 MLIR 來構建深度學習編譯器。

隨著深度學習框架和硬體在內的基礎設施的標準化,基礎平臺方面已經出現了 K8S、Docker 這些越來越標準化的解法,有的企業需要彈性擴容,有的需要私有云部署,有的需要擴容到公有云等,這需要多雲的支援。通過提煉最佳實踐提煉,形成了 MLOps 產品,而這正是工作流程標準化和平臺標準化的體現,這也是今年 AI 領域最熱門的趨勢之一。

開源打破了很多技術壁壘,從框架開源到模型開源,必將進一步推動軟體 2.0 時代 AI 技術的普惠化。未來,任何一家傳統企業即使沒有專業的 AI 科學家,藉助這些開源工具和模型也能獲得 AI 的能力。


《2022 中國開源開發者報告》報告由” 前沿開源技術領域解讀 “ ” 中國開源創業觀察 2022“,以及” 開發者畫像分析 “ 三個章節組成。

在 “前沿開源技術領域解讀” 部分,多位在其領域有所建樹的一線開發者和開源商業化公司創始人,對目前國內外流行的前沿開源技術領域過去的發展和未來的趨勢進行了深入的洞察,覆蓋開源雲原生、開源 AI、開源大前端、開源大資料、開源 DevOps、RISC-V、開源作業系統、開源資料庫、程式語言九大領域。

欲瞭解更多報告內容,請點選:http://gitee.com/report/china-open-source-2022/