為什麼説 AI 標準化和規模化應用來臨?

語言: CN / TW / HK
袁進輝

一流科技 CEO & 創始人,兼任之江實驗室天樞開源開放人工智能平台架構師、北京智源研究院大模型技術委員會委員。

近日,OSCHINA 和 Gitee 聯合發佈了《2022 中國開源開發者報告》一流科技 CEO & 創始人袁進輝在報告中對開源 AI 領域進行了解讀,以下為原文。


開源吞噬軟件 1.0,“開源 AI ”運動也正在席捲以數據驅動編程為特點的軟件 2.0 時代。

從框架開源,數據集、算法開源,再到模型開源,開源極大推動了 AI 在技術、應用等方面的發展。比如,基於開源社區的孵化,2022 年最火熱的 Stable Diffusion 模型在不到兩個月的時間便流行開來,國內企業和研究機構也迅速跟進,比如 OneFlow 將 Stable Diffusion 的圖片生成速度加速到 1 秒以內,IDEA 和智源研究院分別發佈了中文版的 Stable Diffusion 和支持多種不同語言的 AltDiffusion。

更重要的是,開源模式使得 AI 標準化和規模化趨勢開始成型,從算法的標準化開始,帶來了軟件標準化的機會,而硬件、技術平台、最佳實踐也在標準化。

在 AI 算法模型方面,數據驅動人工智能的算法統一為神經網絡,完成了算法的標準化。其中,Transformer 的發展呈現了統一深度學習算法的苗頭,而依靠 Transformers 庫起家的 HuggingFace 平台已發佈超 10 萬個開源預訓練模型,大大降低了用户使用門檻,而當 AI 模型足夠多時會進一步標準化,進而推動 AI 產業化進程。

在開源深度學習框架層面,API 接口正在標準化。其他框架的 API 設計都在學習 PyTorch。而在分佈式編程方面,PyTorch 等其他框架的分佈式編程接口也參考了 OneFlow 的 Global Tensor、SBP 的設計思路,這也彰顯了國產框架的創新性和影響力。

硬件層面,雖然芯片市場打得如火如荼,但 API 設計層面也越來越類似。多數硬件廠商 API 的設計會參考英偉達的軟件接口。圖編譯器層面也有一些通用組件出現,比如 MLIR,越來越多項目開始基於 MLIR 來構建深度學習編譯器。

隨着深度學習框架和硬件在內的基礎設施的標準化,基礎平台方面已經出現了 K8S、Docker 這些越來越標準化的解法,有的企業需要彈性擴容,有的需要私有云部署,有的需要擴容到公有云等,這需要多雲的支持。通過提煉最佳實踐提煉,形成了 MLOps 產品,而這正是工作流程標準化和平台標準化的體現,這也是今年 AI 領域最熱門的趨勢之一。

開源打破了很多技術壁壘,從框架開源到模型開源,必將進一步推動軟件 2.0 時代 AI 技術的普惠化。未來,任何一家傳統企業即使沒有專業的 AI 科學家,藉助這些開源工具和模型也能獲得 AI 的能力。


《2022 中國開源開發者報告》報告由” 前沿開源技術領域解讀 “ ” 中國開源創業觀察 2022“,以及” 開發者畫像分析 “ 三個章節組成。

在 “前沿開源技術領域解讀” 部分,多位在其領域有所建樹的一線開發者和開源商業化公司創始人,對目前國內外流行的前沿開源技術領域過去的發展和未來的趨勢進行了深入的洞察,覆蓋開源雲原生、開源 AI、開源大前端、開源大數據、開源 DevOps、RISC-V、開源操作系統、開源數據庫、編程語言九大領域。

欲瞭解更多報告內容,請點擊:http://gitee.com/report/china-open-source-2022/