高通做了一個會讓AI開發者興奮的決定
如果你問AI邊緣晶片公司最難的是什麼,他們大概率會說落地的應用場景太多、太複雜。
如果你問開發者使用AI晶片最難的是什麼,他們可能會說沒有統一的開發平臺。
如果你問消費者使用AI的最大感受是什麼,他們或許會表達一些對AI智慧程度的不滿。
AI已經在智慧手機中普及,但AI的體驗還不夠完善,AI的功能也還不夠強大。想要實現體驗優秀的AI功能和產品,一定需要從底層的硬體到上層的軟體和系統的深度融合。
所有AI晶片公司都在大談自家產品的優勢,但即便對於有能力和經驗的AI開發者,想要將一個開發應用到不同的產品中,總是有許多遷移的工作,這也在很大程度上阻礙了AI的普及和進一步創新。
晶片公司們都想解決這個問題,高通今天給出的最新的解決方案高通AI軟體棧(Qualcomm AI Stack),包括硬體、軟體和工具,讓OEM廠商或者開發者的一次開發,就可以應用到智慧手機、物聯網、汽車、XR、雲和移動PC等智慧網聯邊緣產品。
這是足以讓開發者興奮的“一次開發,隨處執行。”
但想要實現這個目標,面臨著諸多挑戰。高通技術公司產品管理副總裁 Ziad Asghar指出,“AI在不同場景下,功耗需求、模型型別、模型部署方式等都有所不同,不同業務對於準確性、功耗以及時延等方面的平衡要求也各不相同。比如,XR應用所需的手勢追蹤、眼球追蹤和3D重建AI模型,與在汽車領域所需的鐳射雷達AI模型大有不同,他們對於精準度的要求也有很大區別。”
高通技術公司技術副總裁Jeff Gehlhaar提到,“如何讓我們所有不同的IP都能獲得同樣的訪問許可權,讓每個IP都能夠以統一的方式選擇相對應的解決方案,這是一個主要挑戰。”
高通最終推出的是AI軟體棧產品組合,從底層的硬體聯合上層的軟體和工具優化,實現僅通過統一AI軟體棧,可跨硬體平臺執行。
這是一項十分挑戰的工作,想要一次開發跨平臺執行,首先就需要支援不同的作業系統,包括Android、Windows、Linux以及面向網聯汽車的QNX等。到了系統軟體層面,要能完整支援系統介面、加速器驅動、模擬支援等。在開發者庫與服務層面,要能夠支援數學庫、編譯器和虛擬平臺等。還要支援分析器和偵錯程式,幫助開發者知曉開發過程中AI模型的使用情況,以及在硬體端應該採用怎樣的權重進行分析。此外,還要支援程式語言和核心庫。
“基於高通AI引擎Direct,上述這些高通AI軟體都可以實現。” Ziad Asghar說,“高通AI引擎Direct可視為一個較低層級的庫,可以在最靠近模型或硬體的位置進行軟體編輯,充分釋放硬體效能、確保最高峰值表現。高通AI引擎Direct之上執行著AI runtimes,可幫助OEM廠商和客戶更高效地完成更多AI用例。AI runtimes還支援被廣泛使用的高通神經網路處理SDK、ONNX runtimes以及TF Lite和TF Lite Micro、Direct ML。最上面一層是AI框架,包括TensorFlow、PyTorch和ONNX。”
高通AI軟體棧還支援一系列工具套件,包括高通AI模型增效工具包(AIMET)、AI開發圖形使用者介面(GUI)、用於增強量化與優化的模型分析器以及神經網路架構搜尋(NAS)。
高通AI模型增效工具包(AIMET)提供模型量化和模型壓縮技術,能夠進行量化感知訓練(Quantization Aware Training)和無資料訓練,將浮點運算模型轉化為整數運算模型,比如,將32位浮點模型轉換為8位整數模型,模型能效提升可達4倍。
另外,高通AI軟體棧還支援包括Prometheus、Kubernetes和Docker在內的基礎設施。
高通AI軟體棧可以支援諸多的SDK,比如面向汽車ADAS解決方案的Snapdragon Ride SDK,面向物聯網的高通智慧多媒體SDK,以及Snapdragon Spaces XR開發者平臺,這也為高通建立統一SDK奠定了基礎。
Ziad Asghar對雷峰網 (公眾號:雷峰網) 表示,“要實現任何面向單一終端開發的AI特性都可在其他終端上輕鬆部署,編譯器確實很關鍵,但它只是眾多組成部分之一,此外還包括模型的準備和優化、排程器、硬體除錯、以及如何確保軟體能夠充分利用硬體資源等等,這些因素都非常重要,我們需要確保這些組成部分能夠共同協作實現高效執行。”
也正因為如此,剛釋出的高通AI軟體棧,要真正實現其願景還有很長的路需要走,高通不僅面對著軟體複雜性大幅提升的挑戰,還需要進行大量細緻的優化,與客戶緊密合作,才可能最終實現其願景,這需要時間,更需要持續的投入。
但如果高通AI軟體棧能夠成功,不僅是其統一技術路線圖戰略的成功,更是其在AI市場獲得巨大成功的關鍵。
雷峰網原創文章,未經授權禁止轉載。詳情見 轉載須知 。
- 位元組的手伸向了醫院
- 用AI聲控玩原神,動動嘴皮即可打怪,程式碼教程已開源
- 關於財報中阿里雲業績的幾項分析
- 阿里最新財報:全球化業務穩健增長 國際商業收入增長2%
- 萊斯大學胡俠團隊 ICML 2022 傑出論文: 新型圖資料增強方法 G-Mixup|附作者對話
- 「兩大法寶」帶來千倍算力,埃米時代或提前到來|CCF Chip 2022
- 騰訊湯道生:開源是產業網際網路時代新的生產方式和協作模式
- 科技公司攜手品牌破局傳統零售
- SpaceX 前退休CTO Tom Mueller:雖然退休了,我還是想上火星
- 平安銀行App 6.0上線:“簡單”背後的科技看點
- 挖華為高管做AI製藥,“愛折騰”的雲南白藥能否觸底反彈?
- 電離層抑制成測繪RTK終端核心標配,千尋位置充分發揮北斗應用能力
- 中國資料庫OceanBase入選ForresterTranslytical資料平臺報告
- 驗證EDA為何成了熱門賽場?
- 非確定性有限狀態自動機開創者 Dana Scott:我獲得圖靈獎之前的 26 年
- 從模仿到創新,中國企業開始走向(領跑)世界
- 高階醫療影像裝置巨頭聯影醫療IPO註冊通過,擬募資124.8億元
- 滴滴存在惡意逃避監管等16項違法事實,相關違法行為持續長達7年,被處80.26億元罰款
- 「新基石研究員專案」資助啟動:10年100億,讓有探索精神的科學家不用再忙於「找錢」
- 尷尬的B站,難解7年心病