高通做了一個會讓AI開發者興奮的決定

語言: CN / TW / HK

如果你問AI邊緣晶片公司最難的是什麼,他們大概率會說落地的應用場景太多、太複雜。

如果你問開發者使用AI晶片最難的是什麼,他們可能會說沒有統一的開發平臺。

如果你問消費者使用AI的最大感受是什麼,他們或許會表達一些對AI智慧程度的不滿。

AI已經在智慧手機中普及,但AI的體驗還不夠完善,AI的功能也還不夠強大。想要實現體驗優秀的AI功能和產品,一定需要從底層的硬體到上層的軟體和系統的深度融合。

所有AI晶片公司都在大談自家產品的優勢,但即便對於有能力和經驗的AI開發者,想要將一個開發應用到不同的產品中,總是有許多遷移的工作,這也在很大程度上阻礙了AI的普及和進一步創新。

晶片公司們都想解決這個問題,高通今天給出的最新的解決方案高通AI軟體棧(Qualcomm AI Stack),包括硬體、軟體和工具,讓OEM廠商或者開發者的一次開發,就可以應用到智慧手機、物聯網、汽車、XR、雲和移動PC等智慧網聯邊緣產品。

這是足以讓開發者興奮的“一次開發,隨處執行。”

但想要實現這個目標,面臨著諸多挑戰。高通技術公司產品管理副總裁 Ziad Asghar指出,“AI在不同場景下,功耗需求、模型型別、模型部署方式等都有所不同,不同業務對於準確性、功耗以及時延等方面的平衡要求也各不相同。比如,XR應用所需的手勢追蹤、眼球追蹤和3D重建AI模型,與在汽車領域所需的鐳射雷達AI模型大有不同,他們對於精準度的要求也有很大區別。”

高通技術公司技術副總裁Jeff Gehlhaar提到,“如何讓我們所有不同的IP都能獲得同樣的訪問許可權,讓每個IP都能夠以統一的方式選擇相對應的解決方案,這是一個主要挑戰。”

高通最終推出的是AI軟體棧產品組合,從底層的硬體聯合上層的軟體和工具優化,實現僅通過統一AI軟體棧,可跨硬體平臺執行。

這是一項十分挑戰的工作,想要一次開發跨平臺執行,首先就需要支援不同的作業系統,包括Android、Windows、Linux以及面向網聯汽車的QNX等。到了系統軟體層面,要能完整支援系統介面、加速器驅動、模擬支援等。在開發者庫與服務層面,要能夠支援數學庫、編譯器和虛擬平臺等。還要支援分析器和偵錯程式,幫助開發者知曉開發過程中AI模型的使用情況,以及在硬體端應該採用怎樣的權重進行分析。此外,還要支援程式語言和核心庫。

“基於高通AI引擎Direct,上述這些高通AI軟體都可以實現。” Ziad Asghar說,“高通AI引擎Direct可視為一個較低層級的庫,可以在最靠近模型或硬體的位置進行軟體編輯,充分釋放硬體效能、確保最高峰值表現。高通AI引擎Direct之上執行著AI runtimes,可幫助OEM廠商和客戶更高效地完成更多AI用例。AI runtimes還支援被廣泛使用的高通神經網路處理SDK、ONNX runtimes以及TF Lite和TF Lite Micro、Direct ML。最上面一層是AI框架,包括TensorFlow、PyTorch和ONNX。”

高通AI軟體棧還支援一系列工具套件,包括高通AI模型增效工具包(AIMET)、AI開發圖形使用者介面(GUI)、用於增強量化與優化的模型分析器以及神經網路架構搜尋(NAS)。

高通AI模型增效工具包(AIMET)提供模型量化和模型壓縮技術,能夠進行量化感知訓練(Quantization Aware Training)和無資料訓練,將浮點運算模型轉化為整數運算模型,比如,將32位浮點模型轉換為8位整數模型,模型能效提升可達4倍。

另外,高通AI軟體棧還支援包括Prometheus、Kubernetes和Docker在內的基礎設施。

高通AI軟體棧可以支援諸多的SDK,比如面向汽車ADAS解決方案的Snapdragon Ride SDK,面向物聯網的高通智慧多媒體SDK,以及Snapdragon Spaces XR開發者平臺,這也為高通建立統一SDK奠定了基礎。

Ziad Asghar對雷峰網 (公眾號:雷峰網) 表示,“要實現任何面向單一終端開發的AI特性都可在其他終端上輕鬆部署,編譯器確實很關鍵,但它只是眾多組成部分之一,此外還包括模型的準備和優化、排程器、硬體除錯、以及如何確保軟體能夠充分利用硬體資源等等,這些因素都非常重要,我們需要確保這些組成部分能夠共同協作實現高效執行。”

也正因為如此,剛釋出的高通AI軟體棧,要真正實現其願景還有很長的路需要走,高通不僅面對著軟體複雜性大幅提升的挑戰,還需要進行大量細緻的優化,與客戶緊密合作,才可能最終實現其願景,這需要時間,更需要持續的投入。

但如果高通AI軟體棧能夠成功,不僅是其統一技術路線圖戰略的成功,更是其在AI市場獲得巨大成功的關鍵。

雷峰網原創文章,未經授權禁止轉載。詳情見 轉載須知