RISC-V 高性能計算要解決的三個問題

語言: CN / TW / HK

近日,OSCHINA 和 Gitee 聯合發佈了《2022 中國開源開發者報告》澎峯科技聯合創始人兼首席運營官王軍輝在報告中對 RISC-V 領域進行了解讀,以下為原文。

 

RISC-V 高性能計算要解決的三個問題

不久前,RISC-V 國際基金會宣佈 RISC-V 芯片出貨超 100 億顆,這對 RISC-V 新架構而言,是一個不錯的里程碑。不過,成果主要集中在嵌入式 SoC 領域。我們觀察到,在 RISC-V 高性能計算領域,已有多家創新企業計劃在 2023 年發佈類似 64 核@2.0GHz 規格的服務器級處理器,這必將成為 RISC-V 下一個令人激動的里程碑。當然,關於 RISC-V 高性能計算,還有三大問題需要解決:

(1)需要為 RISC-V 體系構建一套數學計算庫,類似 Intel 處理器的 MKL(Math Kernel Libarary),以支持 RISC-V 在高性能計算的應用,保證計算精度、計算效率以及源代碼級安全可控。

目前業內常用的數學計算庫主要為 Intel 的 MKL 和 AMD 的 ACML,二者都是免費的,但不開源,因為這是軟件類核心知識產權。也許您認為免費不就可以了嗎?但當您遇到針對場景需要優化時,將無能為力。這些代碼誰擔保它的安全性、可靠性呢?

雖然有 OpenBLAS、FFTW、Libm 等部分開源項目可以使用,但這遠遠不夠。而且,開源的版本無法保證計算效率和計算精度。偏偏這在高性能計算應用領域(AI 計算、科學計算)是至關重要的。

數學計算庫作為計算中間件,函數規模上以千計,與計算性能、安全性、可靠性深度綁定。也就是説,它將最終決定處理器是否能進入高性能計算領域。

(2)如何讓 RISC-V 迴歸到計算機技術的垂直整合,而不是橫向分解的時代?在算力驅動的數字經濟時代,計算硬件將呈現出多樣性。RISC-V 因其開放性,將比 x86 和 arm 生態更加豐富和多樣,換一種説法就是嚴重碎片化。如果單純追求硬件計算性能的 spec 數據,很容易滑入橫向分解的邏輯,出現類似 VLIW(Very Long Instruction Word)超長指令這種怪物,數十億美金化為教訓。

RISC-V 應該回歸到垂直整合的思路上來,要去思考,如何前瞻性地理解應用,從計算語言到編譯器,再到底層數學計算庫,再到計算機體系結構,實現多個方面垂直整合。存量市場只有赤裸裸的性價比競爭,瞄準增量市場才有跨越式發展的可能。

(3)在異構計算時代,如何構建 “RISC-V CPU + 加速卡(GPU、NPU、DSA、FPGA)” 的高性能異構計算軟件棧?面向異構計算黃金時代,國際三巨頭以其雄厚的資本實力各自為戰,都在整合異構計算硬件平台(CPU、GPU、FPGA等)和佈局異構計算軟件棧(CUDA、OneAPI、ROCm),試圖形成自己的軟硬融合的生態體系,同時展開封閉和開放生態之爭。

這也意味着 RISC-V 領域也必須面臨如何解決異構生態的問題,即,如何解決“n 家公司的 RISC-V CPU + m 家公司的加速卡”的硬件組合,這種組合數量將高達到 n x m;如何實現軟硬融合,遵循什麼樣的 API 標準(開源/自研);異構計算軟件棧的應投入多少預算等問題。

王軍輝

澎峯科技聯合創始人兼首席運營官,畢業於中南大學。曾在科廣電子、Thomson、Vimicro、中科院計算所西研院任職,集成電路設計行業從業二十多年。聯繫方式:[email protected]

《2022 中國開源開發者報告》由” 前沿開源技術領域解讀 “ ” 中國開源創業觀察 2022“,以及” 開發者畫像分析 “ 三個章節組成。在 “前沿開源技術領域解讀” 部分,多位在其領域有所建樹的一線開發者和開源商業化公司創始人,對目前國內外流行的前沿開源技術領域過去的發展和未來的趨勢進行了深入的洞察,覆蓋開源雲原生、開源 AI、開源大前端、開源大數據、開源 DevOps、RISC-V、開源操作系統、開源數據庫、編程語言九大領域。

欲瞭解更多報告內容,請點擊:http://gitee.com/report/china-open-source-2022/