RISC-V 高性能计算要解决的三个问题

语言: CN / TW / HK

近日,OSCHINA 和 Gitee 联合发布了《2022 中国开源开发者报告》澎峰科技联合创始人兼首席运营官王军辉在报告中对 RISC-V 领域进行了解读,以下为原文。

 

RISC-V 高性能计算要解决的三个问题

不久前,RISC-V 国际基金会宣布 RISC-V 芯片出货超 100 亿颗,这对 RISC-V 新架构而言,是一个不错的里程碑。不过,成果主要集中在嵌入式 SoC 领域。我们观察到,在 RISC-V 高性能计算领域,已有多家创新企业计划在 2023 年发布类似 64 核@2.0GHz 规格的服务器级处理器,这必将成为 RISC-V 下一个令人激动的里程碑。当然,关于 RISC-V 高性能计算,还有三大问题需要解决:

(1)需要为 RISC-V 体系构建一套数学计算库,类似 Intel 处理器的 MKL(Math Kernel Libarary),以支持 RISC-V 在高性能计算的应用,保证计算精度、计算效率以及源代码级安全可控。

目前业内常用的数学计算库主要为 Intel 的 MKL 和 AMD 的 ACML,二者都是免费的,但不开源,因为这是软件类核心知识产权。也许您认为免费不就可以了吗?但当您遇到针对场景需要优化时,将无能为力。这些代码谁担保它的安全性、可靠性呢?

虽然有 OpenBLAS、FFTW、Libm 等部分开源项目可以使用,但这远远不够。而且,开源的版本无法保证计算效率和计算精度。偏偏这在高性能计算应用领域(AI 计算、科学计算)是至关重要的。

数学计算库作为计算中间件,函数规模上以千计,与计算性能、安全性、可靠性深度绑定。也就是说,它将最终决定处理器是否能进入高性能计算领域。

(2)如何让 RISC-V 回归到计算机技术的垂直整合,而不是横向分解的时代?在算力驱动的数字经济时代,计算硬件将呈现出多样性。RISC-V 因其开放性,将比 x86 和 arm 生态更加丰富和多样,换一种说法就是严重碎片化。如果单纯追求硬件计算性能的 spec 数据,很容易滑入横向分解的逻辑,出现类似 VLIW(Very Long Instruction Word)超长指令这种怪物,数十亿美金化为教训。

RISC-V 应该回归到垂直整合的思路上来,要去思考,如何前瞻性地理解应用,从计算语言到编译器,再到底层数学计算库,再到计算机体系结构,实现多个方面垂直整合。存量市场只有赤裸裸的性价比竞争,瞄准增量市场才有跨越式发展的可能。

(3)在异构计算时代,如何构建 “RISC-V CPU + 加速卡(GPU、NPU、DSA、FPGA)” 的高性能异构计算软件栈?面向异构计算黄金时代,国际三巨头以其雄厚的资本实力各自为战,都在整合异构计算硬件平台(CPU、GPU、FPGA等)和布局异构计算软件栈(CUDA、OneAPI、ROCm),试图形成自己的软硬融合的生态体系,同时展开封闭和开放生态之争。

这也意味着 RISC-V 领域也必须面临如何解决异构生态的问题,即,如何解决“n 家公司的 RISC-V CPU + m 家公司的加速卡”的硬件组合,这种组合数量将高达到 n x m;如何实现软硬融合,遵循什么样的 API 标准(开源/自研);异构计算软件栈的应投入多少预算等问题。

王军辉

澎峰科技联合创始人兼首席运营官,毕业于中南大学。曾在科广电子、Thomson、Vimicro、中科院计算所西研院任职,集成电路设计行业从业二十多年。联系方式:[email protected]

《2022 中国开源开发者报告》由” 前沿开源技术领域解读 “ ” 中国开源创业观察 2022“,以及” 开发者画像分析 “ 三个章节组成。在 “前沿开源技术领域解读” 部分,多位在其领域有所建树的一线开发者和开源商业化公司创始人,对目前国内外流行的前沿开源技术领域过去的发展和未来的趋势进行了深入的洞察,覆盖开源云原生、开源 AI、开源大前端、开源大数据、开源 DevOps、RISC-V、开源操作系统、开源数据库、编程语言九大领域。

欲了解更多报告内容,请点击:https://gitee.com/report/china-open-source-2022/