Arm GPU首次支援硬體光追,帶著手機也能進入元宇宙?

語言: CN / TW / HK

Arm正在模糊虛擬和現實的界限,連發佈會的開場也開在虛擬世界,移動裝置離元宇宙將越來越近。

雷峰網訊息,本週Arm釋出最新的面向移動端的計算產品組合,包括兩款CPU(高效能Cortex-X3、高效效能Cortex-A715),三款GPU(Immortalis G715、Mali-G715、Mali-G615)。

最值得一提的旗艦級GPU產品Arm Immortalis(中文意思“不朽”),這是Arm GPU的全新系列,Immortalis G715也是Arm首款移動端支援硬體光線追蹤(Ray Tracing)的GPU。當然,也是Arm能夠將移動裝置作為元宇宙入口的關鍵。

相比GPU實現新的里程碑,Arm在市場上最有優勢的移動CPU產品,看起來沒有達到去年預計的未來兩年CPU效能提升30%的目標。

不過,要滿足遊戲、元宇宙、AI等對於計算不斷提升的需求,還是需要CPU、GPU等組合的異構計算。因此,Arm在今年同樣強調全面計算解決方案(TSC22),TCS22相比上一代能夠實現28%的效能提升,16%的能耗降低。

更有意思的是,從Arm透露的產品路線圖看,Arm已經準備好衝入元宇宙的時代。

硬體光線追蹤進入移動終端

GPU並非Arm的傳統強項,但其在移動裝置市場依舊具有強大的市場統治力, Arm Mali GPU 出貨量已超過 80 億顆 。因此,Arm推出硬體級別光線追蹤移動GPU,對於移動市場光線追蹤生態的發展,和光追的普及將具有重要價值。

Arm 高階副總裁兼終端事業部總經理 Paul Williamson直言,Arm推出的全新旗艦級GPU 產品Immortalis,是 為了滿足移動應用與遊戲對於硬體與效能的新需求。

過去幾年間,無論是高通、聯發科這樣的移動SoC提供商,還是小米、OPPO、vivo等手機OEM,都看準了手遊市場的機會,將提升GPU以及遊戲體驗作為賣點。手機上可以玩越來越多視覺效果出色的3A遊戲。

遊戲之外,AR、VR、MR,以及元宇宙都對視覺體驗提出了更高要求。

顯然, 無論是桌面端還是移動端GPU都需要邁向下一個階段 ,而Arm Immortalis無論從命名還是效能都是面向新時代的產品。

Immortalis傳承了Mali GPU的技術積累,相比上一代Mali-G710,I mmortalis-G715效能提升15%,能耗節省15%,機器學習效能提升2倍 ,是Arm迄今為止效能最強的GPU。

高效能會同時帶來功耗的挑戰,對於使用電池供電的移動裝置,對功耗又極其敏感,如果不能控制好功耗,就無法帶來良好體驗。對此,Paul  Williamson表示,Arm 的光線追蹤單元只佔用了約 4% 的著色器核心面積, 僅耗費非常小幅的功耗,就能在相關領域帶來3倍效能提升。

圖中左側為未開啟光線追蹤,右側為開啟光線追蹤

Arm也給出了基於其光線追蹤GPU的效果展示,以及峰值效能及FPS/W效能。據悉,Arm的光線追蹤實現是基於標準的 Vulkan API,開發者的可及性非常高。

除了支援硬體光線追蹤的Immortalis GPU,Arm還同時推出了Mali-G715和Mali-G615,Mali G715相比Immortalis-G715主要的差別是不支援硬體光線追蹤,只有7-9個著色器核心(Immortalis-G715有10-16個)。

定位高階的Mali-G615(去年推出的Mali-G610的更新產品)的著色器核心數量為1-6個。2022推出的新款GPU均具備的可變速率著色 (Variable Rate Shading) 圖形功能,能夠在降低能耗的同時,提升遊戲效能。

相比GPU支援硬體光線追蹤的亮點,Arm的CPU產品更新就缺乏亮點。

新一代CPU效能提升未完全達到預期

2021年,Arm推出了面向新十年的Armv9架構,並推出了首代基於新架構的一系列CPU產品。去年,Arm預計,新一代架構Armv9將保持超過業界CPU效能提升的速度, 未來兩代移動和基礎設施CPU的效能提升將超過30%。

當時Arm高階副總裁、首席架構師兼技術院士Richard Grisenthwaite還表示,“這個資料是根據業界標準評測工具來衡量,30%的算力提升完全是憑藉於本身架構而不是藉助於製程工藝來實現。”

今年推出的全新Arm Cortex-X3,與最新款的安卓旗艦智慧手機(執行的上一代Cortex-X2的SoC)相比,效能提升25%,與主流膝上型電腦處理器(Intel Core i7 1260p 28w)相比,效能提升了34%。

這也就意味著, Arm去年預計的效能提升在今年並未完全實現 ,畢竟相比上一代Cortex-X2的效能提升未達到30%。

作為Arm移動端的效能標杆,也是定製CPU專案,Cortex-X3進行了一系列的技術升級,解碼器每週期指令從5個提升到6個,亂序執行視窗從288提升到320個,整數ALU單元從4個提升到6個,L2快取容量也從512KB提升到了1MB。

效能提升的同時,Cortex-X3的功耗表現應該也會成為今年旗艦安卓手機關注的焦點。

將被更廣泛使用的新一代CPU是專注於高效效能的 Arm Cortex-A715,與上一代Cortex-A710 相比,效能僅提升5%,能效提升 20%,可以媲美Cortex-X1的效能。

為了兼顧能效表現, Cortex-A715的CPU叢集採用了基於大小核 (big.LITTLE) 的配置。

另外,去年推出的Armv9架構高效小核CPU Arm Cortex-A510也迎來更新, 效能不變的同時將功耗降低5%, 並且更新版的DSU-110所支援的CPU叢集核心數增加50%,實現了不同等級消費級裝置的可擴充套件性。

從Arm在Cortex-A715中引入大小核配置提高能效,以及更新版Cortex-A510降低功耗,都表明A rm移動端CPU目前在效能和功耗的平衡中所面臨的巨大挑戰, 這也是手機SoC設計公司和手機OEM都希望Arm能夠提升的部分。

Paul Williamson告訴雷峰網 (公眾號:雷峰網) ,“效能和功耗要做好平衡,涉及到的因素非常多。我們與合作伙伴共同致力於在晶片以及SoC設計兩方面做出最佳的選擇。同時,我們也與作業系統廠商和其他軟體生態系統的夥伴合作,確保軟體開發能夠充分利用整個系統的資源。”

Arm衝向元宇宙

從2021年開始,Arm就更加強調全面計算的重要性。

Paul Williamson指出,“ Arm全面計算解決方案專注於設計的可擴充套件性,這也是我們能通過GPU的配置 ,滿足廣泛應用的需求。 例如,我們可以使用少量的核心數來實現非常高效和緊湊的設計,也可使用大量的核心數來實現終極的視覺體驗。在 CPU 叢集中,我們可以採取類似的方法,針對每個應用採用不同的 CPU並進行不同的配置。”

CPU、GPU、AI加速器組合的異構計算正變得越來越重要,Arm面向未來十年,也正在規劃全新的產品線進一步提升其全面計算產品組合。

Paul Williamson透露, Arm在大核 CPU 產品線中我們有新的專案Hunter和Chaberton,GPU產品線有Titan和Krake。 同時還在投資系統 IP,以確保低延遲的記憶體路徑和系統級快取效能。

想要將計算和應用推向新的時代,軟體生態和開發者也不可缺少。開發者可及性方面,Arm在不斷提升Arm計算庫和Arm NN框架,確保開發者能訪問硬體效能。Arm也在持續提升安全效能。

其中非常值得關注的是應用程式轉向64位,中國主要的應用商店已表明,到今年 8 月,所有新上架的應用都應該是64位,沒有過渡到64位的應用會因為效能欠佳讓使用者感到失望。Arm全新的CPU產品中,也僅有Cortex-A510還支援32位。這也在一定程度上表明,從硬體到應用,Arm都在為XR和元宇宙做準備。

而Arm也已經準備好衝向元宇宙的新時代。

雷峰網原創文章,未經授權禁止轉載。詳情見 轉載須知

「其他文章」