Arm全面進化:CPU超越酷睿i7、GPU光追效能猛增3倍

語言: CN / TW / HK

作為移動晶片領域的王者,Arm每年都會帶來新的CPU、GPU、互連技術方案,近日就奉上了全新的Arm TCS22,也就是2022年全面計算解決方案,包括一系列IP組合。

CPU方面是 全新旗艦超大核心Cortex-X3、大核心Cortex-A715,以及升級版小核心Cortex-A510(名字沒變)。

GPU方面是 首次支援硬體光線追蹤的旗艦級Immotalis-G715、高階的Mali-G715、高階的Mali-G615。

互連方面則是升級版的DSU-110。

接下來,我們就分別看看都有哪些變化。

【CPU:超大核效能提升25%、三種核心組合更靈活】

2021年3月底,Arm正式釋出了全新的Armv9指令集,號稱10年最重要的創新、面向未來10年移動計算的基石。

Armv9重點增強向量計算(SEV2指令集)、機器學習、數字訊號處理,強化安全性,並繼續提升效能,號稱IPC效能未來兩代提升會超過30%。

當然,它完全向下相容Armv8。

Armv9指令集的Cortex-X2超大核心已經在驍龍8/驍龍8+、天璣9000/天璣9000+等旗艦移動處理器中得到應用,這次釋出的是新一代Cortex-X3。

Cortex-X3在架構設計上的變化相當深入、廣泛,比如解碼器每週期指令從5個增加到6個,亂序執行視窗從288個增加到320個, ALU整數算數單元從4個增加到6個,二級快取容量從512KB翻番到1MB,並且不再支援32位指令集。

效能方面, 3.3GHz頻率、1MB二級快取、8MB三級快取的配置下,與基於Cortex-X2的安卓旗艦處理器對比,提升最多25%。

3.6GHz頻率、1MB二級快取、16MB三級快取的配置下,與主流筆記本處理器(Intel i7-1260p)相比,單核效能高出最多34%。

Cortex-A715注重效能與能效的平衡,對比去年的Cortex-A710,在同等效能下能效提升最多20%,而在同等功耗下效能提升最多5%。

同時,它已經達到了上上代超大核Cortex-X1的效能水準。

對了,A710也僅支援64位指令集。

Cortex-A510名字沒變,效能也沒變,不過能效提升了5%,應該是與更新制造工藝結合的效果。

同時, 它也是唯一保留32位指令集支援的核心。 如果一款App還沒有升級到64位,今後只能依賴小核心執行,效率必然大打折扣。

Arm也是意在通過此舉推動行業向64位加速轉型。

另外,DSU-110互連單元也更加強大靈活,支援核心數量增加50%,比如Cortex-X3可以最多12核心、16MB三級快取,還支援更多指令集。

big.LITTLE大小核的組合也更加靈活、豐富,同樣1+3+4,X3+A715+A510的組合比去年的X2+A710+A510效能可提升12%。

1+4+4則可比1+3+4效能提升最多21%,2+2+4可提升最多23%, 還首次加入了8+4+0這樣的組合,面向中高階筆記本,效能高出足足120%。

總體而言,Cortex CPU今年的升級比較中規中矩。X3、A715都是預料之中的對位升級,A510本身幾乎毫無變化。

但是,結合新的DSU-10互連單元,三種核心的配置更加靈活多變,可滿足不同裝置、應用場景的不同需求,包括在筆記本領域繼續競爭Intel、AMD x86雙雄。

【GPU:首次迎來硬體光追 名字都變了】

Arm Mali GPU憑藉與Cortex CPU的整合優化、持續不斷的迭代升級,已經成為移動行業的絕對主流,出貨量全球領先,累計已超80億。

這一次,Arm GPU迎來了一次超級變臉,旗艦型號放棄了Mali的傳統名字,改成了全新的“Immortalis”,首款型號“Immortalis-G715”。

之所以改名,首要原因就是 第一次支援基於硬體的光線追蹤 ,和NVIDIA、AMD、Intel的高效能顯示卡一樣進入了光追時代。

當然,Arm GPU不是第一個支援光追的移動端產品,Imagination此前已經做到,但是兩家的影響力不可同日而語,Imagination的光追方案時至今日仍然沒有落地。

其實, 去年的Mali-G710已經支援軟體光追 ,聯發科天璣9000就開啟了這一功能,並用在了OPPO Find X5 Pro天璣版手機中,今年則升級為硬體光追。

當然,光線追蹤非常消耗硬體和軟體資源,一般也會大大增加功耗,不過Arm宣稱, Immortalis-G715的光追單元只佔用了大約4%的著色器核心面積,而且功耗非常低,就帶來了超過3倍的效能提升(對比軟體光追)。

以下是Arm官方給出的光追效果對比圖,右半部分為開啟光追,可以看到豐富、清晰的反射、陰影,與非光追不可同日而語。

當然,無論是效能、功耗、效果,都還有待實際考驗。

VRS可變重新整理率也成了標配,同樣追上了NVIDIA、AMD、Intel的腳步。

該技術隸屬於DX12範疇,簡單地說可在單個幀畫面內改變著色速率,選擇性地降低畫面部分割槽域的細節水平(被遮擋/畫面邊緣等),從而在幾乎不影響畫質的情況下,提升圖形效能。

Arm展示了VRS在騰訊《王者榮耀》中的效果, 原畫面和VRS畫面幾乎看不出任何區別,而在效能上,官方號稱可將幀率提升最多達40%。

回到常規層面,Immotalis-G715的提升也非常可觀,官方號稱 對比上代Mali-G710同等功耗下效能提升最多15%,機器學習效能直接翻番,而在同等效能下能效可提升最多15%。

它可以配置 10-16個核心。

另外,Arm對執行引擎也做了全方位增強,主要有三個方面:

一是重新設計轉換模組,大大縮小佔用面積。

二是升級乘積累加運算(FMA),模組數量翻番,進一步提升效能和能效。

三是支援矩陣乘法指令(Matrix Multiply),可提升計算攝影、影象增強的效率,這也是機器學習效能翻倍的主要來源。

其他方面,指令流前端(Command Stream Frontend)、層次細節(LOD)、固定率壓縮(AFRC)等技術都得到了升級。

同時,Arm 也釋出了 高階的Mali-G715 GPU(是的編號一樣),沒有光追,能效提升15%,可配置7-9個核心。

還有高階的Mali-G615,可配置最多6個核心。

它們倆也都支援VRS可變重新整理率,這已經是Arm GPU的標配,同時也升級了執行引擎。

總體而言,Arm GPU今年的變化比較極端,新引入的頂級核心Immortalis-G715整體煥然一新,效能提升明顯,尤其是將開啟手遊的光追新時代。

Mali-G715、G615的亮點則在於普及了VRS。

【未來:一年一變 每年提升兩位數效能】

有趣的是,Arm這次很大方地公佈了未來兩年的路線圖。

明年的TCS23,超大核CPU升級為CXC23(預計命名Cortex-X4),大核、小核分別升級為Hunter、Hayes,DSU互聯單元升級為Hayden,旗艦GPU則升級為Titan。

後年的TCS24,超大核CPU再次升級為CXC24(預計命名Cortex-X5),大核升級為Chaberton,小核則維持不變還是Hayes,旗艦GPU則繼續升級為Krake。

另外,沿用多代的CoreLink CI-700一致性互連技術、CoreLink NI-700片上網路互連技術,也終將迎來更新,代號Tower。

希望Arm未來能在能效、擴充套件性、平臺安全性方面齊頭並進。

「其他文章」