頂配12999元的RTX 40系列、算力2000 TOPS的自動駕駛晶片……英偉達「狂秀肌肉」

語言: CN / TW / HK

“親兒子”背刺,汽車客戶著手自研,以太坊合併……面對諸多外部因素,英偉達之後會如何呢?

昨日夜間11點,依舊一身皮衣的黃仁勳亮相釋出會,一連發布多款新產品,帶來了兩年一大升級的GeForce RTX 40系列,也帶來了 自動駕駛 領域的最新之作。

其中,如同此前網上所傳聞的, RTX 40系列首發產品包含GeForce RTX 4090和GeForce RTX 4080兩個型號三款產品, 至於其效能如何,我們接下來慢慢看。

RTX 4090:新架構、DLSS 3與臺積電4nm工藝

在首發的三款產品中,RTX 4090 GPU為旗艦產品,採用了 臺積電4nm工藝,擁有760億個電晶體、超18000個CUDA核心和美光24GB GDDR6X視訊記憶體, 能夠在 4K 解析度的遊戲中持續以超過100 FPS執行。

而取代過往的Ampere架構,此次RTX 40系列首次採用了 新架構——Ada Lovelace, 這是一位女性的名字,她被許多人認為是世界上第一個 計算機 程式設計師。

依據黃仁勳介紹,基於Ada Lovelace架構,RTX 40系列在SM多單元處理器等方面都進行了換代升級。

比如 SM多單元處理器,效能最高達到90 TFLOPS,吞吐量是上一代Ampere架構的2倍。 其中英偉達全新引入了 Shader Execution Reordering(著色器執行重排序技術), 通過即時重新安排著色器負載來提高執行效率,從而更好地利用GPU資源。依據老黃現場介紹,基於這一改變,RTX 40系列可獲得2-3倍的光線追蹤效能提升,整體遊戲效能提升可高達25%。

再來看RT Core,其擁有了兩個全新硬體單元,分別是 Opacity Micromap和Micro-Mesh引擎, 前者將光線追蹤的Alpha-Test幾何效能提升2倍,後者可動態生成微網格,在不犧牲效能和儲存的前提下產生額外的幾何圖形以提升豐富度。基於這一升級,RTX 40系列擁有2倍的射線三角形相交吞吐量,有效光線追蹤計算能力達到191 TFLOPS,是上一代產品的2.8倍。

此外,黃仁勳還重點介紹了RTX 40系列新引入的 DLSS 3.0技術, 它包含四項元件,其中最為關鍵的是新加入的 AI幀生成器, 可分析兩幀連續的遊戲影象,並計算幀到幀中物體和元素的運動向量資料。舉個例子,DLSS 3.0可以使原本開啟光線追蹤後僅為23幀/秒的《賽博朋克2077》以101幀/秒呈現(DLSS 2.0的效果為提升到62幀/秒)。

除了RTX 4090,英偉達在這場釋出會上還帶來了兩個版本RTX 4080,即RTX 4080 16GB和 RTX 4080 12GB,除了記憶體不同外,16GB版本擁有9728個CUDA核心,12GB版本則是擁有7680個CUDA核心。

至於釋出時間與價格:

RTX 4090將於10月12日上市,售價12999元起;

RTX 4080 16GB將於11月上市,售價9499元起;

RTX 4080 12GB將於11月上市,售價7199元起。

是的,相比上一代,漲價了。

Thor:全新自動駕駛晶片,還身兼多職

RTX 40系列之後,老黃緊接著帶來的是全新自動駕駛旗艦級晶片 “Thor(雷神)”, 用黃仁勳的話來說: “Atlan不再是第一了……它將被Thor取代”。

依照英偉達原先規劃,單顆算力達到1000 TOPS的Atlan將於2023年向開發者提供樣品,並於2025年大規模量產上車。如今來看, Atlan似乎是被砍了, 並且主角也由Atlan換成了Thor。

依據介紹,Thor搭載了770億電晶體,可實現算力 2000 TOPS和2000 TFLOPs。 而之所以能夠做到這點,黃仁勳歸納為三點升級: CPU(Grace)、GPU(Ada Lovelace)和處理Transformer模型的引擎(Hopper)。

其中,Grace是英偉達首款資料中心CPU,主要面向大型資料密集型HPC和AI應用,擁有非常好的單執行緒效能;Ada Lovelace是英偉達最新的GPU產品,有助於車載計算資源集中化的同時,也將成本降低數百美元;Hopper則提供了Transformer引擎和Vision Transformer的快速變革,可以將深度神經網路的推理效能提高9倍。

值得注意的是,除了效能上的提升,Thor更為令人驚歎的是能夠做到“身兼多職”,基於多域計算, 不僅能單獨負責自動駕駛系統的計算需求,還能將2000 TOPS和2000 TFLOPs分開配置使用,一部分用於駕駛艙AI和資訊娛樂系統,另一部分用於自動駕駛。 這意味著,你可以在一臺計算機上同時執行汽車底層的 Linux ,輔助駕駛的QNX,智慧座艙的 安卓 等多個作業系統,真正做到了 1顆晶片當6顆用。

而為了加快晶片之間的資料傳輸,英偉達也在Thor中集成了最初為資料中心應用開發的 NVLINK連線。

Jetson Orin Nano:微型機器人系統級模組,速度提升80倍

硬體方面,除了最新消費級GPU RTX 40系列、全新自動駕駛芯Thor,英偉達還帶來了一款 微型機器人系統級模組晶片Jetson Orin Nano。

依據介紹,相較於3月份釋出的Jetson Nano,Jetson Orin Nano的效能大幅提升了約80倍,但是價格相對較低,很可能成為 入門級AI邊緣裝置和機器人開發的新標準。

Orin Nano能夠以迄今為止最小的 Jetson 外形尺寸提供高達 40 TOPS, 採用與英偉達先前宣佈的Orin NX相容的模組,支援具有Ampere架構GPU的AI應用程式管道。

該產品共提供 2個版本,售價199美元起:

Orin Nano 8GB,提供高達 40 TOPS 的功率,功率可配置為 7W 至 15W;

Orin Nano 4GB,提供高達 20 TOPS 的功率選項,功率選項低至 5W 至 10W。

最後

整場釋出會,英偉達在產品展示上依舊是穩定輸出,也再一次向外界告知,英偉達已經不僅僅是一家GPU公司,其業務早已遍佈多個領域,並在其中的多個站到了頭部的位置。

只不過近一段時間以來,圍繞英偉達也是壞訊息不斷,比如自動駕駛頭部企業 Cruise宣佈著手自研自動駕駛晶片, 更是一口氣開發四種,背後原因,則是為了降低外購晶片的成本。對於英偉達來說,這並不是一個好訊息。

與此同時,曾經親密的合作伙伴、被外界視為英偉達“親兒子”的 EVGA宣佈與其終止合作, 不再生產新顯示卡,又比如 以太坊合併,終結了大規模顯示卡挖礦時代, 這一波攻勢下,新顯示卡的銷量有待後面市場的考驗。其漲價的背後,不知是不是也有著想消耗舊顯示卡庫存的考量。

最後,記得關注微信公眾號:鎂客網(im2maker),更多幹貨在等你!