英偉達:除了H100外,中國企業可以購買新架構RTX 40系顯示卡及新款AI晶片|矽基世界

語言: CN / TW / HK

英偉達Ada Lovelace架構GPU圖形處理器(來源:英偉達官網)

鈦媒體App 9月21日訊息,美國晶片巨頭英偉達(NVIDIA)日前舉行一年一度的GTC 2022 大會。

昨晚(20日)GeForce Beyond主題演講上,英偉達CEO黃仁勳 (Jensen Huang) 宣佈,公司正式推出基於5nm(TSMC N4)製程的全新Ada Lovelace架構多款旗艦產品,其中包括具有760億個電晶體、搭載新一代DLSS 3影象縮放技術的RTX 4090 GPU(圖形處理器)消費級旗艦顯示卡,次旗艦RTX 4080以及L40 OVX元宇宙資料計算系統。

同時,英偉達還推出Grace CPU 超級晶片、算力2000TFLOPS的Drive Thor(雷神索爾)自動駕駛晶片、用於下一代機器人的Jetson Orin晶片等多款 AI 晶片,以及元宇宙產品線 Omniverse 的最新進展和生態合作資訊。在會上,黃仁勳還披露,H100已經全面投產。

不過,鈦媒體App注意到,大會演講中,英偉達於2022年10月發貨的H100 Tensor Core GPU首批8個合作伙伴,除了聯想外沒有其他中國企業。同時,Ada Lovelace架構企業級產品和Grace CPU超級晶片首批合作客戶中沒有阿里、騰訊、百度等中國公司身影。此前的9月1日,英偉達釋出更新監管檔案,稱其高效能GPU的出口已得到美國政府部分許可。

那麼這是否意味著,中國公司無法採購英偉達最新的H100 GPU晶片以及Ada Lovelace架構的多款晶片產品?

對此,英偉達公司負責人對鈦媒體App獨家迴應稱:根據美國政府最近宣佈的規定,未經許可,我們不能出口、轉讓或移動NVIDIA H100 GPU 或包含它們的主機板/系統以在中國市場上使用。但此限制不適用於Grace CPU超級晶片,或基於Ada Lovelace的RTX 4090、4080或L40等主題演講中提到的其他產品。此外,英偉達Jetson Orin晶片也可以在包括中國大陸在內的全球範圍內使用。

但英偉達沒有對鈦媒體App迴應,一旦美國政府出臺新的限制規定下,Ada Lovelace架構產品是否會影響中國大陸企業。

據悉,20日演講中,黃仁勳展示了英偉達RTX、AI 晶片和元宇宙產品線Omniverse 的最新進展,還包括它們對AI 藥物領域新突破的幫助,以及大量應用落地。

第三代RTX顯示卡方面,英偉達最新推出的GeForce RTX 40系列顯示卡,是全球首款採用全新NVIDIA Ada Lovelace架構的GPU產品。

旗艦版本RTX 4090 GPU顯示卡最高配備24GB美光科技的板載記憶體,轉投臺積電後,內建晶片為TSMC定製的N4製程,塞進了760億個電晶體,比上一代Ampere多了70%,Ada效能是前代產品(RTX 3090)的四倍。“Ada正在為完全基於模擬的未來遊戲鋪路。”黃仁勳說。

黃仁勳也重點提到全新一代DLSS 3超取樣超解析度技術——利用卷積自動編碼器AI模型,在不影響影象質量的情況下可以提升效能,自動補出高解析度。英偉達在Ada架構中引入了DLSS 3,開啟DLSS時,4080可達到3080Ti的兩倍效能,相較於單純的渲染可以將效能提升多至4倍。

價格上,作為世界上最快的遊戲GPU,RTX 4090公版售價1599美元(人民幣12999元)起,10月12日開始售賣;RTX 4080價格比前代漲了500美元,16GB售價1199美元(9499元),12GB版售價899美元(7199元),將於11月推出。

公佈的供貨方,華碩、七彩虹、耕升、影馳、技嘉、映眾、微星和索泰等頂級顯示卡供應商將在中國推出GeForce RTX 4090和4080 GPU標頻版和超頻版。RTX 40系列GPU還會通過巨集碁、外星人、華碩、戴爾、惠普、聯想、微星等OEM廠商出售。

元宇宙產品方面,英偉達釋出專為元宇宙應用打造的第二代OVX計算機,搭載了新Ada Lovelace L40資料中心GPU,以提供實時圖形、AI和數字孿生模擬功能。L40 GPU已全面進入量產,第二代OVX系統將於明年年初向市場提供,技嘉、新華三、浪潮、聯想、QCT會使用OVX系統,寶馬集團和捷豹路虎是首批OVX客戶。

除硬體外,英偉達還推出其首款IaaS產品Omniverse Cloud服務,可連線在雲、本地或裝置上執行的Omniverse應用。個人或團隊可以藉助該服務一鍵體驗設計和協作3D工作流程的能力,無需任何本地計算能力。

全新 AI 晶片方面,黃仁勳首先修正了公司的汽車SoC路線圖,將1000 TOPS專用處理器Atlan升級,計劃推出具備2000 TFLOPS效能的自動駕駛晶片Thor(雷神索爾),算力是目前Orin晶片的8倍,吞吐量是Atlan的兩倍,交付效能也是Atlan的兩倍以上,預計2024年推出,2025年上車使用。

黃仁勳表示,短短一年實現效能提升離不開三個架構因素:Grace、Hopper 和 Ada Lovelace,其中 Grace提供了新的Transformer引擎、ViT的快速變革,而Lovelace有助於車載計算資源的集中化,將成本降低數百美元。

對於Orin產品線,英偉達推出了一款微型機器人計算機Jetson Orin Nano,速度比上一代Jetson Nano快了80倍。黃仁勳提到,自動駕駛汽車的基本處理流水線可應用於各種機器人系統。而第二代機器人處理器DRIVE Orin已經被40多家汽車、卡車、無人駕駛出租車和穿梭巴士的製造公司採用。

黃仁勳指出,NVIDIA平臺現已擁有350萬名開發者,12000家企業正基於英偉達的產品開展新業務,英偉達通過550個SDK和AI模型為約3000個應用提供加速,合作方包括騰訊雲、浪潮、IBM等。“總體來說,我們所服務的各行業總價值約為100萬億美元。”黃仁勳表示。

此外,基於Hopper架構,英偉達今天還推出了Nemo LLM雲服務,以及BioNeMo LLM服務,用於低門檻訓練大型語言模型以及生物分子語言模型,從而高效執行特定任務。

面向資料中心,英偉達在今年4月釋出的包含800億個電晶體,採用了全新Hopper架構的英偉達H100 Tensor Core GPU已經進入大規模量產,預計下個月起對OEM廠商發貨,到今年年底預計將有超過50款伺服器型號面市;旗艦DGX H100則於今天起預定,預計在2023年第一季度(即從現在起的4到7個月)交付。

據介紹,H100使企業能夠削減AI的部署成本,相較於上一代A100,在提供相同AI效能的情況下,可將能效提高3.5倍,總成本減少至33%,所使用的伺服器節點數也減少至20%。

然而,大部分中國企業將不會採購到H100。

黃仁勳此前在此前內部信中提到,英偉達正在與中國客戶協商,將尋找最佳替代品以配合他們的需求,或尋求其他技術許可。

但問題是,目前中國客戶正在尋求替代的國產晶片產品,尤其是去年全球晶片短缺下,沒有辦法得到英偉達GPU晶片的中國企業。世界人工智慧大會一場論壇圓桌中,有國內晶片企業負責人表示,這一事件讓整個產業鏈裡面就緊張起來了,有很多企業創始人直接找到汽車晶片公司商量“國產替代”事宜。

“我們認為美國對高階GPU晶片的禁令將推動GPU晶片的國產替代,”光大證券在一份研報中寫道,“從產品效能來看,目前國產高階AI晶片的通用性與英偉達相比仍有一定差距,但在某一些維度已經接近或者超過英偉達。”

“我意識到這種限制是在一個已經充滿挑戰的環境下出現的。感謝大家盡最大努力遵守新的許可證要求,為我們的客戶服務。我有信心我們能渡過難關。”黃仁勳在信中表示。 (本文首發鈦媒體App,作者|林志佳) 

「其他文章」