英偉達:除了H100外,中國企業可以購買新架構RTX 40系顯卡及新款AI芯片|硅基世界

語言: CN / TW / HK

英偉達Ada Lovelace架構GPU圖形處理器(來源:英偉達官網)

鈦媒體App 9月21日消息,美國芯片巨頭英偉達(NVIDIA)日前舉行一年一度的GTC 2022 大會。

昨晚(20日)GeForce Beyond主題演講上,英偉達CEO黃仁勛 (Jensen Huang) 宣佈,公司正式推出基於5nm(TSMC N4)製程的全新Ada Lovelace架構多款旗艦產品,其中包括具有760億個晶體管、搭載新一代DLSS 3圖像縮放技術的RTX 4090 GPU(圖形處理器)消費級旗艦顯卡,次旗艦RTX 4080以及L40 OVX元宇宙數據計算系統。

同時,英偉達還推出Grace CPU 超級芯片、算力2000TFLOPS的Drive Thor(雷神索爾)自動駕駛芯片、用於下一代機器人的Jetson Orin芯片等多款 AI 芯片,以及元宇宙產品線 Omniverse 的最新進展和生態合作信息。在會上,黃仁勛還披露,H100已經全面投產。

不過,鈦媒體App注意到,大會演講中,英偉達於2022年10月發貨的H100 Tensor Core GPU首批8個合作伙伴,除了聯想外沒有其他中國企業。同時,Ada Lovelace架構企業級產品和Grace CPU超級芯片首批合作客户中沒有阿里、騰訊、百度等中國公司身影。此前的9月1日,英偉達發佈更新監管文件,稱其高性能GPU的出口已得到美國政府部分許可。

那麼這是否意味着,中國公司無法採購英偉達最新的H100 GPU芯片以及Ada Lovelace架構的多款芯片產品?

對此,英偉達公司負責人對鈦媒體App獨家迴應稱:根據美國政府最近宣佈的規定,未經許可,我們不能出口、轉讓或移動NVIDIA H100 GPU 或包含它們的主板/系統以在中國市場上使用。但此限制不適用於Grace CPU超級芯片,或基於Ada Lovelace的RTX 4090、4080或L40等主題演講中提到的其他產品。此外,英偉達Jetson Orin芯片也可以在包括中國大陸在內的全球範圍內使用。

但英偉達沒有對鈦媒體App迴應,一旦美國政府出台新的限制規定下,Ada Lovelace架構產品是否會影響中國大陸企業。

據悉,20日演講中,黃仁勛展示了英偉達RTX、AI 芯片和元宇宙產品線Omniverse 的最新進展,還包括它們對AI 藥物領域新突破的幫助,以及大量應用落地。

第三代RTX顯卡方面,英偉達最新推出的GeForce RTX 40系列顯卡,是全球首款採用全新NVIDIA Ada Lovelace架構的GPU產品。

旗艦版本RTX 4090 GPU顯卡最高配備24GB美光科技的板載內存,轉投台積電後,內置芯片為TSMC定製的N4製程,塞進了760億個晶體管,比上一代Ampere多了70%,Ada效能是前代產品(RTX 3090)的四倍。“Ada正在為完全基於仿真的未來遊戲鋪路。”黃仁勛説。

黃仁勛也重點提到全新一代DLSS 3超採樣超分辨率技術——利用卷積自動編碼器AI模型,在不影響圖像質量的情況下可以提升性能,自動補出高分辨率。英偉達在Ada架構中引入了DLSS 3,開啟DLSS時,4080可達到3080Ti的兩倍性能,相較於單純的渲染可以將性能提升多至4倍。

價格上,作為世界上最快的遊戲GPU,RTX 4090公版售價1599美元(人民幣12999元)起,10月12日開始售賣;RTX 4080價格比前代漲了500美元,16GB售價1199美元(9499元),12GB版售價899美元(7199元),將於11月推出。

公佈的供貨方,華碩、七彩虹、耕升、影馳、技嘉、映眾、微星和索泰等頂級顯卡供應商將在中國推出GeForce RTX 4090和4080 GPU標頻版和超頻版。RTX 40系列GPU還會通過宏碁、外星人、華碩、戴爾、惠普、聯想、微星等OEM廠商出售。

元宇宙產品方面,英偉達發佈專為元宇宙應用打造的第二代OVX計算機,搭載了新Ada Lovelace L40數據中心GPU,以提供實時圖形、AI和數字孿生模擬功能。L40 GPU已全面進入量產,第二代OVX系統將於明年年初向市場提供,技嘉、新華三、浪潮、聯想、QCT會使用OVX系統,寶馬集團和捷豹路虎是首批OVX客户。

除硬件外,英偉達還推出其首款IaaS產品Omniverse Cloud服務,可連接在雲、本地或設備上運行的Omniverse應用。個人或團隊可以藉助該服務一鍵體驗設計和協作3D工作流程的能力,無需任何本地計算能力。

全新 AI 芯片方面,黃仁勛首先修正了公司的汽車SoC路線圖,將1000 TOPS專用處理器Atlan升級,計劃推出具備2000 TFLOPS性能的自動駕駛芯片Thor(雷神索爾),算力是目前Orin芯片的8倍,吞吐量是Atlan的兩倍,交付性能也是Atlan的兩倍以上,預計2024年推出,2025年上車使用。

黃仁勛表示,短短一年實現性能提升離不開三個架構因素:Grace、Hopper 和 Ada Lovelace,其中 Grace提供了新的Transformer引擎、ViT的快速變革,而Lovelace有助於車載計算資源的集中化,將成本降低數百美元。

對於Orin產品線,英偉達推出了一款微型機器人計算機Jetson Orin Nano,速度比上一代Jetson Nano快了80倍。黃仁勛提到,自動駕駛汽車的基本處理流水線可應用於各種機器人系統。而第二代機器人處理器DRIVE Orin已經被40多家汽車、卡車、無人駕駛出租車和穿梭巴士的製造公司採用。

黃仁勛指出,NVIDIA平台現已擁有350萬名開發者,12000家企業正基於英偉達的產品開展新業務,英偉達通過550個SDK和AI模型為約3000個應用提供加速,合作方包括騰訊雲、浪潮、IBM等。“總體來説,我們所服務的各行業總價值約為100萬億美元。”黃仁勛表示。

此外,基於Hopper架構,英偉達今天還推出了Nemo LLM雲服務,以及BioNeMo LLM服務,用於低門檻訓練大型語言模型以及生物分子語言模型,從而高效執行特定任務。

面向數據中心,英偉達在今年4月發佈的包含800億個晶體管,採用了全新Hopper架構的英偉達H100 Tensor Core GPU已經進入大規模量產,預計下個月起對OEM廠商發貨,到今年年底預計將有超過50款服務器型號面市;旗艦DGX H100則於今天起預定,預計在2023年第一季度(即從現在起的4到7個月)交付。

據介紹,H100使企業能夠削減AI的部署成本,相較於上一代A100,在提供相同AI性能的情況下,可將能效提高3.5倍,總成本減少至33%,所使用的服務器節點數也減少至20%。

然而,大部分中國企業將不會採購到H100。

黃仁勛此前在此前內部信中提到,英偉達正在與中國客户協商,將尋找最佳替代品以配合他們的需求,或尋求其他技術許可。

但問題是,目前中國客户正在尋求替代的國產芯片產品,尤其是去年全球芯片短缺下,沒有辦法得到英偉達GPU芯片的中國企業。世界人工智能大會一場論壇圓桌中,有國內芯片企業負責人表示,這一事件讓整個產業鏈裏面就緊張起來了,有很多企業創始人直接找到汽車芯片公司商量“國產替代”事宜。

“我們認為美國對高端GPU芯片的禁令將推動GPU芯片的國產替代,”光大證券在一份研報中寫道,“從產品性能來看,目前國產高端AI芯片的通用性與英偉達相比仍有一定差距,但在某一些維度已經接近或者超過英偉達。”

“我意識到這種限制是在一個已經充滿挑戰的環境下出現的。感謝大家盡最大努力遵守新的許可證要求,為我們的客户服務。我有信心我們能渡過難關。”黃仁勛在信中表示。 (本文首發鈦媒體App,作者|林志佳) 

「其他文章」