重大技術突破首次釋出!十問解密雲棲大會!

語言: CN / TW / HK

簡介: 2021年10月19日,杭州,雲棲大會正式開幕。大會上,阿里巴巴正式釋出自研雲晶片倚天710,這是阿里雲推進“一雲多芯”策略的重要一步,也是阿里第一顆為雲而生的CPU晶片,將在阿里雲資料中心部署應用。

來源 | 阿里技術公眾號

2021年10月19日,杭州,雲棲大會正式開幕。

大會上,阿里巴巴正式釋出自研雲晶片倚天710,這是阿里雲推進“一雲多芯”策略的重要一步,也是阿里第一顆為雲而生的CPU晶片,將在阿里雲資料中心部署應用。

會上,阿里雲還推出了面向雲原生時代的“磐久”自研伺服器系列,首款搭載自研晶片倚天710的磐久高效能運算系列也同時亮相,該款伺服器將在今年部署,為阿里雲自用。

同時,技術君從現場獲悉,阿里平頭哥宣佈開源玄鐵RISC-V系列處理器,並開放系列工具及系統軟體。全球開發者可下載玄鐵原始碼,平頭哥也將持續開源穩定的、全棧一體的RISC-V IP核,並提供技術支援和應用服務。

下面,技術君就為各位深度解密這些重磅技術和產品。

一 倚天710有何特點?

和2019年釋出的AI推理晶片含光800不同,倚天710是一顆通用伺服器CPU晶片。CPU是計算機系統最核心的單元,負責接收、處理、運算計算機內部的所有資訊。

倚天710採用業界最先進的5nm工藝,單晶片容納高達600億電晶體;在晶片架構上,基於最新的ARMv9架構,內含128核CPU,主頻最高達到3.2GHz,能同時兼顧效能和功耗。在記憶體和介面方面,整合業界最領先的DDR5、PCIe5.0等技術,能有效提升晶片的傳輸速率,並且可適配雲的不同應用場景。在SPECInt2017基礎測試平臺上,跑分達到440分,是效能最強的伺服器晶片,超出業界標杆20%,能效比優於業界標杆50%,能有效幫助資料中心節能減排。

二 研發這顆晶片最大的難點是什麼?平頭哥做了哪些自研技術和創新?

CPU是半導體行業設計門檻最高的晶片之一,倚天710採用了很多最領先的技術,包括ARMv9、DDR5、PCIe5.0等等,同時也引入了許多自研技術。平頭哥從前端架構設計到後端物理實現都是自研,既要克服工藝以及IP不成熟帶來的困難,又要針對雲場景的獨特要求做定製化設計,技術上保障效能、功耗的均衡。

在前端設計方面,為解決核數眾多條件下的頻寬瓶頸,平頭哥對於片上互聯作出特殊優化,採用新的流控演算法,降低系統反壓,有效提升了系統效率和擴充套件性,使單核高效能有效地轉化為整個系統的高效能。此外,通過新的系統地址到DRAM地址的轉換機制,支援安全、非安全隔離、多NUMA、異常通道隔離多種特性,同時DRAM讀寫效率大幅度提升;在後端物理實現方面,靈活排程多達30種不同EDA軟體、深度定製時鐘網路和定製IP技術,此外平頭哥還採用了先進的多晶片堆疊技術,最後成功確保了晶片效能、功耗的優化。

三 5nm先進工藝對晶片有何價值?對平頭哥的挑戰是什麼?

晶片也可以稱為積體電路,其內部是由大量電晶體組成的複雜電路,其中電晶體的柵極是最窄的線條,這個線條的寬度就代表了工藝的大小。工藝越小,單位面積所能容納的電晶體就越多,而晶片的效能也會越強,但這一數值越低,對技術的要求也越高。

在此之前,伺服器晶片最先進的工藝仍為7nm,倚天710率先實現了更高的工藝,是第一顆採用5nm工藝的伺服器晶片,5nm工藝下的倚天710共容納了600億電晶體。5nm工藝對能量密度、晶片內部結構的佈局有極高的要求,研發過程中我們靈活排程多達30種不同EDA軟體、深度定製時鐘網路和定製IP技術,此外平頭哥還採用了先進的多晶片堆疊技術,最後成功確保了晶片效能、功耗的優化。

四 該晶片對阿里雲以及雲上客戶有何價值?

效能、成本和功耗是雲服務商及雲上企業關注的核心,倚天710針對雲場景的高併發、高效能和高能效需求而設計,將領先的晶片設計技術與雲場景的獨特需求相結合,最終實現了效能和能效比的突破。此外,倚天710與飛天作業系統協同,能為雲上客戶提供高性價比的雲服務。2019年雲棲大會問世的含光800已規模化部署於阿里雲,基於這顆自研晶片的阿里云為雲上企業提供了差異化選擇,目前已應用於搜尋推薦、影片直播等場景。此次釋出的倚天710將在阿里雲資料中心部署,並逐步服務雲上企業。

五 從專用晶片走向通用晶片的研發,這對平頭哥來說意味著什麼?

通用處理器晶片是資料中心最複雜的晶片之一,其架構設計複雜,對效能、功耗要求極高,截至目前具備這一技術實力的企業也寥寥可數,目前,Intel、AMD、AWS以及阿里平頭哥等少數公司在此之列。

過去,平頭哥已積累了豐富的AI晶片及處理器IP設計經驗,這是平頭哥突破通用晶片研發技術的基礎。對於平頭哥而言,倚天710晶片是首個通用伺服器晶片,倚天晶片的研製成功,標誌著平頭哥已經具備大型複雜晶片的研發設計能力,並進入一流晶片公司的行列。

六 相比其它企業,平頭哥研發晶片有何優勢?

和絕大多數晶片企業不同,平頭哥的目的並非售賣晶片,已全面佈局處理器IP、AI晶片、通用伺服器晶片等技術。在處理器IP方面,平頭哥核心團隊擁有十年以上的CPU IP和晶片研發經驗,長期從事自研指令集架構、CPU微體系結構與系統晶片產品的研發,累計開發了十多款玄鐵系列嵌入式CPU IP核,這些產品均已得到大規模量產的驗證,累計出貨量超過25億顆。在雲端晶片方面,背靠全球前三的雲平臺阿里雲,平頭哥能深刻理解資料中心業務場景和需求,因此能夠更高效地研發業界一流的晶片,目前,平頭哥已擁有含光800 AI推理晶片、倚天710通用晶片,這兩顆晶片均實現了效能的突破。

七 阿里與ARM、Intel之間將保持什麼樣的合作關係?

阿里雲「一雲多芯」和「做深基礎」的商業策略,目前阿里雲已全面相容x86、ARM及RISC-V等晶片架構,此次釋出倚天710,希望滿足客戶多樣性的計算需求,這款晶片不出售,主要是阿里雲自用。我們將繼續與英特爾、英偉達、AMD、ARM等合作伙伴保持密切合作,為客戶提供更多選擇。

八 目前平頭哥有哪些產品?

隨著倚天710的釋出,平頭哥已擁有處理器IP、AI晶片及通用晶片等產品家族。其中,玄鐵系列為AIoT終端晶片提供高性價比IP;AI晶片含光800通過阿里云為人工智慧場景提供極致AI算力;通用伺服器晶片倚天710則通過阿里云為雲上客戶提供差異化的頂級算力。

在此之前,平頭哥旗下玄鐵系列處理器出貨量已達25億顆;兩年前問世的阿里第一顆晶片含光800已實現規模化應用,通過阿里雲服務了搜尋推薦、影片直播等行業客戶。

九 平頭哥為何開源玄鐵RISC-V系列處理器?

平頭哥堅持自研,同時也擁抱開源,特別是對於正在上升期的RISC-V架構技術而言,只有更多的開發者和企業使用,才能共同推進生態進步,真正讓這一技術在晶片和作業系統等軟硬體層面實現繁榮,平頭哥也會從中受益。

同時,玄鐵RISC-V處理器系列開源,將持續提供技術和服務更新,幫助企業和開發者從開源中真正落地,走向商業成功,共同繁榮“雲端一體”的AIoT生態。

阿里雲智慧總裁張建鋒表示,“經過3年努力,我們今天又釋出玄鐵RISC-V系列開源版。未來,我們將開源更多RISC-V處理器,也希望有更多的合作伙伴,在玄鐵基礎上研發出更多有價值的IP核和基礎軟體,共同構建開放、透明和普惠的RISC-V生態。”

十 阿里是否會堅持自研晶片,自研晶片對阿里巴巴有何價值?

平頭哥於2018年成立,過去三年已推出多款業界領先的晶片類產品,未來阿里巴巴會繼續堅持投入晶片的研發。

晶片是計算系統的核心,也是所有網際網路應用、創新科技的基礎。阿里巴巴集團橫跨電商、物流、雲端計算、大資料、全球化等場景,擁有世界上最挑戰、最豐富的計算場景、網路場景、機器學習場景,需要使用大量晶片,自研晶片能夠降低阿里巴巴集團內部整體計算的成本。與此同時,阿里雲穩居全球雲端計算廠商前三、亞太第一的位置,倚天710、含光800等自研晶片還可通過阿里雲輸出給全社會,以更高的效能和更低的成本賦能更多的企業,讓企業隨時隨地可以享受到極致算力。

隨著“倚天”和“磐久”的面世,阿里雲完善了全棧雲基礎設施的最後一環,實現從晶片、部件到整機的技術及架構創新和自研。

本屆雲棲大會自19日至22日,除了主論壇的精彩釋出,在這屆雲棲大會中有96小時的“雲棲數字谷”極致體驗,100+場的前沿論壇共創數字新思想、450+最新科技新品重磅呈現以及數字創新者的跨圈交流,歡迎參與這場技術盛會。

原文連結

本文為阿里雲原創內容,未經允許不得轉載。