始於雲端計算,DPU創業如何完善新的生態?| 快公司

語言: CN / TW / HK

以軟體為開端的雲端計算行業,經過十餘年發展,正變得越來越“硬”。歸根究底,軟硬一體能實現更低的成本、更好的效果,這也是IT產業史上不甚新鮮的輪迴,而每當一次或軟或硬的變革發生時,新的故事也正在寫就。

2022年6月份,DPU(資料處理單元,Data Processing Unit)創業廠商大禹智芯宣佈完成A輪融資,融資金額未公佈,該輪融資由前海方舟旗下的智慧互聯產業基金、中原前海基金和齊魯前海基金共同投資,融資資金將用於產品研發和推廣。

DPU是當下雲端計算行業的熱詞,大禹智芯自2020年6月成立以來,兩年獲得四筆融資,融資頻率之高一方面說明了公司的質量,另一方面也證明了賽道的正確性,不論是巨頭還是初創,紛紛投入DPU賽道,市場熱度仍在增長。

大禹智芯創始人李爽曾任美團雲總經理、阿里巴巴網路技術總監、百度系統技術委員會主席等職位,這與DPU的發展背景也很是相似,DPU始於雲端計算,未來卻不止於此。

DPU為何誕生在公有云?

2019年,由Juniper發起人建立的矽谷創業公司Fungible提出了DPU的概念,2020年,英偉達收購Mellanox,並將BlueField產品線更名為Nvidia DPU,此外結合英特爾推出IPU(Infrastructure Processor Unit,可以理解為另一種DPU命名), 阿里雲釋出CIPU等行業動態,DPU成為確鑿無疑的行業大勢。

DPU最早落地的領域是雲端計算,AWS從2015年就已經探索DPU的發展,收購晶片廠商Annapurna Labs,推出Nitro晶片,雖然當時還沒有“DPU”這一名字,但Nitro被公認為是DPU的早期形態,

大禹智芯對鈦媒體App表示,DPU出現在公有云場景是有其邏輯的,在最初的傳統IT技術設施架構裡,每臺或一組伺服器可以提供完整的服務,基於這樣的架構設計,更多考慮資料中心南北向流量(資料中心外部使用者和內部伺服器之間互動的流量)的交付能力。

但隨著整個雲化和應用部署方式的變化,應用由單機模式轉變為叢集模式,追求更多的橫向可擴充套件及健壯性,整個資料中心的流量發生變化,應用不斷雲化以及微服務化後,東西向流量已經佔據資料中心85%或者更大的比例。

基於此,巨集觀上伺服器間的流量模型發生變化,微觀上虛機和微服務間也會產生大量資料,因此應用部署要求更加靈活。

基於雲端計算場景,資料中心還需要提供租戶隔離、客戶QoS、客戶網路安全性、使用遠端儲存等功能,要實現上述這些功能基於網路提供的服務,便催生了DPU的出現和應用。相比目前的普通網絡卡和智慧網絡卡,DPU是價效比更好的方案選擇。

李爽表示,“DPU出現的底層邏輯就是為了提高CPU的處理效率,釋放CPU算力,同時為CPU和GPU提供基礎資料服務,他們之間的關係是相輔相承。隨著高效的資料搬遷能力,解耦的資源池化逐漸成為新型高效能運算架構的必要技術能力。在這兩個領域,DPU均可發揮其他型別處理單元所不具備的能力。”

DPU廠商的不同路徑

以目前主流的硬體創新路徑來看,DPU產品研發可以分為兩種:一種是傳統路徑,即由下而上的底層硬體創新,代表企業包括Pensando(已被AMD收購)、Fungible等。

他們把自身理解的業務場景及所對應的技術能力,先融入到晶片中,再通過晶片構建上層軟體及面向客戶呈現的功能。在逐漸面向市場的過程中,通過潛在客戶的反饋,再次調整自身晶片能力和市場定位。

另一種是更關注實用性的路徑,即從上層場景需求出發推動晶片等底層硬體的創新,代表企業包括網際網路巨頭AWS和阿里,大禹智芯也將自己歸於這種路徑。

AWS和阿里雲的技術路線,與上述兩家美國DPU類產品創業公司有所不同,這兩家既是問題的發現者,同時也是問題的解決者,問題和需求的明確性,使他們能夠有的放矢地選擇技術路線並付諸實踐。

由於AWS和阿里雲在雲端計算基礎設施層面面臨的問題類似,所以二者技術思路也趨於一致,都把突破口定位在網路、儲存和Hypervisor三個方面。

經過市場的考驗,證明了在雲端計算場景中AWS和阿里雲的DPU類產品及技術解決方案是成功的,也幫助這兩家大型公有云服務提供商,在各自主要市場保持價效比和佔有率。

目前看,AWS和阿里雲都加強了DPU產品的廣泛宣傳,但均沒有當做獨立產品對外銷售,業內人士分析,這可能有兩方面的考慮,一是為了保持自身的差異化競爭優勢;二是其DPU產品與自己平臺緊密相關,產品化程度可能不足,因此無法更多適配其它場景。

大禹智芯並不是雲端計算廠商,但是其創始人團隊在雲端計算領域有多年的工作經驗,因此在實現路徑上也採取了從場景到晶片的路徑,根據實際需求來補充和迭代DPU產品,在從場景到功能到軟體到硬體,自上而下的傳遞過程中,把場景化需求抽象出來形成能夠複用和固化的技術邏輯,逐漸固化到硬體中。

值得一提的是,前阿里巴巴及谷歌智慧網絡卡團隊負責人蔣曉維,近日作為合夥人正式加入大禹智芯任首席科學家,負責大禹智芯的DPU晶片等研發工作。蔣曉維曾在阿里雲、谷歌雲和英特爾廠商任職,是第五位華人HPCA名人堂成員,據瞭解,他將主持大禹智芯SoC產品的定義和設計工作。

不同於AWS和阿里雲,大禹智芯希望實現一個通用型的DPU產品,在其對外宣傳中,邊緣計算、運營商、行業使用者等也是其重點關注的客戶,通用型DPU是否能被市場接受,是大禹智芯接下來的考驗。

此外,DPU被認為是CPU、GPU之外的第三顆晶片,老牌晶片巨頭英特爾和英偉達自然沒有缺席,鈦媒體App瞭解到,英偉達的CX系列智慧網絡卡有非常高的市場佔有率和滲透率,英偉達藉助CX系列的部署經驗及客戶反饋資訊,定義了Bluefield系列產品。

英特爾則與谷歌合作共同定義了IPU SoC--Mont Evans的架構和功能,希望藉助谷歌在大規模資料中心內的實際需求和寶貴經驗,打造既可滿足谷歌定製化需求,又能面向廣泛市場的DPU類產品。

作為由下而上的典型廠商,英偉達及英特爾在晶片實現方面的能力毋庸置疑,並且,他們都很早認識到了DPU的價值,並很早就開始了產品的設計與開發,但其DPU產品的廣泛使用的相關報道較少,反而是AWS和阿里雲的產品真正做到了大規模使用,這其中反應的問題,也非常值得關注。

通過AWS和阿里研發並規模化部署DPU類產品的經驗可以看出,第二種路徑更適合DPU產品大規模商業落地,也更具備市場前景和發展空間。

懸而待解的行業難題

DPU和CPU、GPU的發展路徑不盡相同,但卻有同樣的應用場景潛力,DPU技術來源於大型公有云場景,其在雲端計算場景中的價值已經毋庸置疑,大禹智芯將DPU比喻為伺服器中的“前置伺服器”,定義DPU為集晶片、硬體板卡、作業系統、應用軟體一體化的方案。

如果從廣義上定義DPU的使用場景,DPU適用於大量需要複雜網路資料處理或高效能網路資料互動的場景,DPU可改變現有網路資料處理模型,提供更大範圍更高效的資料流轉方式,有望在以後構建起以DPU為中心的基礎設施架構。

大禹智芯對鈦媒體App表示,未來,DPU產品形態還需要多樣化,DPU產品形態的多樣效能夠更好的滿足不同的雲端計算場景的需求,而降低DPU使用過程中的技術門檻,很大程度決定DPU產品在面向廣泛市場時的普及率及滲透率。

目前DPU還沒有跳出雲端計算場景之外,DPU廠商需要充分消化先進公有云廠商DPU類產品研發使用經驗,深刻理解DPU的在雲端計算場景中的使用價值,才能更好明確DPU的產品定義及研發方向。

DPU更大的難題或在行業生態方面,英特爾和英偉達建立起了廣泛的晶片產業生態,DPU目前還處於產業發展早期,何時脫離雲端計算場景之外,圍繞DPU形成相對完善的生態,才算是建立了一個DPU晶片行業。

(本文首發鈦媒體APP 作者 | 張帥,編輯 | 蓋虹達)