互聯網巨頭都盯上了這顆芯片

語言: CN / TW / HK

過去幾年來,在需求的推動下,互聯網造芯早已家喻户曉。尤其是過去幾年雲計算、數據中心和人工智能的火熱,全球領先的互聯網企業似乎都殊途同歸,走向了AI芯片、CPU和DPU等芯片的自研道路。與此同時,他們還會根據各自業務的不同,針對性地打造了不同的芯片矩陣。

在我們還對互聯網造芯近年發展之快感到驚歎之餘,諸如谷歌、Meta、字節跳動和騰訊等互聯網公司又都無一例外地盯上了一款芯片:那就是視頻處理芯片VPU(Video Processing Unit)。

谷歌、騰訊、字節和Facebook

均已着手自研

2021年4月,谷歌發佈了自研的Argos VCU(VCU是谷歌的稱法)。Argos有10個用於處理視頻的內核,這些內核放置在一個相當大的散熱器下,每塊板上放置兩個芯片。谷歌聲稱它可以將計算效率提高20到33倍,以往處理4K視頻要幾天,現在只需數小時就行。Argos的研發成功替代了多達數千萬顆英特爾CPU,僅CPU就節省超過200億人民幣的資金投入規模。在構建這個芯片的過程中,谷歌甚至創造了他們自己的EDA工具,叫做Taffel。

谷歌Argos VCU

我們正在進入一個音視頻蓬勃發展時代,表現為視頻用户數激增、視頻產生量巨大,視頻越來越難以被壓縮和處理。從2003年發展至今,有許多不同的視頻標準和編解碼器(如下圖所示),如果編解碼器在壓縮視頻時的效率越高,那麼最終的文件尺寸更小,流更小。

圖源:谷歌在Hot Chips 33 上的演講內容

谷歌的Argos芯片能助力其使用VP9的視頻編碼器,相比前一代H.264,其視頻壓縮效率提高了40%。VP9是一種更復雜的視頻編解碼器,它允許視頻文件變得更小並保持相同的圖片質量,它還可以存儲相同大小但質量更高的視頻。VP9允許Google節省大量帶寬,這些帶寬通過他們的內容交付網絡從數據中心流出給消費者,這反過來又大大降低了他們的成本。AV1是更高級別的視頻編碼方式,將比VP9再提高30%-40%。更高級別的壓縮通常需要更多的計算。

根據SemiAnalysis的消息來源,下一代Argos已經在開發中。它將能夠實現在CPU或GPU 上難以支持的 AV1 格式,將實現進一步的存儲和帶寬節省。此外,他們還計劃開始在新芯片上添加機器學習推理硬件。最後,他們還將在附加卡本身上添加網絡,以提高效率並減少與主機 CPU 的通信。這將允許他們自動生成視頻字幕,檢查是否違反服務條款,甚至允許在 YouTube 和 Google 照片上啟用視頻搜索。

今年6月份,騰訊雲發表了《騰訊的芯事》,從中我們瞭解到,騰訊自研的視頻轉碼芯片—— “滄海” ,已於2022年3月5日流片回來,並點亮。這是騰訊的第三款芯片,也是完全自主研發的第一款芯片。騰訊的滄海小分隊的目標就是要做一款業界最強的視頻轉碼芯片,把壓縮率發揮到極致。滄海芯片採用12nm工藝,實現了以更小的數據量、更小的帶寬提供相同質量的視頻,壓縮率相比行業最佳表現提高了30%以上。

騰訊滄海點亮

字節跳動造芯近來再次掀起一波關注高潮。據瞭解,字節跳動從三年前開始做視頻編解碼硬件研發,去年下半年開始組建SoC團隊,年初FPGA上線。7月20日,字節跳動副總裁楊震原在“2022火山引擎原動力大會”上接受媒體採訪時確認,字節跳動正在開展自研芯片,主要用於自身視頻推薦業務。研發團隊將為字節跳動大規模視頻推薦服務專用場景定製硬件優化,如視頻編解碼、雲端推理加速等,以期提升性能,降低成本。

除了字節以外,另一個國內視頻巨頭快手也在相關視頻芯片產品上有佈局。據筆者瞭解,他們的相關芯片已經會片,或許應該能看到更多的信息披露。

此外,Facebook母公司Meta也正在尋求“控制關鍵技術並減少對現有芯片供應商的依賴”。據悉,其也正在開發定製服務器芯片,其中一款AI推理芯片主要用於推薦算法等;另一款則主要進行視頻轉碼任務,以提高Facebook用户觀看錄製和直播視頻的質量。而且Facebook還聘請了一位來自英特爾的資深網絡芯片工程師Jon Dama來領導這家互聯網巨頭的基礎設施硬件工程組的芯片設計工作。

CPU和GPU不再經濟,

VPU或將大放異彩

當下,隨着互聯網內容的不斷更新迭代,視頻流媒體已開始取代文字、圖片等形式,直播、點播、短視頻等視頻應用正在“侵蝕”每個年齡階段的人,視頻流媒體約攻佔互聯網80%的流量,如國外的Youtube,國內的抖音、快手等短視頻。網絡已經在內容上走向去中心化的路線,用户每分鐘向Youtube上傳超過700小時的YouTube視頻,抖音、快手以及騰訊微視頻等亦是如此。消費者更多的是將時間花在了用户生成的內容上。

在這個過程中要做的工作越來越複雜,視頻的分辨率、質量和帶寬消耗等直接決定了用户的粘性。抖音這幾年來是短視頻領域的贏家之一,很大一個原因在於其能對每個人進行定製化的推送,背後有着強大的推薦機制。用户對超高清視頻(4K/8K)的追求越來越高,但也帶來了更高的編解碼算力需求和CDN帶寬成本。

多年來,英特爾的CPU+軟件的視頻解碼/編碼方案一直主導着流媒體市場,但是隨着視頻流媒體對高質量視頻的需求不斷增長,CPU將不再具有經濟價值,而且會消耗太多的能耗和空間。GPU雖然有稍微更好的TCO(總擁有成本),但缺點是較低的利用率和較低的工作負載靈活性。使用GPU對於某些應用程序來説,運行驅動程序棧是一件複雜而混亂的事情,各種版本的Linux或Windows都不能正常工作,這類軟件問題阻礙了英特爾、英偉達等GPU方案的發展,比如英特爾被取消的Xe HP tile GPU架構。英特爾的Xe-HP計算GPU是該公司多年來啟動的第一款高性能獨立GPU,也是英特爾向公眾展示的第一款獨立Xe GPU。

英特爾的Xe-HP計算GPU

顯然,CPU和GPU都已經不適合處理巨量的視頻業務,因此VPU這種專用的視頻處理芯片應運而生。在某種意義上,VPU比其他編碼方法更靈活。

圖源:Semianalysis

VPU是結合AI技術專門面向視頻場景優化設計的視頻加速器,內置視頻編碼加速專用功能模塊,具有高性能、低功耗、低延時等特性,能為視頻行業應用帶來高效能的加速計算。

圖源:Semianalysis

一般來説,ASIC需要在它們的目標工作負載中提供高一個數量級的更好的能力才能被行業認可。而據SemiAnalysis對國產VPU芯片初創企業鎔銘微電子(NETINT)的分析,相比於CPU和GPU,VPU的密度和功耗是CPU和GPU無法比擬的。下圖是使用HEVC編解碼器,鎔銘微電子的VPU碾壓英偉達的上一代T4(有更新的基於安培GPU)和英特爾的Skylake/Cascade Lake服務器。其設計的Codensity系列VPU芯片已經在中國超過90%的一線互聯網和視頻內容客户中得到大規模部署,並在大量海外客户如微軟、IBM等企業中得到了廣泛應用,他們還面向全球推出世界第一款支持AV1編碼能力的芯片級解決方案。

鎔銘微電子VPU產品

(圖源:鎔銘微電子)

另外,據相關報道,一家名為湧現科技的公司在這方面也有佈局。該公司表示提供的Seirios視頻編解碼加速解決方案,核心的ASIC視頻編解碼芯片是由湧現科技研發團隊自主研發的先進製程芯片,通過將其安裝在執行編碼和轉碼的視頻處理服務器上,可以在不改變服務器配置的情況下提升處理性能。減輕數據中心服務器的多媒體處理負擔,降低整體功耗和成本。

從谷歌自研VPU所獲得的好處,我們也可以看出 為何互聯網廠商紛紛發力VPU這顆芯片:一方面,互聯網是最講求TCO(總擁有成本)的地方,使用VPU將大大減少對CPU的使用量;另一方面,能夠根據自己的需求,打造更低的功耗和更快的芯片,這也將加強他們的戰略優勢。 還有一個有利條件是,他們這些互聯網廠商都有自己的視頻產品,豐富的多媒體應用場景,以及雲覆蓋的眾多直播互動頭部客户,將為他們的研發提供得天獨厚的分析和驗證條件。再者,互聯網巨頭對這個賽道的看好,足以見得VPU這個市場的廣闊前景。

寫在最後

由於VPU芯片是一個對場景處理技術要求很高的產品,所以目前主攻ASIC VPU的芯片供應商中似乎並不多。整體而言,目前只有少數幾家廠商真正做到了大規模實際應用,互聯網廠商自研的產品到真正可落地實際應用還有2-3年的時間。

中國的各類視頻應用已然走在時代前列,同時還有龐大的用户羣體,不止如此,VPU的市場應用場景非常多,隨着5G、移動端視頻、雲遊戲、雲桌面、VR/AR、元宇宙等行業的高速擴張,市場對專用視頻處理芯片的需求呈現爆發式增長,專用於視頻處理的ASIC芯片或將迎來長週期的藍海市場。

有研究分析, 預計在未來幾年內,VPU市場規模可能將達千億美金。 從CPU到GPU,再到DPU,而現在一個屬於VPU的時代似乎正在悄然而來,目測未來這個市場應該會扎入更多玩家。

本文參考資料:

http://semianalysis.com/meet-netint-the-startup-selling-to-datacenter-vpus-to-bytedance-baidu-tencent-alibaba-and-more/

*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支持,如果有任何異議,歡迎聯繫半導體行業觀察。

今天是《半導體行業觀察》為您分享的第3125內容,歡迎關注。

推薦閲讀

芯片巨頭的又一次豪賭

被“困住”的芯片擴產計劃

台積電3nm計劃,有變?

半導體行業觀察

半導體第一垂直媒體

實時 專業 原創 深度

識別二維碼 ,回覆下方關鍵詞,閲讀更多

晶圓|集成電路|設備 |汽車芯片|存儲|台積電|AI|封裝

回覆 投稿 ,看《如何成為“半導體行業觀察”的一員 》

回覆 搜索 ,還能輕鬆找到其他你感興趣的文章!