大規模即時雲渲染技術,追求體驗與成本的最佳均衡
現實世界對映其中,傳統文化沉浸其境,舊時記憶互動其間。
仲升|技術作者
IMMENSE|內容編輯
在剛剛過溫的春節,雲之上,帶來了一場「數字文化」新體驗。
遊花車、舞獅子、踩高蹺、放煙花、寫福字……還記得兒時的春節習俗嗎?如今這些習俗被“畫素級”復刻進了“央博宇宙”裡。今年大年三十,由中央廣播電視總檯“央博”數字文化藝術博物館(簡稱“央博”數字平臺)打造的全球首個元宇宙廟會——“央博新春雲廟會”正式上線,為廣大網友呈現了一場打破時空界限的新春雲廟會,還原兒時的春節記憶。
一場由黑科技連結、創造的數字之旅,是在央視春晚上演的跨時空新春“雲廟會”。現實世界對映其中,傳統文化沉浸其境,舊時記憶互動其間,高復刻、零時差的全然沉浸背後,必然有一股強大的雲力支撐,這便是阿里雲“大規模即時雲渲染技術”。
01 技術核心:輕量化、沉浸式、低成本
“大規模即時雲渲染技術”是指,將大型3D沉浸式體驗需要的圖形算力、儲存需求部署在雲端,並通過實時音視訊通訊(串流)技術,使得玩家以極低的延時接收到實時渲染的畫面,實現沉浸式互動。
其中,串流技術通過把使用者終端裝置上實時渲染畫面的過程轉化為視訊流,並以高穩定、低時延的流媒體傳輸至玩家終端,讓玩家擺脫本地硬體限制,是實現終端輕量化、沉浸式、低成本互動體驗的關鍵因子。
02 60毫秒:互動延時“天花板”
《2023中央廣播電視總檯春節聯歡晚會》21:27口播推介了“央博新春雲廟會”的相關內容,全國並機頻道總收視人次3.16億次,口播後短短几分鐘內,就有近百萬使用者湧入“央博”體驗,系統出現明顯的流量尖峰。
視訊連結:https://v.youku.com/v_show/id_XNTk0Mzk3NTczMg==.html
面對網路流量洪峰,首要解決的是“零時差”的互動體驗。
對此,直接的辦法是增加網路的頻寬,加之從成本、運營、維護的角度考慮,這對雲端計算的GPU彈性算力也提出了更高的要求。究竟如何才能克服玩家在體驗過程中的時延、網路抖動等問題,實現萬人線上 “零時差”互動?
最有效的解決方案就是應用一個“有保證”的策略對網路流量進行管理,即QoS(Quality of Service,服務質量)。對此,阿里雲視訊雲技術團隊在排程保障、延遲優化和卡頓優化這三大維度著力。
QoS保障中最基礎的能力就是排程能力,為使用者選擇一個合適的節點來保證使用者的最優網路接入,使得該使用者的接入時延最低、網路抖動最小,從而獲得最佳的雲渲染推流體驗。技術團隊實現了基於運營商和地理位置的傳統排程、實時測速、歷史排程資訊這三大維度的融合演算法,保證玩家的最優網路接入。
在延遲優化上,技術團隊對全鏈路各個階段的時延消耗做了拆解,並對每個環節做了針對性優化,通過密集布點並優化排程策略、編解碼策略、媒體傳輸策略和指令通訊策略,最終將整體時延優化到60毫秒以內,真正實現雲渲染和本地渲染在體驗上的一致性。
在卡頓治理上,技術團隊重點優化了頻寬估計演算法和平滑傳送策略。其中,頻寬估計演算法以BBR為藍本並做了針對性優化,快速、準確地估算出當前鏈路的頻寬並反饋給編碼器,以便編碼器位元速率匹配實時的頻寬。基於此演算法,網路不會因資料過多導致擁塞,也不會因資料過少產生頻寬浪費。
在現實情況中,如果資料傳送太快會對網路產生衝擊,反之則會增加時延,針對這一問題,技術團隊基於對實時網路狀態的精準把握來動態調整平滑傳送策略,併為音訊、視訊、重傳包、冗餘包等資料設定不同的優先順序,確保最重要的資料優先被髮送,從而實現低時延下的卡頓優化。
畫質的清晰與否,是玩家在互動體驗中最能直觀感受的。同時,畫質提升和演算法耗時的關係如同天平兩端,為了保障使用者體驗需要在兩者之間平衡。由於GPU渲染能力的差異,會存在如鋸齒、渲染空洞、噪聲等畫質問題,在解決延時的基本體驗問題後,阿里雲視訊雲技術團隊利用窄帶高清技術提升畫面清晰度。通過雲端GPU與客戶端CPU的聯動,採用自研演算法進行內容自適應的紋理與色彩增強處理。該演算法效能十分優越,在A10上處理1080p影象的單幀耗時小於1毫秒,對全鏈路延時的增加可以達到被忽略的程度。
由於“央博新春雲廟會”從立項到上線的時間只有50多天時間,為此技術團隊採用H5 SDK實現串流接入,解決了主流瀏覽器在PC和手機上的相容性問題。因此,只要有網路覆蓋,玩家在任何時間、任何地點都可以體驗。跨終端無縫切換,玩家可以在不同的裝置上隨意切換,而渲染程序不會產生中斷。
03 雲渲染的商業成本突破
體驗之上,運營成本高成為雲渲染商業化所面臨的突出挑戰。
如何最大程度利用雲上渲染資源?阿里雲視訊雲技術團隊在GPU虛擬機器Windows作業系統之上,增加了虛擬外設驅動層實現在一臺虛擬機器上部署多個渲染應用的能力,使用者通過不同的虛擬外設(音響、顯示器、麥克風、攝像頭、鍵盤、滑鼠、手柄、觸屏)訪問同一臺虛擬機器而不會相互干擾,該技術能有效提高單機資源利用率,一張卡上同時執行多個渲染程序,為雲渲染的大規模商業化落地奠定了基礎。
同時,降低運營成本的另一個手段是降低“頻寬”成本。
阿里雲自研的“窄帶高清”演算法便能實現同等畫質下更省流、在同等頻寬下更高清的觀看體驗。傳統視訊壓縮方法主要基於資訊理論,從預測結構的角度來減小時域冗餘、空間冗餘、統計冗餘,但視覺冗餘挖掘不足。
“窄帶高清”演算法中的JND(Just Noticeable Difference)和AQ(Adaptive Quantization)正是基於這個思路對視覺冗餘進行挖掘,經過空域和時域的特徵計算,將影象上存在視覺冗餘的部分傳到編碼器,再由基於MOS的自適應碼控演算法對QP做自適應的分配,最終達到位元速率節省30%以上,但主觀體驗相同的效果,實現質量、位元速率和成本的最優均衡。
(左:不開啟JND/AQ,位元速率8858kb/s;右:開啟JND/AQ,位元速率6027kb/s)
這已不是雲渲染技術在數字虛擬空間的第一次嘗試了。
去年6月,央視就與阿里雲合作推出了國內首個大型沉浸式雲考古節目《三星堆奇幻之旅》,基於大規模即時雲渲染算力復刻了3000年前的人類文明,讓三星堆“活過來”。這一切有賴於雲端計算提供的高效能、高可靠、且近乎無限的算力支援。
未來,雲渲染技術會與現有音視訊技術做深度結合,創造出更多前所未有的新形態、新玩法、新產品,而阿里雲也將與“央博”探索更多突破空間限制的數字文化藝術形式,用數字技術力助力傳承中華文明。
- 借AI之勢,打破創意與想象的邊界
- 協同儲存,為邊緣計算創造更大價值
- 基於應用理解的協議棧優化
- 一文深度解讀音視訊行業技術發展歷程
- 大規模即時雲渲染技術,追求體驗與成本的最佳均衡
- 雲端智創 | 批量化生產,如何利用Timeline快速合成短視訊?
- 課程回顧|以智慧之力,加速媒體生產全自動程序
- 課程回顧|一鍵式全智慧生產製作,設計有生命力的剪輯流程
- 下一代編解碼技術Ali266在視訊超高清領域的應用展望
- 將渲染計算搬到雲端,開啟低成本、強互動、沉浸式體驗
- 基於人眼視覺模型,實現位元速率、質量、成本的最優均衡
- 軟硬協同:基於倚天的視訊雲編碼效能升級
- 阿里雲基於邊緣雲業務場景的“前端智慧化”實踐
- 基於雲原生技術打造全球融合通訊閘道器
- 基於雲原生技術打造全球融合通訊閘道器
- 從阿里雲全球實時傳輸網路GRTN出發,淺談QOE優化實踐
- 連續4年,阿里雲視訊雲穩居中國整體市場份額第一
- 從技術全景到場景實戰,透析「窄帶高清」的演進突破
- 如何打造 iOS 短視訊的極致絲滑體驗,阿里工程師用了這些方案
- 從雲原生到智慧化,深度解讀行業首個「視訊直播技術最佳實踐圖譜」