飛槳圖神經網路PGL助力國民級音樂App,創新迭代千億級推薦系統

語言: CN / TW / HK

每當夜深人靜時,你開啟網易雲音樂,或聽歌刷樂評,或看直播閒聊,享受著以心交心的放鬆愉悅。在這背後,有一群技術人員苦思冥想地探索著,只為讓“雲村”越來越懂你。

“不同於一般的聊天文字或圖片,音樂本身是跨域資料,具備若干特徵,資料維度非常多。而1.8億月活海量使用者的音樂相關資料,帶來的計算量、推薦量、引數規模都巨大無比。”網易雲音樂機器學習平臺技術團隊意識到,在這樣複雜問題面前,傳統機器學習方法漸漸無力招架。

此外,雲音樂的直播業務興起,商業化表現良好,團隊的擔子更重了,“直播行為與音樂行為差異甚大,這意味著計算量與難度進一步增加。”壓力之下,該團隊將目光瞄向“圖神經網路”,並最終選擇應用百度飛槳PGL圖神經網路技術來迭代升級雲音樂的推薦系統。

a2e3e0f436b0393a590923a2d9163c6d.png

推薦系統為何

    需要圖神經網路?

作為全球知名音樂社群,網易雲音樂在繁榮發展的同時,其推薦系統面臨三大難題:囊括音樂、歌單、Mlog、直播、雲圈、動態等的多域資料;海量使用者產出的超大規模資料;超30萬音樂人釋出歌曲,超28億使用者產生歌單,27%使用者交流/生產內容構成的動態資料標籤。

傳統的機器學習方法需要嚴格制定一套規範來提取樣本,逐項指定樣本的各個特徵。但云音樂使用者產生的多域資料,可能會有若干個特徵,加上近2億的使用者規模以及高頻率的動態更新,必須進行巨量的計算,機器學習方法的訓練效率因此大受限制,變得十分低效。

而圖神經網路技術的約束性較小,把每個使用者當做點,使用者的標籤作為邊,不同使用者之間基於點和邊的關聯形成網,在此基礎上建模分析,因此能更高效地表徵、篩選某一類使用者。比如,當兩位素不相識的寶媽,同樣愛聽某些親子歌曲時,她們在“圖”中就有可觸達的連線,模型會根據這些連線關係學習出合適的表徵,並把這些親子歌曲推薦給相似的使用者群體。

事實上,圖神經網路已經成為目前網際網路企業高效表徵使用者與內容結構的關鍵技術。既能基於使用者在歌曲、歌單、動態、Mlog等各方面的跨域行為聯合建模;又能支援多種行為子圖,如深挖使用者在歌曲方面的播放、點贊行為;並支援載入使用者節點的畫像特徵與內容節點的型別特徵;還支援靈活擴充套件,如適用音樂業務場景的圖神經網路應用能很方便地遷移改造用來支援直播業務場景。

飛槳PGL圖神經網路的

三大領先能力

市面上提供圖神經網路技術的廠商不少,說起選擇百度飛槳PGL的原因,網易雲音樂機器學習平臺技術團隊總結了三點:飛槳PGL支援超大規模資料的全圖儲存、子圖檢索、高效圖學習三大領先能力。

團隊曾經嘗試過多家國內外頂級廠商的圖神經網路技術,其中兩家國際大廠的產品沒有現成的分散式程式設計正規化,無法高效地處理超大規模圖模型訓練當中遇到的圖儲存、分散式訓練等問題,在單機層面頂多支援到千萬級別或億級別,而到了百億甚至千億級別,只有飛槳PGL挺住了。

a04b19b1ad16153c3cfe440cdb962a23.png

據介紹,雲音樂的資料規模非常龐大,資料關係即使經過裁剪也高達千億級別以上。而飛槳PGL技術,原生支援分散式圖儲存和分散式取樣,可將圖的特徵儲存在不同的Server上,也支援將不同子圖的取樣分散式處理,並基於PaddlePaddle Fleet API來完成分散式訓練,實現在分散式的“瘦計算節點”上加速計算,因而能夠為雲音樂處理高達百億級別的大規模資料。

不僅如此,飛槳PGL實現了極低成本的大規模圖儲存,這讓網易雲音樂技術團隊非常認可。“飛槳PGL的分散式圖儲存方案比較靈活,適合雲音樂,能快速搭起若干個分散式網路,無需專業資料庫儲存底層能力,儲存成本降低70%+。”在4億節點與400億邊資料這樣的場景下,飛槳PGL的分散式圖引擎資源,以60彈性節點(4CPU,16GB)的配置,可提供比中心化資料庫更簡單、更靈活的儲存服務。

再者,他們團隊還體驗到飛槳PGL的另一個優點,即靈活的子圖檢索模式飛槳PGL不僅預置常用模式,同時聯動分散式圖儲存引擎,支援自定義子圖檢索模式,更符合業務實際需求,使用起來更順手更高效。

飛槳PGL給網易雲音樂技術團隊印象最深的一次是,用不到30多臺閒置老舊CPU機器在1天內訓練完100個epoch數百億邊的LightGCN模型。這在業內人士聽來可能會有些不可思議。“要是換成過去那種單機方案很難實現,因為記憶體早已爆掉了,無法儲存這麼巨大的圖。”團隊成員介紹道,也許還有其他方案能實現,但飛槳PGL的方案,價效比極高,適合大規模應用。雲音樂的推薦系統採用飛槳PGL技術後,在冷門歌曲分發、雲村廣場、陌生人一起聽等多個細分業務場景的效率都有不同程度的顯著提升,最高甚至提升了近一倍。

可以說,飛槳PGL所提供的支援超大規模資料的極低成本全圖儲存、靈活子圖檢索、高效圖學習等能力,在雲音樂的工業實踐中真正用下來,發現都是能夠滿足實際需要的。這正是飛槳平臺源於產業實踐,更適合產業應用的最好證明。

飛槳PGL圖神經網路

開啟應用新空間

基於超大規模複雜資料的使用者與內容理解是許多網際網路內容企業所面臨的共同課題。而飛槳PGL圖神經網路技術在網易雲音樂的成功落地,佐證了自身作為企業可用的高性價比超大規模圖神經網路方案的強大實力,將助力這些企業高效、低成本地表徵用戶與內容,建立完善精準推薦機制,做使用者的“知心人”,進而催生新形態新模式,從中獲取商業收益。

接下來網易雲音樂機器學習技術團隊還將立足雲音樂的實踐,探索圖神經網路技術與AI的深度融合創新,如構建音樂社群的使用者和內容理解中臺,以及基於知識圖譜的圖神經網路落地應用;並計劃與飛槳一起反哺開源社群,助推圖神經網路技術在產業界廣泛落地。

0564d9064654c527ec5896b105d908cd.gif

關注公眾號,獲取更多技術內容~

本文同步分享在 部落格“飛槳PaddlePaddle”(CSDN)。
如有侵權,請聯絡 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。