圖技術在美團外賣下的場景化應用及探索

語言: CN / TW / HK

在外賣廣告CTR預估建模中,我們依託圖技術在場景化上進行了一系列探索。本文首先介紹了使用圖網絡技術的出發點,然後從特徵層面的抽象圖關係到子圖擴展以及場景感知子圖,逐步介紹如何使用圖技術建模業務問題,並針對聯合訓練的線上服務細節及效果進行解釋和分析,希望能給從事相關工作的同學帶來一些幫助或啟發。

1. 引言

外賣已經成為大眾生活中非常的重要組成部分,大家也逐步感受到外賣帶來的便利。大數據和深度學習時代的到來,使點擊率(Click Through Rate, CTR)/轉化率(Conversion Rate, CVR)預估技術得到了長足的發展,深度學習技術已經成為業界的主流方法。美團外賣也通過應用深度模型,在線上取得了顯著的收益。預估模型所做的事情,是建模藴藏在數據中、在特定場景下用户和商品之間的關聯性(即“人-貨-場”)。以點擊率預估為例,可以對畫像特徵、上下文特徵、行為特徵等進行建模,模型能夠感知在該場景下用户和商品之間的關聯。

美團外賣是一個場景化業務:用户當前決策是受不同場景因素共同影響的結果,這些場景因素包括但不限於LBS地理位置、商家營業情況、時間餐段。比如在繁華商圈/小城市(LBS)下的工作日/非工作日/正餐/下午茶(時間餐段),根據商家營業情況圈選商家。相比於傳統電商業務來説,增加了LBS和時段的限制,其場景化因素更為豐富。同時,外賣具有很強的即時需求性質,用户的決策鏈路會很短,長時間“逛”外賣App的情況較少,故單次用户決策具備短時性的特點,這也進一步對外賣場景化增加了更多的建模因素。 因此,如何將用户的外賣需求進行場景化建模,從而提升用户在使用外賣時的下單體驗,成為外賣預估模型需要重點解決的問題。

1.1 問題與挑戰

相較於傳統電子商務,用户興趣在外賣業務下呈現出更加明顯的場景化特點,具備【用户-場景-興趣-決策】鏈路:即用户在特定場景下,結合自身需求與個人飲食興趣,產生決策。

圖1 場景化用户行為決策示例

場景化建模在本質上,是在給定場景條件下,比如地理位置、餐段時間、天氣等,基於用户興趣為用户匹配出最佳商品。圍繞場景化建模這一目標,業界從不同角度進行了一系列技術探索:

  • 特徵建模:構造用户-商品-場景交互的統計特徵/交叉特徵,例如:用户在午餐時段的品類偏好、用户夜宵時段點擊商户數量統計等。
  • 序列建模:分場景行為序列,精細化刻畫在不同場景下的用户興趣,例如:用户在不同蜂窩下的Session行為,在不同時間段的Session行為。

以上建模方法能夠建模場景因素在用户決策商品時的影響,但存在一些問題:

  • 特徵建模,尤其是特徵交叉的過程中,容易引入噪聲,會對模型學習產生負面影響。
  • 序列建模,依賴於用户行為的豐富程度,在分場景行為劃分下對低頻用户的興趣刻畫不友好,同時高頻用户的興趣刻畫容易陷入個人興趣封閉圈。
  • 交叉和序列範式對場景的刻畫並不完整,交叉範式存在維度上限,序列範式侷限於用户已有行為偏好。

因此,場景化建模存在以下挑戰:

  • 如何抽取有效場景特徵交叉。
  • 如何打破序列建模下的興趣封閉性。
  • 如何完整地對用户決策場景進行有效刻畫。

針對上述問題特點,經過逐層分解,我們發現需要一種更加完整、高效的信息表達方式,能夠具備:關係預測能力、全局信息傳播能力、高階表達能力,而我們在圖技術的領域中找到相應的解決方案,後文會針對這些問題和圖技術的解法依次進行展開,希望這些思考和實踐經驗能對大家有所幫助或者啟發。

1.2 圖技術介紹

近些年來,隨着圖神經網絡(Graph Neural Networks)的快速發展[1],越來越多的人開始關注起圖數據。工業界也出現了圖技術的相繼落地,很多應用場景都可以抽象為節點向量化表示、分類、聚類、鏈接預測等圖任務形式。

  • 對於召回場景來説,基於多種實體間天然存在的關聯交互圖,構建深度匹配模型學習到的Embedding表達可以直接用來度量用户-商品的偏好、商品-商品關聯。
  • 對於預估模型來説,最樸素的視角,即是在用户-商品這個二部圖上進行鏈接預測。

在美團內部業務中,Graph Embedding/GNN技術在多個技術團隊落地;如美團平台[2],[4],[10]相關工作以及外賣技術Represent-Learning項目等,都取得了不錯的正向收益。 相比傳統歐式空間結構類型數據,圖結構數據具有以下特點:

  • 結構化:圖網絡具備拓撲結構性,這種結構化特性往往代表了一些規律。例如節點重要性,社區結構等。
  • 關聯化:圖網絡提供了一種複雜關係和交互的度量方法。例如關聯關係、依賴關係可以通過圖表徵學習進行度量。
  • 全局化:圖網絡構建採用全域數據,相比私域化的序列數據,圖結構數據更加能夠體現出羣體偏好信息。
  • 強泛化:利用圖網絡的消息傳播機制,圖上節點豐富信息更容易傳播到冷門節點上,提高冷門節點表達能力。

從業界信息表示的發展趨勢來看,信息表示是在升維的:從手工特徵,到序列建模,再到圖建模,背後是對更加完整信息的有效刻畫的訴求。

  • 手動特徵時代:基於行為日誌統計挖掘用户/商家/商品畫像。缺點是刻畫粒度較粗、不精準、表達能力有限。
  • Neural Network(NN)序列模型時代:基於原始行為序列設計用户興趣提取模塊端到端學習用户興趣。優點是一定程度從多峯和動態演變方面提升了用户興趣表達的準確性。缺點是較難學習到結構化信息,對於行為數據強依賴,頭部用户行為密集,中長尾用户行為稀疏。
  • Graph Neural Network(GNN)時代:萬物皆圖。序列可以看做是一個子圖,相比於序列,圖結構數據對於信息的表達,更加結構化、完整、豐富。

在日常業務優化中我們也發現,如果説要找到一種形式化的建模語言能夠準確、完整的翻譯出我們的業務場景,那麼呈現出來的建模語言就是“圖”。

圖2 信息表示的發展歷程

因此,我們期待通過圖技術手段,實現外賣場景下的場景建模。以下我們將從圖算法探索和具體工程實踐落地兩大方面,闡述我們在圖技術場景建模上的嘗試及經驗。

2. 圖技術的場景化探索

外賣場景化是指基於用户-商家/商品完整交互信息()中挖掘到的共性Pattern。我們通過構建用户-商家/商品交互場景圖來刻畫和提取這個Pattern,並將場景先驗知識引入到預估模型當中輔助決策。業界已經有前沿探索將GNN應用於LBS場景建模,如美團平台的STGCN[2]從時空結合的角度描述了LBS場景下GNN應用,外賣數據組的“門控超圖GNN”[3]描述了超圖在外賣LBS場景化建模的應用;對比普通GNN方法都取得了SOTA的效果。

針對美團外賣的場景化建模特點,我們在圖算法上也進行了一系列探索,分別在場景特徵交叉、子圖拓展感知、元路徑場景圖三個方面,圍繞着在不同場景下的用户-POI建模的目標,進行了多方面的探索,在離線評估、線上業務上均取得了不錯的效果。

2.1 基於特徵圖的場景特徵交叉建模

2.1.1 場景特徵交叉

特徵是機器學習模型的源動力,業界常言“特徵的上限決定了模型的上限”。NN時代以前,模型效果的提升有很大一部分來自於特徵工程。隨着模型進入NN時代,NN模型具備的擬合能力以及在數據紅利的加持下,極大地減少了算法工程師們在特徵工程上的精力開銷,工作重點開始聚焦於模型結構。雖然理論上NN可以擬合一切函數,但在有限的數據和訓練週期內,無法快速地逼近效果上限。在這種背景下,顯式特徵交叉重新得到大家的關注,圍繞自動交叉特徵,業界陸續迭代出FM/xDeepFM/DCN/CAN等模型,並取得了非常好的效果。

在美團外賣場景,也經歷了第一階段的手動交叉特徵,以及第二階段的自動交叉特徵。但在場景化建模中我們發現:交叉特徵帶來了信息增益,但往往也會帶來“噪聲”問題;比如具體到樣本粒度來説,不同類型的樣本所需要的有效交叉特徵並不是完全一致,存在差異性。近兩年業界的一些工作,如Fi-GNN、L0-SIGN、阿里FIVES等,也都在對應的業務中發現全量信息交叉引入噪聲問題。

因此,從迭代思路來看,希望能夠引入更多的交叉特徵,同時也減少噪聲信息的引入,實現在樣本粒度的“個性化”交叉特徵。

2.1.2 圖視角的特徵交叉

特徵交叉,可以抽象為“從全量特徵集中,選擇出K組特徵兩兩組合,實現給模型帶來高效非線性表達能力的目的”。本質上可以看做是特徵-特徵之間二部圖的關係預測:將特徵看作節點,特徵之間的關聯關係看作邊,則可以將所有特徵之間的關聯關係構成一張圖網絡。兩個節點連邊的權重,可看作對應特徵之間交叉關係的強弱。通過將此關係圖嵌入到模型訓練過程中,關係圖中不同邊權即反映了不同特徵交叉的重要程度。

每個樣本中N個特徵互相之間構成一個全連通圖記為M,圖中的每個頂點表示特徵F,頂點之間的邊表示任意兩個特徵Fi和Fj的關聯度,記為M。通過聯合訓練關係圖和預估模型,更新參數矩陣M,使關係圖的語義信息與預估模型保持相關性和一致性,主要過程如下圖3所示:

圖3 特徵交叉圖建模過程

主要步驟可描述如下:

  • Step1. 建立參數矩陣(隨機初始化得到),對特徵所對應的向量表示做點積,結果作為關聯繫數。
  • Step2. 對矩陣施加L0懲罰,用於限制矩陣M的參數儘量接近0,減少無用的場景交叉。
  • Step3. 參數矩陣0,1化,用於確定需要參與聚合的節點。
  • Step4. 圖聚合,對於每個特徵來説,與其存在交互的多個特徵進行聚合操作,聚合方式使用Attention。
  • Step5. 將聚合後的特徵向量表示,做為該特徵新的向量表示,用在下游CTR預估的聯合訓練中。

通過特徵交叉係數抽象為圖的邊權重要性評估問題,使模型具備了對場景特徵之間關聯強弱的預測能力,從而能夠更加高效地引入交叉特徵,為用户的場景化建模提供更多的信息輸入。

2.2 基於子圖擴展的行為圖建模

2.2.1 場景序列建模的痛點和圖解決思路

在外賣算法模型迭代中,序列建模也經歷了較長時間的迭代,從單場景短期Session建模到多場景用户長期行為興趣建模,在多個方向上都做出了詳盡的探索。序列建模能夠在用户歷史行為中,充分發掘用户的興趣偏好,但是由於用户行為序列本身是“有偏採樣”的反饋:不同用户所處的地理位置、商家供給情況、使用頻次等方面存在着較大差異;且高低頻用户的點擊行為分佈差異明顯,呈現出高頻用户行為豐富聚集、低頻用户行為稀疏的特點。

對於高頻用户,可能會導致興趣圈封閉導致模型建模無法跳脱既有的興趣圈;對於低頻用户,由於信息的缺乏導致其興趣刻畫不完整。因此,我們需要具備拓展用户興趣邊界的信息擴展能力、對單點信息的擴充能力;即尋找一種新的數據結構,打破二維線性限制,實現三維立體擴展,基於此種想法,我們從圖的角度來重新思考用户行為建模:以私域線性行為序列作為興趣刻畫基礎,以公域全局互聯關係圖作為興趣補充,建立個體差異性與羣體共性的連接。

2.2.2 行為POI子圖設計

用户行為信息是指用户在平台的點擊/下單活動記錄,是最原始最直接的對於用户興趣的刻畫,尤其是針對行為稀疏用户來説,行為POI序列中任意節點都值得重視。但對於這部分用户,僅僅依靠個人行為POI很難建模興趣,如果能夠通過圖的方式擴展用户行為,能夠有機會跳脱個人私域行為限制,透過全局行為圖捕捉不同場景下的潛在興趣。

我們基於用户Session行為構建了POI網絡:在同一個Session裏,用户所點擊過的POI存在關聯,那麼可以將每個Session裏的POI構建一個連通圖;由於不同用户行為的POI是有重疊的,整個外賣場景下的不同POI簇之間通過這些重疊的POI鏈接,就可以形成一張POI網絡。對於任意一個POI,我們都可以從POI行為網絡中,尋找到該POI的一跳、二跳鄰居,這些鄰居可以作為POI信息的相關補充。這樣,對於用户的行為興趣刻畫,不僅僅侷限在用户已有的序列上,而是可以通過子圖進一步擴展。

相比傳統序列建模方法,圖網絡建模可以利用全局用户行為互聯的高階網絡結構,藉助POI序列擴展用户興趣:

  • 對於行為稀疏用户,通過全局行為互聯圖,補充用户興趣建模線索。
  • 緩解基於密集用户行為建模產生的馬太效應,跳出歷史行為探索潛在興趣,提升推薦結果泛化性。

具體的,針對用户行為序列中的每一個POI,都可以通過子圖進行擴展,擴展後的子圖通過卷積的方式形成POI的向量表示,如下圖(左)所示。通過行為序列的擴展,使用户行為得到補充,從而得以跳出用户個人興趣侷限,豐富用户和POI的信息表達。

圖4 子圖卷積擴展到感知卷積

在POI子圖的基礎上,我們進一步思考如何有效地聚合不同POI,達到子圖信息更加完整的表達。

  • 建模不同POI之間強弱不同的關聯關係,使用Attention結構動態分配確定POI在所屬子圖中的貢獻度。
  • 考慮到POI子圖是由Session構建的,用户的行為序列存在差異,相應地POI信息表達在不同用户序列中也存在差異,POI子圖信息應該在不同行為上下文序列中自適應表達。
  • 為了捕捉這種差異性,在子圖卷積的過程中,我們將中心節點與當前行為序列中其他節點做聚合,從而建模行為上下文場景關聯性。

中心節點不僅受到序列和子圖影響,也受到當前候選POI的影響。因此在聯合下游訓練的過程中,我們將中心節點與樣本Target POI進行聚合。

圖5 不同子圖聚合方式示例

$$ \begin{aligned} Atten_1 = atten(W_{11} ·Node_{i} || W_{12}· Node_{center}) \ Atten_2 = atten(W_{21} ·Node_{i} || W_{22}· Node_{avg}) \ Atten_3 = atten(W_{31} ·Node_{i} || W_{32}· Node_{target}) \ E_{i} = softmax(Atten_1 + Atten_2 + Atten_3) \end{aligned} $$

$Node_{center}$是當前子圖中心節點Embedding;$Node_{avg}$是行為序列節點Embedding平均;$Node_{target}$是樣本目標節點Embedding;Attention函數是兩層前饋神經網絡,激活函數為LeakyReLU。

離線訓練時,是基於用户行為序列,對序列中每個POI作興趣子圖拓展;而子圖生成時採用預採樣(Message Passing)+聯合訓練聚合的方式;通過以上三種聚合方式,得到屬於行為序列中POI對應的向量表示。由於這個過程不僅是擴展了POI,還將序列信息、候選POI信息考慮到了每個節點的表示中,我們稱這種為子圖感知卷積。通過子圖感知卷積,使卷積的過程中,POI的向量表示與上下文信息產生關聯,從而使POI的嵌入表示融合了更精確的興趣信息。

2.3 基於元路徑的場景圖建模

2.3.1 從業務特點出發-元路徑建模的初衷

我們對用户決策過程進行抽象,將用户User與商户POI在給定Context環境下的一次交互定義為一個事件(Event),多個用户和POI交互的結果定義為事件鏈(EventChain)。對於多個強相關的事件鏈(不同事件鏈通過公共節點連接),就構成了一個場景,而場景之間的User、POI主體又存在連接,這樣延展開,實際上就構成了一個“場景”拓撲網絡圖,如下圖所示:

圖6 事件與事件鏈抽象示例

可以看到,實際上事件鏈組成的“場景”是一種異構圖:比如具備某些屬性(消費頻率、餐飲偏好等)的用户U,在某個上下文C下(時間、地點等),點擊/購買了具備某些屬性(品類、主營菜品等)的商户P,這個決策過程實際上是個最簡單的U-C-P元路徑。事件鏈是在這個元路徑的基礎上繼續擴展,得到的更長的元路徑實例(U-C1-P2-C2-U')。通過事件鏈,可以建立起場景要素的關係鏈接,而對場景的完整刻畫,就是對場景要素表示和要素關係的抽取。

至此,我們將場景化建模,抽象為異構圖上元路徑建模問題。接下來,我們將介紹如何在這個場景圖上,實現對用户決策場景的建模。

2.3.2 到業務中去-元路徑建模的實現

元路徑UCPCU表達的語義為:不同用户在不同時空場景下,點了同一家商户,當然不同場景需求可以定義不同的元路徑。為了進一步融合元路徑中豐富的語義表達,僅僅依賴單一的元路徑的話,所表達的語義會受到限制。我們從用户U出發,通過該元路徑可以擴展出一系列的元路徑實例,這些實例刻畫了不同場景下,用户和POI的跨時空關聯。整個建模過程分為以下幾步:

  • Step1. 用户和商户節點存在較多屬性,相比節點拓撲結構包含更多語義信息。我們將屬性信息看作節點,通過GraphSAGE的方式聚合到用户和商户表示中。
  • Step2. 從用户U出發,基於元路徑,擴展出多條元路徑的實例(事件鏈)。下圖展示多條實例,包括:U-C1-P1, U-C2-P2-C3-U',U-C2-P3-C4-U''-C5-P4;通過擴展能夠建立起用户U和商户P4的關聯。
  • Step3. 元路徑實例查詢向量表示後進行拼接,並與樣本中的用户(Target User)進行交互。多條候選元路徑的設計,可以突破單一元路徑依賴信息裁剪造成的信息缺失。交互的方式採取Attention,即計算當前用户與所有候選元路徑的關聯,並最終作用於下游預估中。

圖7 元路徑建模場景化行為示例

$$ \begin{aligned} context_feature = E_{dc} = concat(cate_fea\ |\ dense_fea) \ metapath_instance_emb = E_{mie}= concat(E_{u} \ | \ E_{p}\ |\ E_{c}) \end{aligned} $$

對於線上請求,檢索同場景下Emie。

$$ \begin{aligned} E_{sub} = \sum Attenion(E_{mie}\ , \ E_{dc} ) · E_{mie} \end{aligned} $$

通過圖網絡技術,我們擴展了不同場景下的用户潛在興趣,藉助注意力機制捕捉當前決策,與不同元路徑對應場景的關聯性,從而實現場景化建模。

3. 工程實踐落地

3.1 場景圖CTR模型主結構

在模型結構設計的過程中,我們按照”低耦合、高內聚、可插拔、無依賴“的原則,將“行為子圖拓展模塊”、“元路徑場景子圖模塊”、“特徵圖交叉模塊”三個子方向迭代作為獨立模塊接入到模型中。 圖8 場景圖CTR模型主結構

3.2 基於子圖擴展的行為圖聯合訓練

在“基於子圖擴展的行為圖建模”中,對於每個請求在線模塊都需要進行“行為序列長度 * 鄰居數”次向量查詢和計算,當行為序列較長時對在線CTR預估服務來説會存在較大的RT挑戰。

考慮POI之間的"全局行為互聯圖"和用户的長期興趣較為穩定,因此針對長期行為子圖拓展采用基於行為POI和採樣子圖進行聚合不依賴候選Target POI,短期行為子圖拓展方案仍然採用2.2.2中方案根據序列和候選Target POI動態計算,長短期POI使用不同的Embedding空間。基於此上線方案採取長期行為子圖離線計算+在線查詢的思想,離線計算用户長期行為序列子圖Embedding並灌庫,在線查詢Redis獲取子圖Embedding參與後續計算。

基於子圖拓展的長期行為模塊如下圖所示:

圖9 圖聯合訓練離線在線示例

我們將整個過程分為三步,保證線上耗時不增加的核心在於Step2的子圖拆分重構。因為線上Serving過程中行為子圖Embedding表示不會發生變化,因此使用子圖查詢或聚合後查表,其結果是一致的。

  • Step1. 端到端訓練

在原有CTR模型的基礎上,針對POI行為序列進行子圖查詢擴展:每個POI申請從圖引擎中進行鄰域卷積採樣操作,即從二階鄰居聚合到一階鄰居,再聚合到POI本身。

  • Step2. 拆分子圖查詢模塊,聚合Embedding,灌庫

訓練完成後,將原有子圖查詢模塊拆分,再對長期行為中全量POI做一次子圖POI-Embedding聚合操作,得到行為POI的子圖Embedding。灌庫階段,將長期行為子圖POI的Embedding和其他特徵的Embedding寫入Redis存儲中。

  • Step3. 對聯合訓練的模型進行重構導出生成新的線上Serving模型

將長期行為“子圖擴展的行為圖模塊”中子圖聚合計算重構為直接查詢Embedding表徵,線上從Step2灌庫的結果中查取Embedding。

這樣避免線上大量卷積操作的耗時,線上實驗驗證,高峯期TP99與TP999新增模塊耗時基本持平。

3.3 場景子圖模塊

基於元路徑的場景圖建模是採用元路徑Metapath的方式來表示CTR任務樣本中的用户子圖和商家子圖,採樣子圖來自預選構建好的User、POI、Context(Context節點包含了蜂窩、餐段信息)異構行為場景圖。

3.3.1 離線異構圖構建

由於Context會同時連接User與POI,在異構圖上Context節點會成為超級節點(能夠連接一個蜂窩內幾乎全部的User和POI),POI類型節點也可能成為超級節點(連接區域內所有Context節點);當出現了普遍的超級節點後,會導致圖上游走採樣困難、噪聲加劇。我們在設計構建Context節點以及異構邊時防止了這一問題:

  • Step1. Context節點作為時空上下文,貫穿用户和門店;細化Context節點(比如包含蜂窩、餐段、品類),那麼User與Context的連接邊、Context與POI的連接邊都會大大減少。
  • Step2. 不同User可能通過Context節點跳轉到不同POI上,為了防止採樣時從User節點出發的Path跳轉到不相關的POI上,Context節點最好能夠體現用户興趣(品類信息其實就是一種)。
  • Step3. 對於邊權有所限制,能夠避免Context類型節點成為超級節點,POI的問題也會解決。

3.3.2 元路徑採樣建模

用户興趣、行為相對是分散的,從User節點出發,沿着邊能夠跳轉到不同Context上去,得到相對廣泛的實例,而Metapath採樣得到的實例可以視作是User決策場景表徵集合,具體過程如下: - Step1. 以用户子圖中U-C-P-C-U這樣的路徑為例,採樣出N份實例,按用户節點擴散的第一個Context分類存儲,如得到M組實例,公式如下。其中Ci是每個分組的實例數,Uuid:

$$N = \sum_{i=1}^{M} C_{i}$$

  • Step2. 對於一個用户請求,按Uuid與當前請求Context查詢User子圖,得到能夠匹配當前場景決策信息的用户決策場景子圖表達。
  • Step3. 藉助注意力機制捕捉當前決策,計算不同Metapath instance與對應場景的關聯性,從而實現場景化建模。

3.4 效果收益

子圖拓展聯合訓練離線AUC+2千分點;特徵交叉子圖模塊離線AUC+1千分點;場景子圖交互離線AUC+2.5千分點。

3.4.1 高低頻場景感知

通過圖建模設計,我們的模型能夠對高低頻場景感知,從而提升場景下對應用户的效果。 具體地,在外賣展示廣告CTR預估業務中,分析場景化圖算法在不同頻次的用户表現情況:統計高頻(過去一個月在美團外賣點擊POI次數>150次)和低頻(過去一個月在外賣點擊POI次數<15次)用户,比較實驗組相比對照組(與未採用場景圖的Base模型AB實驗)的線上指標(點擊率, CTR/商品交易額(Gross Merchandise Volume, GMV)。同時,我們還按照高低頻用户分別統計了三級品類的人均曝光數量,對比基線的人均曝光數量。

| | CTR | GMV | 人均曝光品類數量 | |:---:|:---|:---:|---:| |低頻用户|+1.58%|+1.08%|+0.02品類| |高頻用户|+2.68%|+1.94%|+0.3品類|

從上表結果可以看出:

  • 低頻和高頻用户的CTR和GMV均有提升,證明感知子圖卷積能夠有效捕捉高低頻場景,實現場景化下用户興趣刻畫。
  • 低頻和高頻用户人均曝光品類數量均有提升,並且高頻用户的人均品類增加更多,説明具備更好的興趣挖掘探索能力,能夠幫助高頻場景用户跳脱已有的興趣圈。

3.4.2 特定時空場景感知

為驗證場景圖模型對於不同場景的識別和刻畫能力,進一步對比引入場景圖聯合建模對比無場景圖在時間品類和空間需求下的感知變化(以下多組統計結果均為多天/同時段累計結果)。

3.4.2.1 時間品類場景

奶茶品類是下午時段的熱銷品類,從曝光轉化比來看在下午茶時段較高且時段效應明顯,我們統計了某業務奶茶品類上多天同時段,曝光數量佔該時間段總曝光數量的比例,並比較實驗組相比基線的漲幅情況,從時段上看,實驗組在下午茶時間段(14-16時)奶茶曝光比例上升,而晚間正餐期間曝光比例減少,説明場景圖模型的品類時段感知能力得到加強並且在流量選擇上趨向優質流量,模型上線後在奶茶品類上的整體後驗CTR指標表現正向。

圖10 奶茶品類分時段曝光漲幅對比

3.4.2.2 空間需求場景

外賣上的用户需求和行為具有明顯的週期效應:即工作日和非工作日,用户的行為具備較大差異。例如,在非工作日,用户多數是在家(小區)而不是寫字樓,會有更大的傾向在美團外賣上選購菜品、添置生活用品等(轉化曝光比更高)。

我們以某業務超市便利的品類曝光為例,我們統計了從週一到週日連續7天,超市便利曝光佔當天的總曝光量佔比,按照實驗組和對照組對比曝光佔比情況。從圖中可以看出,實驗組曝光在週一、週二減少,週末上升,説明模型捕捉到了工作日和非工作日下,超市便利的購物場景區別,模型上線後在超時便利品類的整體後驗CTR指標也表現正向。

圖11 超市便利分天曝光對比

4. 總結和展望

與傳統電商推薦不同,外賣推薦呈現出場景化的特點:供給受LBS強約束、用户決策鏈路短、易受所處環境影響,因此場景化建模是外賣推薦亟需解決的問題。圖網絡技術已經在學術界和工業界進行了較為深入的探索,在美團外賣場景化建模中遇到的挑戰,我們也通過圖技術進行了相應的優化求解,分別通過場景特徵圖交叉、場景序列子圖擴展、元路徑場景圖,在交叉特徵去噪、突破用户興趣封閉圈、完整場景圖刻畫方面進行了探索。

在算法落地上,考慮到線上的耗時問題,我們在Serving階段拆分重構長期行為子圖,在不改變模型結果的情況下減少了計算複雜度,滿足了線上的性能要求。圖技術的場景化落地雖然取得了一定的收益,但仍然存在一些問題需要解決,例如特徵圖交叉在算力約束下,只能滿足部分特徵交叉;對於場景的元路徑刻畫仍然依賴於先驗人工定義,尚未走上“自動駕駛”之路,未來我們會持續進行探索。

5. 作者簡介

任建、張偉、雨楓、黃坤、慧楠、鵬業、張波,均來自美團外賣廣告技術團隊。

6. 參考資料

  • [1] Li F, Chen Z, Wang P, et al. Graph intention network for click-through rate prediction in sponsored search[C]//Proceedings of the 42nd international ACM SIGIR conference on research and development in information retrieval. 2019: 961-964.
  • [2] Han H, Zhang M, Hou M, et al. STGCN: a spatial-temporal aware graph learning method for POI recommendation[C]//2020 IEEE International Conference on Data Mining (ICDM). IEEE, 2020: 1052-1057.
  • [3] Yang T, Zhang L, Shi C, et al. Gated Hypergraph Neural Network for Scene-Aware Recommendation[C]//International Conference on Database Systems for Advanced Applications. Springer, Cham, 2022: 199-215.
  • [4] Wu L, Li Z, Zhao H, et al. Learning the implicit semantic representation on graph-structured data[C]//International Conference on Database Systems for Advanced Applications. Springer, Cham, 2021: 3-19.
  • [5] Xie Y, Wang Z, Li Y, et al. Fives: Feature interaction via edge search for large-scale tabular data[C]//Proceedings of the 27th ACM SIGKDD Conference on Knowledge Discovery & Data Mining. 2021: 3795-3805.
  • [6] Chang J, Gao C, Zheng Y, et al. Sequential recommendation with graph neural networks[C]//Proceedings of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval. 2021: 378-387.
  • [7] Shao Z, Xu Y, Wei W, et al. Heterogeneous Graph Neural Network with Multi-view Representation Learning[J]. arXiv preprint arXiv:2108.13650, 2021.
  • [8] Li Z, Cui Z, Wu S, et al. Fi-gnn: Modeling feature interactions via graph neural networks for ctr prediction[C]//Proceedings of the 28th ACM International Conference on Information and Knowledge Management. 2019: 539-548.
  • [9] Fu X, Zhang J, Meng Z, et al. Magnn: Metapath aggregated graph neural network for heterogeneous graph embedding[C]//Proceedings of The Web Conference 2020. 2020: 2331-2341.
  • [10] Wang Y, Xu H, Yu Y, et al. Ensemble Multi-Relational Graph Neural Networks[J]. arXiv preprint arXiv:2205.12076, 2022.

閲讀美團技術團隊更多技術文章合集

前端 | 算法 | 後端 | 數據 | 安全 | 運維 | iOS | Android | 測試

| 在公眾號菜單欄對話框回覆【2021年貨】、【2020年貨】、【2019年貨】、【2018年貨】、【2017年貨】等關鍵詞,可查看美團技術團隊歷年技術文章合集。

| 本文系美團技術團隊出品,著作權歸屬美團。歡迎出於分享和交流等非商業目的轉載或使用本文內容,敬請註明“內容轉載自美團技術團隊”。本文未經許可,不得進行商業性轉載或者使用。任何商用行為,請發送郵件至[email protected]申請授權。