EXTR:面向外部性的工業級廣告點選率預估框架

語言: CN / TW / HK

目錄:

· 摘要

· 背景

· 模型設計

·   實驗

· 結論

· 參考文獻

1. 摘要

點選率預估用於衡量使用者對商品的點選概率,在電商平臺中扮演了十分重要的角色。電商平臺通常以混合展現的方式為廣大消費者提供自然結果和廣告。事實上,圍繞在目標廣告周圍的其他商品會影響使用者對目標廣告的點選率。本文將“除目標廣告的其他展現商品”統稱為外部商品(External Items),外部商品既包括自然結果,也包括其他被展示的廣告,外部商品對目標廣告的影響稱為外部性影響(External Effects / Externalities)。大多數點選率預估模型假設使用者的點選率僅依賴於商品本身,而忽略了外部商品對目標商品的影響,本文主要關注廣告系統中點選率預估的外部性。

在廣告預估階段,自然結果列表已經由自然引擎返回,廣告槽位的展示結果還未確定,由此引出兩個重要挑戰:1)正在被預測的目標廣告可能在任意廣告位勝出,環繞在不同廣告位周圍的外部商品可能完全不同,從而形成多樣化的外部性(Diversity Externalities);2)所有候選廣告同時進行點選率預估,環繞在目標廣告周圍的外部廣告未知,導致不完整的外部性(Incomplete Externalities)。面臨以上挑戰,受 Transformer 高並行性的啟發,我們提出了 EXternality TRansformer(EXTR)。EXTR 將目標廣告所有可能的展示情形當作 Query,對應的外部商品作為 Key/Value 以同時建模多樣化的外部性。進一步地,我們提出了 PAG 模組學習潛在的外部廣告排列以克服不完整外部性的問題。線上實驗結果表明,EXTR 模型能夠有效的建模外部性影響,提升廣告平臺收益。相關工作論文已發表在KDD 2022,歡迎閱讀交流。

論 文: EXTR: Click-Through Rate Prediction with Externalities in E-Commerce Sponsored Search

下 載 (點選↓閱讀原文) https://dl.acm.org/doi/abs/10.1145/3534678.3539053

2. 背景

一般來說,廣告點選率除了跟商品本身質量有關,也跟與它同時展示的商品有關。隨著商品的品類、數目增加,在客戶端展示列表中更加突出的商品更可能獲得使用者的青睞。本文主要研究其他展示商品對目標廣告點選率的影響。區別於目標商品本身,我們將目標商品以外的其他商品稱為外部商品(External Items),外部商品對目標商品的點選率影響統稱為外部性影響(External Effects / Externalities)。推薦系統往往將自然結果和廣告以混合的方式展示給廣大消費者,因此,目標廣告的外部商品不僅包括自然結果,還包括其他被展示的廣告。由於自然結果和廣告的優化目標不同,這兩類展示結果一般由不同的引擎提供,本文主要關注廣告側引擎的點選率預估。

廣告引擎的三個階段

廣告引擎流程一般分為三個階段: 召回階段 (Matching Stage), 預估階段 (Prediction Stage) 和 拍賣階段 (Auction Stage)。廣告位最終的展示結果在拍賣階段才會被確定。在預估階段,廣告的具體展示位置未知,每支廣告都有可能被放置在任意廣告位。不同的廣告位置對應著不同的外部性。面臨 多樣化的外部性(Diversity Externalities), 一種最直接的方法是分別對每支廣告的每個可能的曝光位置分別預估其點選率。顯然,在廣告位較多的情況下,這種方法會大大增加廣告系統的響應時長。考慮到Transformer高並行的優勢,我們提出面向外部性點選率預估的Transformer模型—— EX ternality TR ansformer(以下簡稱 EXTR )。另一方面,在預估階段,成千上萬的候選廣告會同時並行地訪問預估模型。雖然在該階段,自然結果展現已由自然引擎返回,但是與目標廣告同時展示的外部廣告卻依然處在預估階段,導致 不完整的外部性(Incomplete Externalities) 。面臨這一挑戰,我們在EXTR的基礎上進一步提出潛在展示生成器(Potential Allocation Generator,PAG)。

3.模型設計

3.1 EXTR

EXTR網路結構

EXTR模型主要分為兩個模組: 上下文互動模組(Context Interaction Module)外部性抽取模組(Externality Extraction Module)

上下文互動模組 專注於學習廣告位周圍的外部商品間的相互影響,由經典的self-attention Transformer層堆疊而成,輸入包括外部商品的編碼和其對應的排序編碼。self-attention Transformer可以寫成:

表示第層self-attention Transformer的 hidden vector。

外部性抽取模組 的主要任務是一次性、並行地抽取目標廣告在不同曝光位情境下的多樣化外部性。不同於self-attention機制,該模組由heterogeneous attention Transformer組成。在heterogeneous attention Transformer,我們將目標廣告編碼和廣告槽位編碼視作query,將經過互動的上下文編碼視作key/value。這樣,就可以同時查詢目標廣告放在所有廣告位的外部性,並輸出對應的廣告點選率。具體地,query可以形式化成,key/value使用表示。特別地,,表示外部性抽取模組第一層的key/value是上下文互動模組的輸出向量。heterogeneous attention是外部性抽取模組的核心,接下來展開介紹它的內部結構:

分別指attention機制中Query, Key 和Value。具體地,,表示查詢目標廣告被放置在任意槽位和外部環境下的外部性。刻畫了外部商品對目標廣告曝光在位置時的影響強度,可以建模成:

上面公式僅考慮了目標廣告和外部商品間的相互影響,忽略了使用者的個性化。在實際情況中,外部影響因人而異,不同使用者對商品屬性的敏感度不同 [1]。比如學生黨可能對價格差更加敏感,白領人群對商品質量的差距較敏感。因此,這裡我們進一步提出個性化的外部性建模:

是使用者的編碼表示,是點乘運算元。綜上所述,heterogeneous attention Transformer可以形式化地表示為:

表示第層heterogeneous Transformer的 hidden vector。

3.2 PAG

PAG網路結構

PAG的核心是:將個自然結果的排序編碼作為基,加權構造外部廣告的排序編碼,具體構造方法如下:

表示個自然結果的特徵編碼。表示自然結果的編碼在外部廣告編碼的權重。為了加速收斂,我們使用外部廣告真實展示的廣告位作為監督訊號,使用輔助KL散度loss優化分佈:

4. 實驗

考慮到缺乏上下文推薦的公開資料集,我們在淘寶資料集上收集為期一週的真實搜尋資料。該資料集覆蓋了服飾、電子產品、生鮮等上千種商品型別,包括廣告商品和自然商品。模型涉及到的主要特徵如下表所示,其中廣告商品在通用商品特徵的基礎上,擴充套件了創意等獨有特徵。

為了對比外部商品的重要性,我們選擇點選率SOTA模型CAN [2] 作為無外部商品資訊引入的baseline。進一步地,使用MLP,PNN [3],Wide&Deep [4],DCN [5],xDeepFM [6] 和Transformer [7] 等網路結構以Embedding&Pooling方式抽取外部性,並預測廣告點選率。考慮到自然結果和廣告兩類外部商品,我們分別實驗只考慮自然結果的EXTR(EXTR_org),以及既有自然結果,又有其他外部廣告的EXTR。同時,使用AUC、COPC和Logloss評價模型好壞。下表展示了以上方法在各評價指標上的效果:

由上表可知,不含任何外部商品資訊的SOTA模型表現明顯不如其他模型,表明了外部商品對使用者點選率預測確實有幫助。相較於MLP等外部性抽取網路結構,EXTR具有較高的預測準確度。帶有外部廣告的EXTR比僅僅使用自然結果的EXTR有一定程度的提升,反映了外部廣告對目標廣告點選率具有一定影響。為了進一步剖析EXTR的效果點,我們對個性化外部性、外部廣告引入和PAG輔助loss這三個方面進行消融實驗(見下表)。消融實驗結果表明:這三個模組都能夠為外部性抽取帶來提升,其中,外部廣告的引入對模型效果的提升尤為明顯。為了進一步研究個性化外部性影響,我們分別挑選具有代表性的高消費者和低消費者,然後繪製相同展示列表下的attention map圖(見下圖):橫軸表示自然結果,縱軸表示價值1599元的目標廣告展示位置,圖中的顏色越深表示對應的係數越大,意味著自然結果對目標廣告點選率的影響越大。由圖所示,低消費者對價格比較敏感,價格偏低的外部商品對目標商品的影響偏高;具有相似偏高價格的商品,暗示著高質量,更加影響高消費者對目標商品的點選率。

消融實驗

接下來,我們嘗試從attention map中理解外部性影響。下圖展示了一次真實搜尋請求“男士冬季外套”的attention map,顏色越深表示外部影響越大。前四個商品由於都是厚外套、和目標廣告及搜尋關鍵詞息息相關,因此具有明顯較高的外部影響權重。外部廣告由於也是厚外套,當目標廣告在其附近被展示也會產生較高的外部影響力。當目標廣告被放置在頁尾,所有的後外套都和目標廣告相距甚遠,形成了均等外部影響力。可見,外部影響大小不僅取決於商品本身屬性的差異,還和商品的曝光間距有關。

5. 結論

本文提出了支援實際工業應用的高效網路框架EXTR以挖掘個性化的外部性。面對多樣化的外部性,設計了一種全新的基於Transformer的模型結構;面對不完整的外部性,提出了PAG預測外部廣告的潛在展示位置。我們在實際工業級資料集上驗證了模型的有效性和高效性,並部署在了阿里媽媽廣告系統。儘管本文提出的方法已經在實驗中被論證取得了不錯的預測效果,但在外部性點選率預估領域存在更多可能得研究方向,比如資料偏差問題、新客冷啟動問題、網路可解釋性問題等。

6. 參考文獻

[1] Pedro Bordalo, Nicola Gennaioli, and Andrei Shleifer. 2013. Salience and consumer choice. Journal of Political Economy121, 5 (2013), 803–843.

[2] Guorui Zhou, Weijie Bian, Kailun Wu, Lejian Ren, Qi Pi, Yujing Zhang, Can Xiao, Xiang-Rong Sheng, Na Mou, Xinchen Luo, et al. 2020. CAN: Revisiting Feature Co-Action for Click-Through Rate Prediction. arXiv preprint arXiv:2011.05625 (2020).

[3] Ying Shan, T Ryan Hoens, Jian Jiao, Haijing Wang, Dong Yu, and JC Mao. 2016. Deep crossing: Web-scale modeling without manually crafted combinatorial features. In Proceedings of the 22nd ACM SIGKDD international conference on knowledge discovery and data mining. 255–262.

[4] Heng-Tze Cheng, Levent Koc, Jeremiah Harmsen, Tal Shaked, Tushar Chandra, Hrishi Aradhye, Glen Anderson, Greg Corrado, Wei Chai, Mustafa Ispir, et al. 2016. Wide & deep learning for recommender systems. In Proceedings of the 1st workshop on deep learning for recommender systems. 7–10.

[5] RuoxiWang, Bin Fu, Gang Fu, and MingliangWang. 2017. Deep & cross network for ad click predictions. In Proceedings of the ADKDD’17. 1–7.

[6] Jianxun Lian, Xiaohuan Zhou, Fuzheng Zhang, Zhongxia Chen, Xing Xie, and Guangzhong Sun. 2018. xdeepfm: Combining explicit and implicit feature interactions for recommender systems. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 1754–1763.

[7] Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N Gomez, Łukasz Kaiser, and Illia Polosukhin. 2017. Attention is all you need. In Advances in neural information processing systems. 5998–6008.

END

也許你還想看

基於對抗梯度的探索模型及其在點選預估中的應用

SIGIR 2022 | AdaCalib: 後驗引導的特徵自適應預估校準

阿里媽媽搜尋廣告預估模型2021思考與實踐

阿里媽媽展示廣告預估校準技術演進之路

喜歡要“ 分享 ”,好看要“ 點贊 ”哦ღ~

↓歡迎留言參與討論↓