從洞察到決策,一文解讀標籤畫像體系建設方法論丨DTVision分析洞察篇

語言: CN / TW / HK

一、數字營銷是數字化轉型排頭兵

《⼗四五數字經濟發展規劃》中強調,要⼤⼒推進數字化轉型,形成資料驅動的智慧決策能⼒,提升企業整體運營效率。

要做好數字化轉型,企業可從產、研、供、銷、⽤等多個環節入手,而 “銷” 恰好是第一關鍵要素,企業轉型往往從營銷場景入手,因此我們說數字化營銷是企業數字化轉型的排頭兵。

在數字化營銷轉型過程中,由於各個企業的數字化建設程序不同,往往會遇到多種挑戰,如:

· 企業資料如何打通?

· 客戶畫像如何建設?

· 營銷ROI如何提升?

· 營銷策略如何迭代?

file 要想解決以上問題,在業務⽣產與業務應⽤之前,讓產業數字化營銷,我們需要進⾏:

· 資料的統⼀儲存;

· OneID 的資料打通;

· OneModel 的資料模型建設;

· 資料資產的統⼀管理。

打好這些基礎,接下來就能開始建設企業自己的個性化標籤體系,讓標籤作為企業數字化營銷的基石,幫助消費者畫像更加精確。

實現用資料指導營銷,而不再只是含糊的經驗;讓活動的資料再回流到數倉中,作為標籤資料來源的一部分,形成營銷業務閉環。

file

二、標籤體系建設方法論

那麼如何幫助企業構建完美的標籤體系呢?我們總結出“三目標 + 五步法”的方法論:

file

1、標籤體系建設三目標

● 目標一:解決業務問題

要確定我們建設標籤體系是為了解決什麼具體的業務問題,想要達到什麼效果,時間上要做到分期而治、小步快跑,早日推廣應用。

● 目標二:業務人員好用、易用

標籤體系的建設目標是要靈活可擴充套件,讓業務人員可以輕鬆衍生標籤、生產效率高。同時標籤應用方式還需要多種多樣,以適應不同的業務要求。

● 目標三:可持續更新迭代

標籤體系作為重要資料資產,需要我們對它進行持續完善,形成業務應用與資料開發部門良好互動,助力生產更有價值的資料。

2、標籤體系建設五步法

第一步 明確建設目標

在開始建設標籤時,我們需要明確建設目標,目標可以指導我們的執行策略無偏差,最終達到想要的結果,否則在建設過程中隨著一些資訊的輸入、困難的出現,容易今天一榔頭明天一棒槌,顧此失彼,達不到業務期望的結果。

file ● 業務建設目標

業務建設目標,指通過標籤專案想解決什麼樣的問題,達到什麼樣的業務效果。比如

· 現在屬於粗略式的運營,需要基於標籤體系實現精細化運營,將營銷活動的轉化率提升5%;

· 標籤加工流程過於緩慢,從業務人員提需求到需求實現需要1-2周時間,需要將改時間縮短至1-3天;

· 現在資料來源過於單一,只有交易域,需要彙總其他域的資料,比如行為資料、評論資料、活動資料等豐富標籤體系維度。

一般列舉5-10條目標,業務部門與技術部門一起制定,基於這些目標,進行系統建設。

● 系統建設目標

為實現對應的業務目標,需要建設一個怎樣的系統,是內部實現,還是外部採購,各自的實現週期與成本,若外部採購,採購的標準是什麼等都需要考慮,該問題一般是技術部門來考慮。

· 系統給誰使用:是建設一個標籤加工與管理的標籤管理工具,主要給技術部門使用,因為企業已經有了營銷系統、涵蓋標籤圈群與推送給的功能。還是需要一個集合加工、管理、圈群、分析一體化的工具,資料分析師、業務人員也要用。不同的使用物件,系統建設的內容不一樣。

· 系統的技術架構要求:公司內部的大資料部門若已經用了一些底層平臺或技術元件,從節省成本方面,應當儘量用同一套底層儲存與計算平臺,比如已經採購了CDH、TDH的Hadoop,那標籤系統需要可直接對接這些系統進行資料儲存與計算。以及標籤系統需要和CRM系統、營銷平臺實現對接,便需要有相應的對接方案,如通過標籤服務API介面,或資料同步、推送等當時,將資料給到下游系統。

· 系統功能要求:基於標籤的加工、標籤的生名週期管理、標籤的資料安全、標籤的評估治理、標籤圈群、畫像洞察、對外服務等多方面梳理需要的功能。

· 系統性能要求:基於司內的資料量,標籤加工的速度、併發,標籤圈群與分析的查詢時間,所需要的部署資源、一年需要花費的成本需要進行評估與計算。

● 參與部門與執行計劃

根據我們一些標籤專案的建設經理,會出現這樣的情況,大資料部門一期專案建好的標籤,很難推動業務人員使用起來,主要有以下幾點原因:

業務人員覺得建設的標籤有用的很少,大多數都用不上;

用了一下標籤,覺得資料不準確,不敢用;

領導沒有說要用這些標籤,還是按照自己的既定模式來工作好了。

基於這些問題,標籤專案推進之初,需要拉上業務部門的領導、對接人一起參與,確定一個先應用標籤的專案或場景,做出效果,再應用到更多的部門及專案,否則剛開始大而全,週期長、且沒有目標性,往往後續推廣使用時會遇到阻礙。

● 參與部門包含以下:

· 需要標籤專案服務的業務部門(核心):如市場部、運營部、客服部、風控部等,各指定一名對接人員;

· 專案需求收集分析者:資料產品經理、資料分析師;

· 系統建設和標籤加工者:資料科技部門。

● 制定執行計劃:

· 專案是否需要分期,一期專案的目標和建設的標籤有哪些;

· 各期專案時間週期、負責人,上線場景;

· 上線後業務人員需要持續反饋使用情況,業務變化情況,不斷的優化迭代。

第二步 標籤體系建設

明確好建設目標之後的下一步就是標籤體系設計。

在此之前,我們先對一些標籤的重要概念做一些介紹:

file 標籤體系設計是一種對物件統一進行本質刻畫的資料描述辦法,把個體觀察升級為群體觀察,而非過去對個體現象的歸納,更具有面向未來的場景化適應能力。標籤體系設計的整體流程可分為 4 大步驟 + 2 大階段:

file 在此過程中我們需要:

● 規劃實體物件

確定標籤體系的物件,梳理標籤間的關係,設計標籤體系,做好標籤類目建立。

file 實體指我們要建立標籤體系的物件,如客戶標籤體系、商品標籤體系、渠道標籤體系、客戶經理標籤體系,客戶、商品、渠道、客戶經理都屬於我們的實體物件。其類似一顆樹的根,後續要基於“實體”,長出樹的枝幹、葉子、花等,所以劃分正確的實體很重要。

關係指多個實體之間的關係,如“客戶”購買“基金”,會使客戶實體與基金實體發生關係,形成新的標籤,比如加工“投資風險偏好”標籤,標籤值為“高風險”、“中高風險”、“低風險”等,需要利用客戶最近一年的交易記錄結合基金維表,當用戶購買基金的基金型別包含高風險,且最近一年購買金額>5000時,為高風險偏好。需要用到2個實體形成一個關係,來加工這個標籤。

● 探查資料

根據標準資料建倉規範,梳理下大概的客戶的資料域、業務過程、資料表、表的資料量、資料分佈等,掌握基於該資料,可以加工出哪些標籤。

file ● 設計標籤類目

基於已採集的業務需求、掌握的資料情況、規劃的實體的物件,建立實體物件的標籤類目體系。除根據客戶業務建設外,也會提供一些行業通用模板,作為參考。

標籤類目體系是“實體”樹的枝幹,為以後標籤生長的繁茂建立基礎,需要做到枝枝粗壯、分明,即每個類目需要有明顯的分割,且標籤的數量不能過多和過少,建議一個子類目不超過20個標籤,不少於3個標籤。

標籤類目層級根據業務實際情況劃分,一般2~3層即可(不包含標籤、標籤值)。如下圖:

file ● 設計標籤內容

包含標籤定義、加工方法判斷、加工範圍判斷等。

file 根據前面的需求調研、資料調研、類目劃分,梳理標籤體系中的標籤,需包含以下內容:

· 標籤中文、英文名:標籤的中文名稱、英文名稱;

· 標籤所屬類目:標籤所屬一級、二級、三級類目;

· 標籤型別:根據不同維度的劃分,採用其中一種。比如事實標籤、統計類標籤、預測類標籤,亦或是原子標籤、衍生標籤、組合標籤、自定義標籤等;

· 標籤值定義:定義每個標籤的標籤值,如“近一個月買入金額區間”標籤,可根據購買金額的區間段定義“零/低端”、“普通”、“中端”、“準高階”、“高階”等標籤值;

· 標籤含義(描述):描述該標籤業務含義,如“最近30天的購買商品的金額區間,對使用者消費力進行評估”;

· 業務口徑:標籤以哪個資料定義為準,如“使用者活躍城市”標籤,以使用者購買次數最多的城市為口徑加工,而不是瀏覽次數、評論次數等;

· 標籤技術口徑:描述該標籤從哪個表的哪個欄位取值,SQL取數邏輯是什麼;

· 業務方來源:該標籤的業務需求方是誰;

· 標籤更新週期:描述標籤更新頻次,天(如T+1、T+2等)、周、月、小時、分鐘更新等;

· 標籤更新優先順序:同一時間端跑多個標籤時,若資源有限,先跑優先順序高的標籤。

第三步 標籤加工與更新

標籤加工與更新包含各型別標籤加工、標籤測試和標籤上線與更新幾個步驟,在技術層面實現營銷需求。

file ● 判斷標籤加工方法

梳理標籤的加工方式,判斷哪些是離線標籤、實時標籤、演算法標籤,從而引入對應的產品和相應的開發人員來開發。業務場景中,離線標籤偏多,實時標籤次之,演算法標籤少之。

· 離線標籤:定時跑批,一般為天粒度,T+1跑批,晚上跑標籤結果,業務人員第二天做查詢。一些標籤若高頻率更新,也支援小時、分鐘粒度的更新。常需要Spark、Presto、Impala等跑批元件及產品。

· 實時標籤:實時加工,一般為秒或毫秒級加工,常見於使用者行為實時傳上來,基於使用者的實時行為,打標籤,進行商品推薦等。常需要採用Kafka訊息佇列、Flink實時計算引擎組及產品。

· 演算法標籤:利用機器學習演算法、深度學習演算法,做一些預測類標籤,如根據使用者的購物商品和頻率,預測家裡是否有小孩、小孩年齡等。常需要Python開發環境和機器學習演算法包。

不同的加工型別,往往需要採用不同的計算引擎和框架,需判斷企業內容是否有這樣的能力加工,若無,外部採購的話需要供應商有什麼樣的能力,需要有大致的判斷。

● 劃分加工範圍

標籤的使用人員是業務人員,在以往老的流程中,需要業務人員向資料開發提需求加工新標籤,開發一個新標籤的週期一般1-2周之間。

為了使業務人員能夠靈活的加工規則標籤,儘快提取自己想要的資料,標籤的加工、管理目前多通過產品化的方式,使資料開發、資料分析師、業務人員都能參與標籤的開發。

這裡便涉及到哪些標籤由開發人員加工,哪些標籤由業務人員加工,標籤加工流程是什麼等。

file 可按照上述流程,在資料開發和業務人員之間有個標籤管理團隊,用來維護標籤的生命週期,包括標籤需求的分解、上下架等,可由資料分析師、業務人員組成。

● 大的劃分原則是:

基礎標籤的標籤由資料開發團隊加工,這類標籤是基於數倉資料加工的最細粒度標籤(是能打在使用者身上的標籤,不是某個單純的欄位),不能再被拆解。

基於基礎標籤可通過規則衍生的,由業務人員完成。

以上圖為例:當有一個“是否30天登入未註冊使用者”標籤需求時,標籤管理團隊可判斷該標籤是否可基於基礎標籤衍生,若不行,則由資料開發加工對應的標籤。

若可以,則判斷是否有對應的基礎標籤可衍生,如舉例標籤,可拆解成“APP最近一次登入日期”或”距最近一次登入時間”,與“是否註冊”2個基礎標籤,便可基於基礎標籤,業務人員完成這2個標籤的加工與上線。

第四步 標籤生命週期管理

標籤生命週期管理是指包含標籤評估、標籤治理和標籤迭代等幾個對標籤的實際使用狀態負責的管理流程,幫助實現標籤建設與營銷的有機結合,不浪費任何一個動作指標。

file ● 從以下維度來評估標籤的重要性

標籤使用度評分:根據標籤引用次數、標籤分析次數、標籤呼叫次數來評估標籤的使用度;

標籤關注度評分:根據標籤搜尋次數、標籤瀏覽次數、標籤收藏次數來評估標籤的關注度;

標籤質量評分:根據標籤值的覆蓋情況來評估標籤的質量,若null值過多,則說明標籤規則設定不合理;

標籤持續優化度評分:根據標籤上線後,再編輯優化的次數來評估標籤的持續優化情況;

標籤安全評分:根據標籤是否脫敏、是否設定行級許可權、是都需要申請、是否設定可見性來判斷標籤的安全度。

基於以上5個維度計算標籤的綜合評分,可檢視各標籤的評分、評估標籤的重要性。

同時,基於標籤使用度評分、標籤關注度評分、標籤持續優化度評分來計算熱門標籤排行、沉默標籤排行,找出不太用的標籤進行下線,完成標籤的“定義——開發——上線——優化——下線”全生命週期管理。

第五步 標籤應用與迴流

標籤應用與迴流則是指標籤圈群、畫像洞察和對外服務幾項具體的落地結果操作,也是標籤建設必不可少的一環。

file ● 以一個場景舉例:

· 營銷策略:為維持老顧客的忠誠度,並引導現在購買初級產品的老客戶向高階產品進階,圈選出為“老顧客升級”使用者,為這些客戶發放高階產品的優惠券;

· 人群包選擇:“最近1年購買次數>=1”且“最近1年消費金額>=1000”且“性別=女”的客戶。

● 基於目前群組進行畫像洞察:

· 群組畫像:進一步分析“老客戶升級”這批使用者的會員等級、月消費支出、是否為活躍使用者等,進一步掌握群組特徵,根據活動預算調整自己的營銷策略。

· 群組分析:圈選出一個“高階產品使用者”群組,監控每天忠實使用者的人數,看是不是有明顯波動,某些活動發放後,資料是否有提升;某個時間人數是否有驟減,保障群組的穩定持續上升。

· 群組交併差計算:分析“老顧客升級”群組與“高階客戶”的重合度,看是否有重複人群,最終推送優惠券可進行策略調整,不針對這部分重合客戶進行本次推送。

確定好人群后,便可進行市場投放,看其對業務帶來的作用,除分析活動帶來的GMV、客單價提升外,我們也需要知道活動參與情況也是使用者行為資料的一種,需要將這些資料也迴流至數倉,生成新的標籤。

三、標籤體系在某基金的建設案例

在上文中我們介紹了標籤體系建設的方法論,如何將理論落地實踐,袋鼠雲數棧智慧標籤產品給出了答案。

客戶資料洞察平臺(DataTag),通過標籤萃取、標籤管理、群組細分、全面畫像,構建以業務價值為導向的標籤體系和多樣化群組,將資料資產標籤化,資料標籤價值化,應用於企業智慧化運營與營銷。

file 接下來我們以某基金客戶的案例,來為大家介紹標籤體系建設的實際應用。

1、專案背景

身處一個全方位數字化的平臺型經濟時代,企業的數字化轉型已是由內而外的必然趨勢,在數字化浪潮下,基金客戶的各項業務迅猛發展、客戶資料量急劇增長,公司對客戶、產品、渠道、反洗錢等方面的資料分析、運營提出了更高要求,在此背景下,搭建一套完整的標籤平臺,提升營銷效率,無疑是最佳的選擇。

2、客戶痛點

· 客戶資料分散在各個系統,無統一的分析平臺;

· 各類資料分析和提取大多采用半自動的工作模式,無科學的標籤體系;

· 客戶活動開發週期長,運營不精準,營銷效果缺乏及時追蹤、執行反饋不及時。

3、建設方案

· 對接星環 TDH引擎;

· 提供標籤實施服務,為客戶梳理標籤體系,完標籤開發,建立客戶標籤體系,支援銷售、服務、合規等不同角度的需求;

· 便捷的標籤開發、運算、展示和輸出等全生命週期管理;支援客戶個體及群組畫像、客戶群圈選和對比,支援快速推廣、智慧營銷、精準服務。

file

4、建設流程

· 業務層面:以客戶實際業務現狀和業務需求為基礎,量身定製適用於業務的標籤體系;

· 資料層面:將各業務系統中消費者資料迴流至資料中臺,根據標籤設計,進行資料探查、清洗、建模、開發等工作並實施上線。

file

5、業務效果

· 標籤體系:建立客戶、基金、基金經理、渠道 4 個標籤體系;

· 標籤數量:600 + 標籤;

· 加工效率:標籤加工效率從 1 周縮短到 2 天,運營效率提升至 2~3 次 / 周;

· 標籤應用:應用在基金營銷、反洗錢風險控制、使用者流失召回等多個方向。

file

袋鼠雲開源框架釘釘技術交流群(30537511),歡迎對大資料開源專案有興趣的同學加入交流最新技術資訊,開源專案庫地址:https://github.com/DTStack

「其他文章」