資料分析之必備技能---資料分析報告
資料分析報告的重要組成部分
資料分析報告核心目標
為什麼要做資料分析報告?
通過資料驅動業務正常發展
- 產品方面:針對使用者與商業
- 運營方面:運營過程中,會產生大量的資料,我們需要通過資料分析瞭解到我們的運營是否是有效的
- 自提方面:瞭解到自身的不足才可以更好的解決
資料分析報告的型別
資料分析報告包括產品分析報告和查詢分析報告
產品分析報告
-
明確目的(預期)
- 對於產品分析報告,我們需要了解預期我們想達到一個什麼目的
是要去對產品做一個修正?還是優化某一個產品?最終帶來什麼收益
- 對於產品分析報告,我們需要了解預期我們想達到一個什麼目的
-
確定分析緯度
- 對於某一個產品我們需要從哪些角度分析
從收益角度?從影響面角度?還是從針對性的使用者角度?
- 對於某一個產品我們需要從哪些角度分析
-
提取資料(正確的資料口徑)
- 對於不同的公司,或者同公司不同部門而已,資料的口徑都是不一樣的,提取的方式也有可能不一致
確定資料的需求方和確認方,避免“無效資料分析”
- 對於不同的公司,或者同公司不同部門而已,資料的口徑都是不一樣的,提取的方式也有可能不一致
-
總結資料分析問題,或給出解決方案
- 對於資料報告,需要通過報告發現應用中的問題,並且給出相對應的解決方案
做事有頭有尾
- 對於資料報告,需要通過報告發現應用中的問題,並且給出相對應的解決方案
查詢分析報告
-
驗證資料的口徑(交叉驗證)
- 由於是查詢分析報告,我們需要排除問題,對於資料的來源一定要確保正確性
最好去排除的方法之一
- 由於是查詢分析報告,我們需要排除問題,對於資料的來源一定要確保正確性
-
提出多種假設
- 哪些方向最可能出現問題
-
想辦法驗證假設
-
給出結論和改進方案
資料分析報告核心要點
- 確定分析目的:我們需要知道我們為什麼要做這份資料分析報告,確保我們可以很好的開展我們的工作
- 架構思路清晰:後續會細講
- 資料準確性:這是需要重點注意的一點
- 選擇合適的圖表:資料分析報告中文字加圖表的形式會更好的達到一個展示效果,不同的圖表達到的資料展示效果不一樣,所適合的資料關係也不一樣
- 分析結論
確定分析目的
- 結果追溯:分析歷史查詢原因,論證結果
- 行業商機:挖掘要被滿足的需求
挖掘需要被滿足的需求
- 資料監控:評估、檢測、監控
- 挖掘預測:指導未來實踐的規律
架構思路清晰
- 明確資料分析報告型別( 產品分析報告、查詢問題報告)
- 選擇合適的資料分析框架進行問題拆解,比如AAARR、PEST等模型
- 輸出分析資料,進行最終總結
資料準確性
- 資料來源是否準確:資料分析師接觸到的資料基本上是經過了資料清洗、數倉建模之後的下游資料資料,針對上游資料的要有準確性保障。
- 計算邏輯是否準確:要清楚所用下游資料表的邏輯和清洗規則,保證取了對的資料,並且計算邏輯沒有問題。
選擇合適圖表
1、 柱狀圖
展示多個分類的資料變化和同類別各變數之間的比較情況。
- 適用: 對比分類資料。
- 侷限: 分類過多則無法展示資料特點。
- 相似圖表:
- 堆積柱狀圖:比較同類別各變數和不同類別變數總和差異。
- 百分比堆積柱狀圖:適合展示同類別的每個變數的比例。
2、 條形圖
類似柱狀圖,只不過兩根軸對調了一下。
- 適用: 類別名稱過長,將有大量空白位置標示每個類別的名稱。
- 侷限: 分類過多則無法展示資料特點 。
- 相似圖表:
- 堆積條形圖:比較同類別各變數和不同類別變數總和差異。
- 百分比堆積條形圖:適合展示同類別的每個變數的比例。
- 雙向柱狀圖:比較同類別的正反向數值差異。
3、 折線圖
展示資料隨時間或有序類別的波動情況的趨勢變化。
- 適用: 有序的類別,比如時間。
- 侷限: 無序的類別無法展示資料特點。
- 相似圖表:
- 面積圖:用面積展示數值大小。展示數量隨時間變化的趨勢。
- 堆積面積圖:同類別各變數和不同類別變數總和差異。
- 百分比堆積面積圖:比較同類別的各個變數的比例差異。
4、 柱狀圖
結合柱狀圖和折線圖在同一個圖表展現資料。
- 適用: 要同時展現兩個專案資料的特點。
- 侷限: 有柱狀圖和折線圖兩者的缺陷。
5、 散點圖
用於發現各變數之間的關係。
- 適用: 存在大量資料點,結果更精準,比如迴歸分析。
- 侷限: 資料量小的時候會比較混亂。
- 相似圖表: 氣泡圖:用氣泡代替散點圖的數值點,面積大小代表數值大小。
6、 餅圖
用來展示各類別佔比,比如男女比例。
- 適用: 瞭解資料的分佈情況。
- 缺陷: 分類過多,則扇形越小,無法展現圖表。
- 相似圖表:
- 環形圖:挖空的餅圖,中間區域可以展現資料或者文字資訊。
- 玫瑰餅圖:對比不同類別的數值大小。
- 旭日圖:展示父子層級的不同類別資料的佔比。
7、地圖
用顏色的深淺來展示區域範圍的數值大小。
- 適合: 展現呈面狀但屬分散分佈的資料,比如人口密度等。
- 侷限: 資料分佈和地理區域大小的不對稱。通常大量資料會集中在地理區域範圍小的人口密集區,容易造成使用者對資料的誤解。
- 相似圖表:
- 氣泡地圖:用氣泡大小展現資料量大小。
- 點狀地圖:用描點展現資料在區域的分佈情況。
- 軌跡地圖:展現運動軌跡。
8、 熱力圖
以特殊高亮的形式顯示訪客熱衷的頁面區域和訪客所在的地理區域的圖示。
- 適合: 可以直觀清楚地看到頁面上每一個區域的訪客興趣焦點。
- 侷限: 不適用於數值欄位是彙總值,需要連續數值資料分佈。
9、 矩陣樹圖
展現同一層級的不同分類的佔比情況,還可以同一個分類下子級的佔比情況,比如商品品類等。
- 適用: 展示父子層級佔比的樹形資料。
- 缺陷: 不適合展現不同層級的資料,比如組織架構圖,每個分類不適合放在一起看佔比情況。
10、 指標卡
突出顯示一兩個關鍵的資料結果,比如同比環比。
- 適合: 展示最終結果和關鍵資料。
- 缺陷: 沒有分類對比,只展示單一資料。
11、詞雲
展現文字資訊,對出現頻率較高的“關鍵詞”予以視覺上的突出,比如使用者畫像的標籤。
- 適合: 在大量文字中提取關鍵詞。
- 侷限: 不適用於資料太少或資料區分度不大的文字。
12、 儀表盤
展現某個指標的完成情況。
- 適合: 展示專案進度。
- 侷限: 只適合展現資料的累計情況,不適用於資料的分佈特徵等。
13、 雷達圖
將多個分類的資料量對映到座標軸上,對比某專案不同屬性的特點。
- 適用: 瞭解同類別的不同屬性的綜合情況,以及比較不同類別的相同屬性差異。
- 侷限: 分類過多或變數過多,會比較混亂。
14、 漏斗圖
用梯形面積表示某個環節業務量與上一個環節之間的差異。
- 適用: 有固定流程並且環節較多的分析,可以直觀地顯示轉化率和流失率。
- 侷限: 無序的類別或者沒有流程關係的變數。
15、 瀑布圖
採用絕對值與相對值結合的方式,展示各成分分佈構成情況,比如各項生活開支的佔比情況。
- 適合: 展示資料的累計變化過程。
- 侷限: 各類別資料差別太大則難以比較。
16、 桑基圖
一種特定型別的流程圖,圖中延伸的分支的寬度對應資料流量的大小,起始流量總和始終與結束流量總和保持平衡。比如能量流動等。
- 適合: 用來表示資料的流向。
- 侷限: 不適用於邊的起始流量和結束流量不同的場景。比如使用手機的品牌變化。
- 相似圖表: 和絃圖:展現矩陣中資料間相互關係和流量變化,資料節點如果過多則不適用。
17、 箱線圖
是利用資料中的五個統計量:最小值、第一四分位數、中位數、第三四分位數與最大值來描述資料的一種方法。
- 適用: 用來展示一組資料分散情況,特別用於對幾個樣本的比較。
- 侷限: 對於大資料量,反應的形狀資訊更加模糊。
上述內容轉載於:https://zhuanlan.zhihu.com/p/54849856
分析結論
- 基礎表達:描述資料之間的對比、趨勢和結構關係
- 進階表達:在資料描述的基礎.上結合對業務的分析和理解
- 高階表達:結合業務的同時,闡述產生結論的原因和改進方向
做好資料分析報告的幾點關鍵
-
懂業務、懂產品
- 好的資料分析師必須對業務和產品邏輯瞭解清晰
- 在不瞭解業務邏輯的情況下,可能得出錯誤的結論或者盡人皆知毫無價值的常識
只有瞭解清楚了業務邏輯,才可以更好的做資料分析
-
不要盲目追求模型
- 分析方法不在於高深,不在於要做模型,描述分析一樣可以很出彩!
雖然資料分析很多模型,但是我們不止是為了將資料分析模型實現,我們分析報告應該追求美觀的、有條理的把分析結果表達出來
-
基礎資料處理很關鍵
- 摻雜髒資料,結果會有偏
由於我們資料來源於很多產品,資料清洗為落實做好就容易摻雜髒資料,導致分析結果的偏差
-
耐得住性子,才做得好分析
- 資料分析師必須很有耐心,資料執行起來可能很慢,做的過程可能會孤單
- 發現一個小紕漏,前面都得推翻重來
由於一直與資料、python、SQL打交道,有可能指令碼在執行過程中相對較慢,工作過程中可能會產生孤獨情緒
-
結論不在多,在於精
- 能捕捉眼球、推動改進現狀的結論,一個報告有一兩點就很不錯了
- 長篇大論反而不能吸引注意
杜絕長篇大論的結論報告,針對主要問題進行分析總結
如何構建企業級資料分析報告
真實案例:網際網路紅包平臺數據分析報告
從以下三個方面進行分析
- 紅包整體資料概況
- 接入紅包服務主要應用
- 紅包平臺商業化例項
分析報告選擇
針對紅包這一產品進行分析,我們選擇產品分析報告
紅包整體資料概況
報告分析:
- 紅包整體的資料展示選擇了直方圖進行展示;所展示的資料包括紅包數和使用者數
- 可以看出在2017年1月紅包數到達了一個頂峰,在2017年2月有所減緩
- 導致該現象的原因可能是2017年1月是春節期間,使用者發放的紅包數有所上漲
- 另外,針對2017年1月期間的其它緯度資料進行了詳細的描述
對春節期間紅包發放的情況進行整體介紹
- MIUI春節紅包發放的量級最大,覆蓋的使用者數最多;
- 成長體系發放的紅包數最少,但拉活效果明顯;
- 應用商店發放使用者數最少,但人均金額最高、人均個數最多;
接入紅包服務主要的應用
- 廣告曝光
接入業務:瀏覽器
形式:通過送紅包活動形式,增加廣告曝光
- 積分牆
接入業務:應用商店、簡訊等
形式:通過發紅包形式鼓勵使用者下載app
- 拼手氣
接入業務:成長體系
形式:通過發隨機紅包活動活躍使用者,鼓勵使用者去做任務升級
- 其他
接入業務:保險、理財、小貸、公交卡等
形式:多為定向紅包,給指定使用者發放紅包
紅包平臺商業化例項
MIUI春節紅包
累計發放現金紅包2227w個,發放金額31 8.5w,活動帶來收入632.5w
成長體系春節紅包
發放現金紅包178w個,發放金額67.76w,活動帶來收入163w。日均活躍345w (60.67%↑),PV 4839w( 88.48%↑),其中除夕當天最高507w(135.96%↑),PV7189w(180.02%↑),活動累計新增使用者51.8w
應用商店春節紅包
累計發放現金紅包427.5w個,發放金額118.5w,日活提升了2.4%,活動帶來收入約200w,日最高收入30w
紅包金額對使用者行為的影響
綁卡行為分析
結論:紅包發放金額越大,使用者綁卡慾望越強
新老使用者行為分析
老使用者促活比率為38.18%,核銷率為27.43%,提現率10.65%
新使用者拉新比率為3.64%,留存比率(消費)為0.86%, 提現率1.79%
結論:紅包發放起到活躍使用者的作用,使用者領取紅包金額越大,使用者活躍度越高,消費提現佔比越高,而老使用者傾向去消費,新使用者提現慾望較強;老使用者比新使用者更活躍。