站在數(shù)據(jù)產(chǎn)品經(jīng)理角度,說說“業(yè)務(wù)診斷”
數(shù)據(jù)產(chǎn)品經(jīng)理需要做的事情,可能是讓數(shù)據(jù)會“說話”,按照本文作者的看法,即讓數(shù)據(jù)從“信息化”變?yōu)椤爸悄芑?,讓?shù)據(jù)從“展示”變?yōu)椤爸笇?dǎo)”。這個過程,可能就要涉及到業(yè)務(wù)診斷了。怎么理解呢?不妨來看看作者的解答。
一、前言
在3-4年的那個階段,是我最迷茫的時候。那時已經(jīng)接觸了大部分?jǐn)?shù)據(jù)產(chǎn)品相關(guān)工作,做平臺、工具、報表、大屏、提數(shù)、標(biāo)簽,并且對數(shù)倉、數(shù)據(jù)分析、需求把控、優(yōu)先級排序、項目管理、價值提煉也有了一些認(rèn)識,看似做了足夠多的事情。但似乎終究是被業(yè)務(wù)裹挾著跑,業(yè)務(wù)的極速增長就同步裹挾著需求的增長,無數(shù)的報表需求、取數(shù)需求撲面而來。
數(shù)據(jù)產(chǎn)品經(jīng)理的價值到底是什么?終極目標(biāo)是什么?數(shù)據(jù)團(tuán)隊對業(yè)務(wù)來說,到底是價值還是成本?時至今日其實也還沒有問題的答案,但通過工作中的部分實踐、以及業(yè)內(nèi)一些資深數(shù)據(jù)產(chǎn)品的思考。目前我的理解是:泛化數(shù)據(jù)給使用的人,把分析的理念和框架變成數(shù)據(jù)產(chǎn)品,讓數(shù)據(jù)“說話”。
聽上去很抽象,簡單來說就是從“信息化”變?yōu)椤爸悄芑保瑥摹皵?shù)據(jù)展示”變?yōu)椤爸笇?dǎo)方針”。因此就有了這章的內(nèi)容,我把它分為3個部分,「業(yè)務(wù)診斷」「業(yè)務(wù)決策」「業(yè)務(wù)預(yù)測」。
- 業(yè)務(wù)診斷:對業(yè)務(wù)異動進(jìn)行診斷,講清楚為什么發(fā)生(發(fā)現(xiàn)問題,定位原因)
- 業(yè)務(wù)決策:對于已經(jīng)出現(xiàn)的現(xiàn)狀,給出具體的執(zhí)行動作(直接告訴怎么做)
- 業(yè)務(wù)預(yù)測:預(yù)測未來將要發(fā)生什么
接下來先介紹「業(yè)務(wù)診斷」的部分:
二、典型場景
增長產(chǎn)品昨天發(fā)現(xiàn)C端營收,下降嚴(yán)重,老板要求快速找到原因,大概流程如下:
1)找運營、產(chǎn)品等部門問問,昨天有沒有重要動作;再找技術(shù)排查下是否存在技術(shù)故障;
2)問下來沒有異常,嘗試自己通過報表數(shù)據(jù)進(jìn)行分析。
- 「單指標(biāo)多維度分析」:先看一級商品類型波動,再看二級商品類型波動,再看訂單頁面來源波動等等,觀察是否有異常波動
- 「多指標(biāo)相關(guān)性分析」:看活躍用戶數(shù)、注冊用戶數(shù)等相關(guān)性指標(biāo)3)思緒混亂,提工單給分析師排查
人工排查通常會耗費大量時間,異動分析過程實際可以泛化為數(shù)據(jù)產(chǎn)品,交給機(jī)器來做,下面介紹「單指標(biāo)多維度分析」自動診斷方法。
三、自動診斷方法
「單指標(biāo)多維度分析」難點:
- 如何找到異動的關(guān)鍵維度;
- 找到關(guān)鍵維度后如何找到關(guān)鍵維度值。
解決思路:
- 通過現(xiàn)期和基期對比,看異動情況(通過趨勢圖);
- 定位影響異動最大的維度是哪個(通過基尼系數(shù));
- 定位每個維度下哪個維度值影響最大(通過貢獻(xiàn)度)。
1. 基尼系數(shù)定位異常維度
基尼系數(shù)系數(shù)定義:衡量財富分配是否均勻的指標(biāo),將拿到的收入數(shù)據(jù)從小到大排列,x軸代表人數(shù)占比的累加,y軸代表收入占比的累加,繪制出一條洛倫茲曲線,計算圖中A區(qū)域的面積占比,該占比就是基尼系數(shù),即A/A+B。基尼系數(shù)越大,代表收入差異越大。
基于此,構(gòu)建基于基尼系數(shù)的定位維度問題的方案,用于計算各下鉆維度方案對單個指標(biāo)波動的影響程度,x軸用特征分組基期累計占比,y軸用波動值累計占比(可以為負(fù)值),基尼系數(shù)越大說明該特征對波動的解釋效果越好。
這里引申出2個概念,特征分組基期累計占比(權(quán)重) 和 波動值累計占比(影響因子),下圖為示例解釋:
由圖可知,當(dāng)權(quán)重和影響因子越接近,基尼系數(shù)越趨近于0,基尼系數(shù)計算公式(火山引擎應(yīng)用):
舉例驗證,造成異動維度 支付平臺>商品>支付方式>國家>渠道
2. 貢獻(xiàn)度定位異常維度值
在3.1中描述基尼系數(shù)時,已經(jīng)引入貢獻(xiàn)度計算邏輯,即某維度值貢獻(xiàn)度=(該維度值現(xiàn)期的值-該維度值基期的值)/(大盤現(xiàn)期的值-大盤基期的值)。
四、產(chǎn)品實例(火山引擎)
第一步 :在折線圖中,發(fā)現(xiàn)最近一天的GMV突然下降,點擊下降的數(shù)據(jù)點,進(jìn)行歸因分析
第二步 :歸因分析計算完成,點擊查看歸因結(jié)果。
第三步 :查看歸因結(jié)果,最近一段時間GMV波動異常,默認(rèn)和前一月的數(shù)據(jù)進(jìn)行比較,數(shù)據(jù)下降了22.61%,按照引起下降的貢獻(xiàn)對維度進(jìn)行排名,發(fā)現(xiàn)sale_city的系數(shù)為0.56,是重要的影響因素,就可以針對這個區(qū)域的銷售情況進(jìn)行篩選并經(jīng)一步分析。
本文由 @起司Criss 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
你好!請問下舉例驗證中的第4張表(帶有負(fù)值的支付方式表)中的計算過程是否有誤?支付方式B的影響因子應(yīng)該是100%而不是60%吧。
如果有誤,修正后的基尼系數(shù)還是0.39嗎?
文章寫的非常清晰!給作者點贊!請教一個小小的問題,在計算基尼系數(shù)的時候,每個維值的權(quán)重是如何定義or計算的呀?引入權(quán)重的作用又是啥嘞
每個維度值的權(quán)重,即每個維度值基期占比。作用在于通過權(quán)重先定位基期的“貧富差距”,貧窮維度影響因子大,富裕維度影響因子小,才能定位異常。
明白了!感謝大佬!