一個真實案例教你運(yùn)用數(shù)據(jù)分析

9 評論 60105 瀏覽 185 收藏 24 分鐘

數(shù)據(jù)分析是產(chǎn)品經(jīng)理必備技能之一,本文以一個真實案例給大家提供了一些數(shù)據(jù)分析的思路,但還需大家自己多多思考,學(xué)以致用。

這次我們來聊聊產(chǎn)品經(jīng)理的必備技能,數(shù)據(jù)分析,這也是18年我獲得的最大收獲之一。

為什么想單獨(dú)拿出來聊聊,我歸納為三個原因:

  • 第一是重要,不重要的事誰會拿出來說不是;
  • 第二是網(wǎng)上的文章理論偏多,實際真實案例少,誰會用一大堆概念和飄在天上的話去工作;
  • 第三是對自己的復(fù)盤,算是對自己今年的一份重要的工作總結(jié)。話不多說,正文開始。

一、數(shù)據(jù)分析的作用

在切入正題之前,先來總述一下數(shù)據(jù)分析的作用。通常的答案都是什么了解產(chǎn)品現(xiàn)狀,知悉業(yè)務(wù)發(fā)展之類的,都不夠概括,嚴(yán)格定義上的數(shù)據(jù)分析作用一共有4條:

  1. 描述性分析,故名思義,主要是對已經(jīng)發(fā)生的事實用數(shù)據(jù)做出準(zhǔn)確的描述。比如某企業(yè)訂單履約率從上月的98%下降到了95%,屬于偏基礎(chǔ)類的工作;
  2. 診斷性分析,在知道了發(fā)生什么之后,更重要的是,我們要明白為什么發(fā)生。比如經(jīng)過分析,發(fā)現(xiàn)訂單履約率下降的原因是成品生產(chǎn)不出來,無法完成交付;
  3. 預(yù)測性分析,基于上述兩個層次的分析,我們發(fā)現(xiàn)了其中的規(guī)律,即原材料供應(yīng)商的送貨及時率會影響成品訂單的履約率。假如上月某原材料供應(yīng)商A送貨及時率只有70%,通過建模,我們可以預(yù)測本月該供應(yīng)商會使我們的訂單履約率下降2%;
  4. 處方性分析,有了預(yù)測性分析的結(jié)果后,我們無需再做事后諸葛亮,而可以運(yùn)籌帷幄,在事前就采取措施。上例中,供應(yīng)商A會導(dǎo)致本月我們的訂單履約率下降,我們可能采取的措施就是把A換掉,但是現(xiàn)在有B和C兩個供應(yīng)商供我們選擇,該選擇哪個呢?通過分析和計算得出:選用供應(yīng)商B會比選C的訂單履約率高1%,因此建議選擇供應(yīng)商B。

常規(guī)情況下,產(chǎn)品經(jīng)理對于數(shù)據(jù)分析只需要掌握到診斷性分析即可,根據(jù)診斷性分析結(jié)果出相應(yīng)的解決方案,后面兩個更多的是數(shù)據(jù)分析師的工作,更為專業(yè),深入。

二、一個真實的案例

在案例介紹前,再啰嗦一下我在處理數(shù)據(jù)分析工作時候的步驟:明確分析目的,數(shù)據(jù)收集,數(shù)據(jù)處理,數(shù)據(jù)分析,數(shù)據(jù)展現(xiàn),報告撰寫。

展現(xiàn)和撰寫這篇文章就不說了,因人而異。我主要說一下確定目的、數(shù)據(jù)收集和分析環(huán)節(jié):

  1. 確定目的,別以為這個就那么容易,不夸張10個人有8個不知道自己想干什么;
  2. 數(shù)據(jù)收集,其實就是定義指標(biāo),把指標(biāo)和規(guī)則定義清晰,要看活躍,幾日活躍,怎么算活躍,很大程度決定了研發(fā)的時間周期有多少,很多情況是產(chǎn)品沒有想在前面,開發(fā)過程中反復(fù)去溝通,確認(rèn)規(guī)則,導(dǎo)致數(shù)據(jù)獲取的成本異常大,延期也就在所難免了;
  3. 數(shù)據(jù)分析,要選擇科學(xué)的分析方法,目前分析方法多種多樣,對比分析、交叉分析、結(jié)構(gòu)分析、平均分析等,根據(jù)這個案例選一個最適合的數(shù)據(jù)分析方法,才能事半功倍。

案例開始,先同步一下背景,有一個內(nèi)容型的小程序,各位理解成小程序版的今日頭條即可,想要研究的是一進(jìn)入小程序默認(rèn)刷新還是手動刷新對用戶流失的影響,當(dāng)前為用戶進(jìn)入小程序后需要手動刷新,如果改成進(jìn)入后程序默認(rèn)刷新對流失有所緩解。

針對這個命題,各位都會怎么答?有可能直接就拆解目標(biāo),定義指標(biāo)進(jìn)行分析了,不好意思,可是我會先要做的是現(xiàn)狀流程圖,供我們更清晰的了解都發(fā)生了什么。

我們先從目的下手,目的有什么?從課題能獲知到的關(guān)鍵行為有刷新、流失這兩個關(guān)鍵節(jié)點,將這兩個節(jié)點連線,發(fā)現(xiàn)中間的部分是刷新后的反饋,也就是刷新有內(nèi)容,刷新沒內(nèi)容:

用戶可能的后續(xù)的行為,通過歷史數(shù)據(jù)可知,有退出行為、其它產(chǎn)品功能行為、瀏覽行為、刷新行為:

根據(jù)現(xiàn)狀需要畫流程圖一張:

Tips,產(chǎn)品經(jīng)理畫流程圖是個好習(xí)慣,會有助于自己和別人理解你要做的事,并指出問題。

Tips2,產(chǎn)品經(jīng)理的工作簡單也不簡單,簡單在于只要思考進(jìn)行決策就可以,不簡單在于如何去把問題想清楚,會刷下去一大批人。

其中退出行為分為,有效退出,無效退出,和無退出行為,有效退出定義一個有效退出時間即可,比如退出時間-進(jìn)入時間大于10秒以上。有人說了,退出不是只會有直接退出嗎,這里需要特別說一下,有交互的都已經(jīng)分離出來了,只剩退出,怎么還分,因為有可能用戶是在認(rèn)認(rèn)真真的看這屏的內(nèi)容,一屏就已經(jīng)到上次瀏覽過的,而這次新的沒有感興趣的,或者是用戶上次誤觸退出,這次重新進(jìn)入仔細(xì)觀看,依然沒有感興趣的,再退出,無效退出與之相對,在條件外迅速退出的用戶,判定為分析時要剔除的用戶數(shù)據(jù),要做細(xì),整理一下可見下表:

將上述情況,窮盡組合后,情況可見下表:

12種,并不多,接下來做什么,要發(fā)揮產(chǎn)品經(jīng)理的另一個特性了,分析,標(biāo)記每一個用戶行為的理由,并且篩選出你所關(guān)注的和你所對比的,比如:

還記得最開始的題目嗎,手動刷新改為默認(rèn)刷新對用戶的影響,我們需要從上述一大堆東西里拆出來的是你要用的,剔除掉無用信息用作分析。要的是想清楚我們要什么,以及定義清楚我們要什么,這是最難的。從交互層面來看分為刷新過和沒刷新過,可以理解為把沒刷新過的用戶變?yōu)橄到y(tǒng)幫你刷新,而原有自己刷新的用戶作為對照組,把無效退出作為結(jié)果,一般來看,無刷新肯定沒新內(nèi)容,有刷新的情況統(tǒng)一一下,最后預(yù)估出來影響范圍,一般來看,以本業(yè)務(wù)的情況,影響范圍會有在線時間、瀏覽文章數(shù)、復(fù)登情況,主要考慮的是復(fù)登,因為你擔(dān)心的是流失。

正常情況下,能做到這一點的,基本就可以結(jié)束了,納尼,結(jié)束了嗎?鋪墊了那么多。不,早著呢。如果按照5W2H進(jìn)行劃分,誰、在哪兒、做什么、什么時候、為什么做,上面的僅僅包含了做什么,還剩一堆東西還沒有呢。

先說“誰”該怎么劃分呢。通過廣義定義,我們可以區(qū)分為新用戶和老用戶,粗暴定義新用戶是從未進(jìn)入過小程序的用戶,規(guī)則為當(dāng)日生成的open id即判定為新用戶當(dāng)日活躍,無論當(dāng)天多少次再回訪,也均判定為新用戶當(dāng)日活躍;而老用戶是已經(jīng)生成open id的用戶,老用戶還可以利用活躍行為進(jìn)行分層,常規(guī)來看可以分為次日活躍、7日活躍、30日活躍、90日活躍、1年內(nèi)活躍,因為產(chǎn)品上線不足1年,故此取前幾種。

從歷史數(shù)據(jù)來看,該業(yè)務(wù)對性別可能較為敏感,對省市地區(qū)不太敏感,故此再加上性別因素,省市暫時不考慮(一會你就知道省市不考慮是救了多少人的性命)。

好,按照以上的組合,可以列出用戶分層如下表:

這還僅僅是硬性用戶分層,在考慮問題的時候,還要加上業(yè)務(wù)狀態(tài)機(jī),什么叫狀態(tài)機(jī)?就是你的用戶在當(dāng)前經(jīng)歷了哪些業(yè)務(wù)行為或者關(guān)鍵功能,你認(rèn)為與本次實驗有關(guān)的都要納入進(jìn)來,若你是開疆拓土的人,你要把所有的變量都想到,然后去搭建數(shù)倉,才能經(jīng)得起后續(xù)的多維度組合分析的折騰。

本次分析實驗不多說,只說最重要的2個業(yè)務(wù)狀態(tài)機(jī),一個是是否訂閱,一個是有無瀏覽行為,可能有些同學(xué)已經(jīng)猜出我下面要做什么了,沒錯,表格呈上:

有人說有必要這么麻煩嗎?很遺憾,產(chǎn)品經(jīng)理的價值就全在這里了,你若前期不麻煩,后期研發(fā)怎么辦,skr~~這就是僅僅4種狀態(tài)組合后的用戶分層情況list,40種情況,每種,都要對應(yīng)后續(xù)的行為進(jìn)行接入分析,因為每種人群都是可以在后續(xù)做任意動作的,所以這個分析是多維對多維,當(dāng)你都列清楚以后,你才能獲知你真正要分析的數(shù)據(jù)到底是什么,記住別怕麻煩,怕的是不夠用心。

別急,要想完成分析工作后面還有,流程狀態(tài),當(dāng)用戶進(jìn)入小程序的時候,有5種行為,加上上面4種(瀏覽行為,刷新行為,其它功能行為,退出行為),多了一個滾動行為:

且這個和上面用戶狀態(tài)不一樣,因為是流程,所以5種的流程是可以任意調(diào)換前后發(fā)生的順序的,比如不瀏覽先刷新再滾動,或者先滾動再瀏覽再刷新。而每種行為都可以再細(xì)分狀態(tài),滾動行為可以分為3種,一般滾動行為,滾動到上次瀏覽,和無滾動,想清楚了之后,接下來怎么做,沒錯,畫表格,顯而易見會非常巨大:

我沒有做流程調(diào)換,僅用初始狀態(tài)做了示意,真正展開無差別分析的話,嚴(yán)謹(jǐn)進(jìn)行可行性分析之后輸出全部狀態(tài)的,以此業(yè)務(wù)為例,極限狀態(tài)就是種可能。不過很容易就能看出,有一些是可以合并的,比如dz-72,無論怎么調(diào)換都是一樣的,這個表,對于數(shù)據(jù)可視化工具來講,就是?;鶊D,這個貨:

我們費(fèi)這么大勁是為了什么?用戶動機(jī),沒錯,上面的整理叫流程動機(jī),我們分析的時候可以從結(jié)果動機(jī)下手,需要把相似的結(jié)果動機(jī)的流程放在一組,以上述為例,結(jié)果動機(jī)就是有效退出,或者無效退出。比如編號dz1-3可能是正常用戶行為,dz4-6可能是沒刷到感興趣文章的用戶(該做啥?優(yōu)化算法?。琩z7-9好像跟我們這個測試有關(guān)系,若把這些用戶都變成有刷新行為(dz1-3)能提升多少復(fù)登數(shù)、閱讀數(shù)、在線時長(KPI)呢?這就是精細(xì)化分析。不同的順序?qū)τ诓煌膭訖C(jī)也不一樣,比如一上來就刷新的,好像就是我們優(yōu)化以后的預(yù)期情況?和哪個原始組作對比?優(yōu)化了以后能提升多少KPI指標(biāo)?是不是都能進(jìn)行預(yù)估出來?

這樣進(jìn)行的對照和對比,這樣出來的結(jié)果才是嚴(yán)謹(jǐn)?shù)?,且可控的,用于指?dǎo)你的決策。最初的對照組1和2,也可以出結(jié)果,但是你永遠(yuǎn)是個小學(xué)生的水平,而無法成一個初中生和高中生。

記住,這些工作都是在鍛煉產(chǎn)品經(jīng)理的另一個核心競爭力的技能,用戶動機(jī)判斷,包含心理層面和產(chǎn)品層面,自己要去理解用戶才有可能做好。所以反觀回去看看,最開始的流程圖覺得還叫流程圖嗎?你提的需求還叫提需求嗎(我要分析一下默認(rèn)刷新和手動刷新的流失關(guān)系,埋點就埋手動刷新數(shù)就好)?不是找打?

不過話說回來,真正用于數(shù)據(jù)分析的時候,上面嚇?biāo)廊说谋砀褚欢ú皇沁@樣整理、分析,這樣分析你自己會崩潰,并且這么提需求研發(fā)也會打死你,要求的是對產(chǎn)品經(jīng)理另一個變態(tài)能力的掌握——業(yè)務(wù)抽象能力,我一般會針對此也會抽象出下面這樣的表格直接給到研發(fā),一目了然,也可以一起查缺補(bǔ)漏:

研發(fā)只需要知道的是維度,交叉分析是你要提給或者數(shù)據(jù)分析師自己就應(yīng)該做的事,別覺得幾千種可能性很可怕,數(shù)分析師還是比較輕松應(yīng)對這些的,如果是對用戶屬性及其敏感的業(yè)務(wù),一定要把用戶逐一分層再帶入后續(xù)流程進(jìn)行分析,也就是編號ny那張表,每個屬性的用戶對后續(xù)操作的轉(zhuǎn)化率可能都是不一樣的:

你可能做了一個策略,對大多數(shù)用戶群有效,正數(shù)多負(fù)數(shù)少,大數(shù)上看來就是正數(shù)有效的:

但是這不是做增長產(chǎn)品的態(tài)度,市場增長就是要無所不用其極,從牙縫里扣東西。

拆解清楚每一個策略對用戶的正和負(fù),保留下對新策略正向的用戶群,其它用戶群進(jìn)行回滾保證不降低:

這樣持續(xù)的做下去,你的產(chǎn)品雖然復(fù)雜性越來越高,但是真的能獲得實打?qū)嵉恼J(rèn)知產(chǎn)品、分析結(jié)論和用戶增長。

這些數(shù)據(jù)維度和指標(biāo),不光代表了你的產(chǎn)品力,也代表了你提需求的水平,在規(guī)劃需求的時候這些都要想到,后續(xù)研發(fā)在進(jìn)行工作的時候才更好的預(yù)估難度和工期,否則等你的要么是沒有結(jié)論的改版,要么是暗無天日的延期。

請把需求提明白,前提是你能把你要什么想明白,別想當(dāng)然,每一個動作牽扯的因素都非常多,想清楚在動手,另外,本次的流程我僅僅局限在做關(guān)鍵動作之前的拆解,而后續(xù)的影響分析更為重要,也就是上述的回流、閱讀、在線時長等。假設(shè)你上了個策略,通過欺騙的手段讓用戶的轉(zhuǎn)化率提升了,但是總體的7日效率下跌了,這還了得,時間線短了說對其它業(yè)務(wù)、功能的影響一定要想清楚,嚴(yán)重了說你要是影響了充值功能,可怎么辦?一定要想好后果。

上述的表格僅作為示例,我就不做更詳細(xì)的拆解和分析了,感興趣的小伙伴可以接著做下去,是對初入產(chǎn)品的同學(xué)應(yīng)該會有著幫助,一定從相同的結(jié)果動機(jī)下手,找到過程動機(jī)相同的對照組,去理解用戶,這樣的進(jìn)行改版前的數(shù)據(jù)輔助分析,才能真的預(yù)估改版的合理性,需求的真?zhèn)涡浴?/p>

在得出結(jié)論后,也要學(xué)會驗證結(jié)論,可以利用交叉驗證的方法,都是可以側(cè)面去驗證結(jié)論讓分析做的更加可靠,嚴(yán)謹(jǐn)?shù)摹?/p>

三、其它的一些話

上述列舉了近期的一個案例,不是我自身的,全憑個人興趣深挖發(fā)揮,不過數(shù)據(jù)分析也不是萬能的,有一些誤區(qū)呈現(xiàn)給大家:

1. 選取的樣本容量有誤

忽略了有效用戶,囊括了無效用戶,上述案例中,若把用戶行為拆解開,能發(fā)現(xiàn)很多不一樣的特征和細(xì)節(jié),同時有時候樣本容量的原因,樣本過少會讓結(jié)果變得不可測,樣本過多也有可能只在乎少量用戶的數(shù)據(jù)忽視了整體,有時候需要制定相同的抽樣規(guī)則,減少分析結(jié)論的偏差性。

2. 錯判因果關(guān)系

錯判因果關(guān)系,商品評論多商品賣的就一定多嗎?上述案例時,你能發(fā)現(xiàn)流失少就是刷新的功勞嗎,并不一定,有時候分母不一樣才是你獲得錯誤結(jié)論的罪魁禍?zhǔn)?,在分析?shù)據(jù)的時候,正確判斷數(shù)據(jù)指標(biāo)的邏輯關(guān)系應(yīng)該找?guī)渍咧g的相關(guān)關(guān)系而不是因果關(guān)系。

3. 被數(shù)據(jù)的表達(dá)技巧所蒙蔽

在做數(shù)據(jù)分析時,我們需要警惕一些數(shù)據(jù)處理的小計倆,最小區(qū)間,上下極值,主次坐標(biāo)軸等,不要被數(shù)據(jù)的視覺效果所蒙蔽。

4. 過度依賴數(shù)據(jù)

不要過分依賴數(shù)據(jù),做一些沒有價值的數(shù)據(jù)分析,很多牛逼的產(chǎn)品決策,并非通過數(shù)據(jù)發(fā)現(xiàn)的,而是一個產(chǎn)品經(jīng)理綜合智慧的體現(xiàn)。

最后還沒有重視起數(shù)據(jù)分析的企業(yè)應(yīng)當(dāng)著重注意了,傳統(tǒng)老牌沃爾瑪就是從數(shù)據(jù)分析中獲取到了巨大的寶藏,從以下3個方向足以說明一切:

  1. 在價值認(rèn)知上,傳統(tǒng)企業(yè)需要認(rèn)識到數(shù)據(jù)分析是能夠帶來的巨大價值,且這種價值是可留存的,得天獨(dú)厚的競爭壁壘;
  2. 在方法論上,傳統(tǒng)的企業(yè)不必在不同部門里面推行數(shù)據(jù)分析的各種方法體系,這些體系已經(jīng)被歐美總結(jié)了至少30年,很多我們沒有必要重新發(fā)明;
  3. 在技術(shù)工具上,國內(nèi)已經(jīng)如雨后春筍一般生出很多數(shù)據(jù)分析平臺,工欲善其事,必先利其器,這是每個企業(yè)提高效率最好的手段和途徑,讓傳統(tǒng)企業(yè)轉(zhuǎn)型高科技企業(yè)的難度大大降低。

總結(jié)

說了那么多,希望大家不要被網(wǎng)上那么多的概念所迷惑,產(chǎn)品經(jīng)理不能為了數(shù)據(jù)分析而分析,而要將落腳點放到產(chǎn)品和用戶上。數(shù)據(jù)分析應(yīng)該幫助產(chǎn)品經(jīng)理不斷優(yōu)化產(chǎn)品設(shè)計和迭代,驅(qū)動產(chǎn)品和用戶增長,做好成本把控,風(fēng)險預(yù)測才是本質(zhì)目的。

工作中處處留心,可以避免走入很多的誤區(qū)。產(chǎn)品經(jīng)理每一個決策幾乎都要牽涉到很多方面。磨刀不誤砍柴工,多想想再去做,說不定效果更好。

上述的案例是偶然聽到的,不是自己經(jīng)歷,全憑自己興趣進(jìn)行深挖,可能會有分析不到位的地方,多多理解。希望能給各位提供良好的數(shù)據(jù)分析的思路,足以,歡迎多多交流。

#專欄作家#

吳邢一夫(微信號mystic326531548),人人都是產(chǎn)品經(jīng)理專欄作家。5年產(chǎn)品經(jīng)理工作經(jīng)驗,需求、用戶、數(shù)據(jù)有深入研究。歡迎交流想法,拒絕無意義添加好友。

本文獨(dú)家發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)本站許可,禁止轉(zhuǎn)載。謝謝合作。

題圖來自 Unsplash,基于 CC0 協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 我覺得寫的挺好呀 其實就是看多個因素的影響 不要只看刷新一個緯度所導(dǎo)致的結(jié)果

    來自北京 回復(fù)
  2. 為啥很多人喜歡反問你 我覺得這篇文章還是有點東西的

    來自廣東 回復(fù)
  3. 我也好奇為什么不做AB測試,用工具去幫你做更客觀的流量分發(fā)

    來自廣東 回復(fù)
  4. 我覺得你的實際操作很精細(xì),但是你的數(shù)據(jù)分析理念和方法我覺得還有其他更好更充分的,不過看的出來你很注重細(xì)節(jié)和執(zhí)行。不知道這一系列的分析和產(chǎn)品的完善有沒有達(dá)到增長的目的

    來自北京 回復(fù)
  5. 為什么要把無效退出作為結(jié)果設(shè)置對照組呢,數(shù)據(jù)小白還望指教,謝謝

    來自浙江 回復(fù)
    1. 我理解是無效退出算流失

      來自北京 回復(fù)
  6. 這個數(shù)據(jù)可視化工具是啥?
    為啥你的每個色塊代表的東西不一樣?

    回復(fù)
  7. 為什么不直接做ab測試

    回復(fù)
  8. 你真是好厲害啊,文章看得我熱血沸騰,這才是專業(yè)的素養(yǎng)

    來自北京 回復(fù)