冰與火之歌:數(shù)據(jù)分析的前世今生(一)

9 評(píng)論 19389 瀏覽 97 收藏 11 分鐘

依托于統(tǒng)計(jì)學(xué)的數(shù)據(jù)分析,存在許多先天性的不足,例如對(duì)數(shù)據(jù)的精確度要求很高,無法做到實(shí)時(shí)的分析等等。而當(dāng)下最時(shí)髦的數(shù)據(jù)分析——大數(shù)據(jù)分析,就能很好地彌補(bǔ)統(tǒng)計(jì)學(xué)的不足,下一期我們會(huì)講數(shù)據(jù)分析的今生——大數(shù)據(jù)。

從不會(huì)說話的死人說起

二戰(zhàn)時(shí),從戰(zhàn)火中返航的飛機(jī)的傷痕呈現(xiàn)某種規(guī)律,有的部位中彈多,有的部位中彈少。為了提高飛機(jī)的防御力,直覺上似乎應(yīng)該在彈孔密集處加強(qiáng)裝甲。

但如果僅僅根據(jù)返航的飛機(jī)上的彈孔分布,來研究該加強(qiáng)飛機(jī)的哪部分時(shí),就忽略掉了“飛機(jī)被擊落”這個(gè)篩選的過程。也就是說,能返航的飛機(jī)都是躲過防空炮火篩選的、沒有受過致命傷的。他們多中彈于翼部和尾部,而油箱和駕駛員倉(cāng)位完好,這恰恰說明翼部和尾部不是致命傷,不應(yīng)該加強(qiáng);而油箱和駕駛員倉(cāng)位受傷的飛機(jī),基本沒有活著回來的,因此油箱和駕駛員倉(cāng)位才是真正致命的地方,這些部位受傷的飛機(jī)卻因?yàn)楸粨袈涠缓Y出研究樣本,從而變成了“不會(huì)說話的死人”。

下圖為沃爾德在論文中計(jì)算飛機(jī)被擊落概率的方法:

從二戰(zhàn)飛機(jī)的故事,我們可以看到,同樣的數(shù)據(jù),都能得出完全不同的判斷。而如何做出正確的判斷,則取決于人的數(shù)據(jù)分析能力。這個(gè)系列,我會(huì)闡述經(jīng)典的數(shù)據(jù)分析方法以及當(dāng)下流行的數(shù)據(jù)分析方法,即以統(tǒng)計(jì)學(xué)為基礎(chǔ)的數(shù)據(jù)分析,和以大數(shù)據(jù)為基礎(chǔ)的數(shù)據(jù)分析。

數(shù)據(jù)分析的前世:統(tǒng)計(jì)學(xué)

三百多年前,一個(gè)名叫約翰·格朗特(John Graunt)的英國(guó)縫紉用品商提出了一個(gè)很有新意的方法,推算出鼠疫時(shí)期倫敦的人口數(shù),而這種方法就是后來的統(tǒng)計(jì)學(xué)。他利用教區(qū)死亡記錄數(shù)據(jù)來估計(jì)倫敦的人口,每年倫敦大約有13000葬禮,每十一個(gè)家庭平均每年3人死亡,家庭平均8個(gè)人,因此倫敦的人口約為384000。采用這個(gè)方法,人們可以利用少量有用的樣本信息來獲取人口的整體情況。由此我們可以得出統(tǒng)計(jì)學(xué)的定義:

統(tǒng)計(jì)學(xué)是通過搜索、整理、分析、描述數(shù)據(jù)等手段,以達(dá)到推斷所測(cè)對(duì)象的本質(zhì),甚至預(yù)測(cè)對(duì)象未來的一門綜合性科學(xué)。

統(tǒng)計(jì)學(xué)的分析方法

所有優(yōu)秀的分析師,無論專長(zhǎng)及目標(biāo)如何,都會(huì)在工作過程中按順序執(zhí)行以下流程,同時(shí)通過經(jīng)驗(yàn)數(shù)據(jù)來推敲各種問題。熟悉地運(yùn)用這套流程,把它變成你的第二本能,你會(huì)發(fā)現(xiàn),無論面對(duì)多么復(fù)雜的問題,都可以引刃而解。

1. 確定問題

數(shù)據(jù)分析的核心目的,是為了解決已知的某種問題,例如:

  • 堅(jiān)果PRO今年的銷量會(huì)達(dá)到多少
  • 滴滴進(jìn)軍海外市場(chǎng)的第一站該選擇哪里
  • 朝鮮對(duì)于韓國(guó)部署薩德系統(tǒng)的態(tài)度是怎樣的

然而,并不是所有人都清楚他們需要解決的問題,未明確定義自己的問題或目標(biāo)就開始進(jìn)行數(shù)據(jù)分析就如同未定下目的地就上路旅行一樣。

我們來看看客戶對(duì)數(shù)據(jù)分析師常常提的問題之一:

這個(gè)問題表面上非常清楚,客戶只是想要你“提升銷量”而已,但這只是最初答案,你需要盡量多從他那里多了解一些信息,才能確定問題

  • 你想要提升多少銷量
  • 公司之前是否有提升銷量的策略和方法
  • 你覺得當(dāng)前的目標(biāo)銷量合理嗎
  • 我們的競(jìng)爭(zhēng)對(duì)手銷量如何
  • 第三季度的銷售數(shù)據(jù)與第二季度的有很大差異,原因是什么

作為一個(gè)數(shù)據(jù)分析師,你對(duì)客戶了解越深,你的分析才越有可能派上用場(chǎng)。所以,在溝通之前,你可以構(gòu)建客戶的用戶畫像,這能幫助你更好地溝通并理解客戶的需求:

2. 分析

當(dāng)我們明確問題,并根據(jù)問題收集好需要的數(shù)據(jù)后,就可以開始分析。而分析的關(guān)鍵點(diǎn)在于分解

2.1 分解問題

你需要把問題分解為可管理、可解決的組塊,以之前提到的“滴滴進(jìn)軍海外市場(chǎng)的第一站該選擇哪里”為例,借助思維導(dǎo)圖,我們可以對(duì)問題做以下分解:

2.2 分解數(shù)據(jù)

同樣的道理,你需要把數(shù)據(jù)分解為更小的組塊,而這里分解的核心在于高效的比較因子,即找出重要數(shù)據(jù)之間的因果關(guān)系/相關(guān)關(guān)系。找出高效的比較因子的方法有很多,感興趣的同學(xué)可以看看《深入淺出數(shù)據(jù)分析》這本書。

3. 評(píng)估

評(píng)估,根據(jù)你分解的問題組塊以及數(shù)據(jù),通過比較,并根據(jù)經(jīng)驗(yàn)或者理論知識(shí)做出假設(shè)的過程。

4. 決策

決策,即為對(duì)你的評(píng)估結(jié)果進(jìn)行總結(jié),并向客戶提出建議或者方案。對(duì)決策內(nèi)容的表述,建議采用麥肯錫公司的金字塔結(jié)構(gòu)。

以一家B2B電商公司為例

以我曾經(jīng)工作過的一家B2B電商公司為例,當(dāng)時(shí)上層提出的問題是想要提升廣告的收入。

1. 明確問題

即上層對(duì)于提升廣告收入的一些想法和顧忌:

  • 希望廣告收入提升30%
  • 不希望廣告影響用戶體驗(yàn)
  • 目前廣告流量約占網(wǎng)站流量的5%
  • 我們的收費(fèi)模式為CPC模式,之前采用過CPM、CPT模式,但是效果不好

2. 分析問題

我們需要確定提升廣告收入的方法:

通過這個(gè)公式,我們知道了廣告收入的比較因子為:廣告流量與廣告點(diǎn)擊率,由此可以對(duì)數(shù)據(jù)進(jìn)一步細(xì)分拆解:

廣告流量:

  • 廣告都分布在什么頁(yè)面上?
  • 每個(gè)頁(yè)面的廣告流量是多少?
  • 每個(gè)頁(yè)面的自然流量是多少?

點(diǎn)擊率:

  • 每個(gè)頁(yè)面的廣告點(diǎn)擊率是多少?
  • 每種形式的廣告點(diǎn)擊率是多少?
  • 近三個(gè)月廣告點(diǎn)擊率的變化趨勢(shì)是什么?

3. 評(píng)估

通過對(duì)問題和數(shù)據(jù)的拆解,我們發(fā)現(xiàn)一個(gè)很有意思的現(xiàn)象:

企業(yè)黃頁(yè)的點(diǎn)擊率遠(yuǎn)高于其他頁(yè)面,然而廣告流量?jī)H占廣告流量的5%。隨后,我們對(duì)客戶進(jìn)行了訪談,發(fā)現(xiàn)B端客戶的生意都是幾十上百萬的,他們?cè)谫?gòu)買商品前普遍都會(huì)查詢企業(yè)的資質(zhì)以及相關(guān)信息,這也就是為什么企業(yè)黃頁(yè)點(diǎn)擊率遠(yuǎn)高于其他頁(yè)面的原因。

4. 決策

根據(jù)上述的情況,我們向產(chǎn)品團(tuán)隊(duì)提出了下述兩個(gè)意見:

  1. 將其他頁(yè)面的流量引導(dǎo)到企業(yè)黃頁(yè)
  2. 優(yōu)化其他頁(yè)面,突出顯示企業(yè)的資質(zhì)信息

最后,產(chǎn)品團(tuán)隊(duì)采納了我們的建議,下一個(gè)月的廣告收入同比提升50%。

統(tǒng)計(jì)學(xué)的局限性

當(dāng)然,依托于統(tǒng)計(jì)學(xué)的數(shù)據(jù)分析,存在許多先天性的不足,例如對(duì)數(shù)據(jù)的精確度要求很高,無法做到實(shí)時(shí)的分析等等。而當(dāng)下最時(shí)髦的數(shù)據(jù)分析——大數(shù)據(jù)分析,就能很好地彌補(bǔ)統(tǒng)計(jì)學(xué)的不足,下一期我們會(huì)講數(shù)據(jù)分析的今生——大數(shù)據(jù)。

 

作者:曹思龍,微信公眾號(hào):及策云課堂。Admaster產(chǎn)品經(jīng)理,畢業(yè)于北京郵電大學(xué),知乎專欄作者

本文由 @曹思龍 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 期待后續(xù) ??

    來自廣東 回復(fù)
    1. 第二篇:http://theventurebank.com/data-analysis/686309.html

      來自北京 回復(fù)
  2. 寫的不錯(cuò),數(shù)據(jù)很美。

    回復(fù)
    1. 感謝贊美,可以關(guān)注我的微信公眾號(hào),每周更新數(shù)據(jù)分析相關(guān)內(nèi)容 ??

      來自北京 回復(fù)
  3. 受教了,正想了解數(shù)據(jù)分析相關(guān)的知識(shí)

    來自上海 回復(fù)
    1. 第二篇:http://theventurebank.com/data-analysis/686309.html

      來自北京 回復(fù)
  4. 挺不錯(cuò)的,下一篇關(guān)于大數(shù)據(jù)分析的什么時(shí)候更? ??

    來自廣東 回復(fù)
    1. 不出意外,應(yīng)該在本周 ??

      來自北京 回復(fù)
    2. 第二篇:http://theventurebank.com/data-analysis/686309.html

      來自北京 回復(fù)