從BAT看企業(yè)構(gòu)建大數(shù)據(jù)體系的六層級

0 評論 12743 瀏覽 69 收藏 10 分鐘

小編按:很“干貨”的一篇講大數(shù)據(jù)在中國巨頭公司如何落地的文章,從業(yè)務架構(gòu),平臺架構(gòu),甚至算法層都做了剖析,原文據(jù)說是內(nèi)訓PPT,對于需要在項目中落地“大數(shù)據(jù)”的朋友有相當?shù)慕梃b意義。

本文將企業(yè)大數(shù)據(jù)體系的構(gòu)建分為六個層級,但并非是線性過程,每個層級之間或有基礎關系,但并不是說一定要逐層構(gòu)建。例如創(chuàng)業(yè)型公司,在缺乏數(shù)據(jù)研發(fā)實力的時候,多數(shù)會借助第三方平臺進行數(shù)據(jù)上報與分析。

下面一張圖,是本文的精華概括,后面一一展開與大家探討。

本文將企業(yè)大數(shù)據(jù)體系的構(gòu)建分為六個層級,但并非是線性過程,每個層級之間或有基礎關系,但并不是說一定要逐層構(gòu)建。例如創(chuàng)業(yè)型公司,在缺乏數(shù)據(jù)研發(fā)實力的時候,多數(shù)會借助第三方平臺進行數(shù)據(jù)上報與分析。

下面一張圖,是本文的精華概括,后面一一展開與大家探討。

data2一、數(shù)據(jù)基礎平臺

基礎的數(shù)據(jù)平臺建設工作,包含數(shù)據(jù)平臺建設,數(shù)據(jù)規(guī)范,數(shù)據(jù)倉庫、產(chǎn)品數(shù)據(jù)規(guī)范,產(chǎn)品ID,用戶ID,統(tǒng)一SDK等。

很多公司的數(shù)據(jù)無法有效利用,就是缺乏統(tǒng)一規(guī)范,產(chǎn)品數(shù)據(jù)上報任由開發(fā)按照自己的理解和習慣上報,沒有標準化的SDK和上報協(xié)議,并且數(shù)據(jù)散落在各個部門產(chǎn)品的服務器,無法構(gòu)建結(jié)構(gòu)化的數(shù)據(jù)倉庫。

做數(shù)據(jù)平臺的架構(gòu),很多人會理解為高大上的技術活,其實整個數(shù)據(jù)平臺價值的體現(xiàn),需要公司各個部門的配合,例如關鍵數(shù)據(jù)指標體系的建立,需要從各個部門業(yè)務指標進行提煉,并得到業(yè)務部門認可。常見的關鍵指標有:DAU、PCU、WAU、MAU、按天留存率(1-30日留存)、累計留存率(7日、14日、30日累計留存率),新增用戶,有效新增用戶,活躍轉(zhuǎn)化率,付費轉(zhuǎn)化率,收入指標,ARPU人均收入,渠道效果數(shù)據(jù)等。

下圖是騰訊和阿里的數(shù)據(jù)平臺架構(gòu)。
data3阿里大數(shù)據(jù)業(yè)務架構(gòu):

data4

阿里云梯分布式計算平臺整體架構(gòu):

data5二、數(shù)據(jù)報表與可視化

在第一層級中,進行數(shù)據(jù)指標體系規(guī)范,統(tǒng)一定義,統(tǒng)一維度區(qū)分,就可以很方便的進行標準化可配置數(shù)據(jù)報表設計,直觀的可視化輸出設計,包括行為、收入、性能、質(zhì)量等多種數(shù)據(jù)類別。

在PPT中以友盟、迅雷、百度、騰訊等公司的數(shù)據(jù)報表體系進行詳細講解。

騰訊數(shù)據(jù)門戶

data6

阿里數(shù)據(jù)地圖

data7

三、產(chǎn)品與運營分析

在建立數(shù)據(jù)平臺和可視化基礎上,對已有的用戶行為、收入數(shù)據(jù)等進行各種分析,輸出日報、周報、月報、各種專題分析報告。常見的數(shù)據(jù)分析工作如下:

1. A/B TEST進行產(chǎn)品分析優(yōu)化;

2. 運用漏斗模型進行用戶觸達分析,如TIPS、廣告等曝光到活躍的轉(zhuǎn)化;

3. 收入效果監(jiān)控與分析,包含付費轉(zhuǎn)化率、渠道效果數(shù)據(jù)等;

4. 業(yè)務長期健康度分析,例如從用戶流動模型、產(chǎn)品生命周期分析產(chǎn)品成長性和健康度;

5. 營銷推廣活動的實時反饋;

用戶畫像也是常見的數(shù)據(jù)分析方式,包括用戶如性別、年齡、行為、收入、興趣愛好、消費行為、上網(wǎng)行為、渠道偏好、行為喜好、生活軌跡與位置等,反映用戶各種特征,以達到全面的了解用戶,針對性的為用戶提供個性化服務的目的,通常每半年做一次用戶畫像的專題分析。

下圖是常見的數(shù)據(jù)分析思路

data8

常用分析工具:EXCLE,SPSS,SAS,Enterprise Miner,Clementine,STATISTICA。個人用的比較多的是:EXCEL和SPSS。

下圖是SPSS常用的數(shù)據(jù)分析與挖掘方法

data9

四、精細化運營平臺

基于數(shù)據(jù)基礎上搭建的精細化運營平臺,主要的平臺邏輯多數(shù)是進行用戶細分,商品和服務細分,通過多種推薦算法的組合優(yōu)化進行商品和服務的個性化推薦。另外還有針對不同產(chǎn)品生命周期,用戶生命周期構(gòu)建的產(chǎn)品數(shù)據(jù)運營體系。

data10

五、數(shù)據(jù)產(chǎn)品

廣義的數(shù)據(jù)產(chǎn)品非常多,例如搜索類,天氣預報類等等。這里主要講狹義的數(shù)據(jù)產(chǎn)品,以BAT三家公司的數(shù)據(jù)產(chǎn)品為例進行分享。

騰訊:廣點通、信鴿

阿里:數(shù)據(jù)魔方、淘寶情報、淘寶指數(shù)、在云端

百度:百度預測、百度統(tǒng)計、百度指數(shù)、百度司南、百度精算

截取幾張PPT如下:

data11

data12

data13

data14

?六、戰(zhàn)略分析與決策

戰(zhàn)略分析與決策層,更多的是跟很多傳統(tǒng)的戰(zhàn)略分析、經(jīng)營分析層面的方法論相似,最大的差異是數(shù)據(jù)來自于大數(shù)據(jù)。

有很多企業(yè)錯誤的把“業(yè)務運營監(jiān)控層”和“用戶/客戶體驗優(yōu)化層”做的事情放在經(jīng)營分析或者戰(zhàn)略分析層來做。傅志華認為“業(yè)務運營監(jiān)控層”和“用戶/客戶體驗優(yōu)化層”更多的是通過機器、算法和數(shù)據(jù)產(chǎn)品來實現(xiàn)的,“戰(zhàn)略分析”、“經(jīng)營分析”更多的是人來實現(xiàn)。很多企業(yè)把機器能做的事情交給了人來做,這樣導致發(fā)現(xiàn)問題的效率較低。

建議是,能用機器做的事情盡量用機器來做好“業(yè)務運營監(jiān)控層”和“用戶/客戶體驗優(yōu)化層”,在此基礎上讓人來做人類更擅長的經(jīng)驗分析和戰(zhàn)略判斷。

在變化極快的互聯(lián)網(wǎng)領域,在業(yè)務的戰(zhàn)略方向選擇上,數(shù)據(jù)很難預測業(yè)務的大發(fā)展方向,如果有人說微信這個大方向是通過數(shù)據(jù)挖掘和分析研究出來,估計產(chǎn)品經(jīng)理們會笑了。從本質(zhì)上來說,數(shù)據(jù)在精細化營銷和運營中能起到比較好的作用,但在產(chǎn)品策劃、廣告創(chuàng)意等創(chuàng)意性的事情上,起到的作用較小。但一旦產(chǎn)品創(chuàng)意出來,就可以通過灰度測試,數(shù)據(jù)驗證效果了。

來源:虎嗅網(wǎng) 作者:BLUES

 

更多精彩內(nèi)容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!