從0-1搭建用戶畫像系統(tǒng)的設計思路
編輯導語:如今在這個大數(shù)據(jù)時代,我們經(jīng)常會被“標簽化”,最常見的就是你逛淘寶時,會根據(jù)你的興趣愛好等等特征進行推薦;本文是作者分享的關于從0到1搭建用戶畫像系統(tǒng)的設計思路,我們一起來學習一下。
一、需求目的
1)商城已上線2周年,已有10萬+在售物品;數(shù)據(jù)倉庫中積累著大量的業(yè)務數(shù)據(jù)、日志數(shù)據(jù)及埋點數(shù)據(jù);如何充分挖掘沉淀在數(shù)據(jù)倉庫中的數(shù)據(jù)的價值,有效的支持用戶畫像的建設,成為當前的重要工作。
2)在保證用戶規(guī)模不斷增長的目標下,運營方考慮建立用戶流失預警機制,及時識別將要流失的用戶群體,及時采取運營策略換回用戶。
二、產(chǎn)品結構
三、用戶畫像系統(tǒng)搭建流程
目前團隊已經(jīng)搭建了比較成熟的數(shù)據(jù)倉庫。也就是說已經(jīng)有結構化的、清晰的用戶屬性、用戶行為相關數(shù)據(jù)。
在此基礎上,搭建用戶畫像系統(tǒng),需要:
四、數(shù)據(jù)建模
對人、貨、場進行分析,對用戶個體的性質和特征做出概括,形成相應的用戶屬性標簽、用戶行為標簽后。才可以開始建模。
建模需要分別從定性、定量,兩個方面入手:
- 定性:在從已有數(shù)據(jù)中心,選擇特征;假設這些特征與你要預測的值有一個關系,這個關系就是一個原始的模型。
- 定量:確定模型中涉及到的所有未知系數(shù)。
模型計算完成后,需要計算模型的置信度;此時根據(jù)測試數(shù)據(jù)(可以是團隊內部測試、灰度測試等方式),來判斷模型計算的結果,與預期是否相符。
如果相符,就可以用這個模型來預測用戶喜歡什么;如果與預期不相符,那么久需要重復上述過程。
比如商城系統(tǒng)中,有以下數(shù)據(jù)項:
用戶忠誠度指標(L),與用戶活躍度、購物車商品數(shù)、收藏數(shù)、下單數(shù)、在線時長的用戶行為指標有一定的關系;將這5項數(shù)據(jù)指標的熵權值,定義為用戶忠誠度指標,可以用以下公式表示:
其中a表示上表中A2-A6的歸一化值,歸一化計算公式如下:
w表示權重。權重系數(shù)計算公式如下:
其中,e為行為數(shù)據(jù)信息熵,計算公式如下:
最終計算所有的用戶的指標L后,例如可以取前25%為高忠誠用戶,25-50%為普通忠誠用戶,剩余為低忠誠用戶,取值范圍可以根據(jù)業(yè)務實際情況調整。
另外,由于權重系數(shù),有可能隨時間的增加而衰減;所以如果需要,還需要定義衰減因子r;加入衰減因子后,標簽權重=衰減因子*行為權重。
五、梳理用戶畫像維度
設計用戶畫像維度時,建議使用MECE(Mutually Exclusive Collectively Exhaustive)準則;也就是對于一個重大的議題,能夠做到不重疊、不遺漏的分類,而且能夠借此有效把握問題的核心,并成為有效解決問題的方法。
比如初步搭建用戶畫像維度,可以參考下圖:
上圖為商城系統(tǒng),初步的用戶畫像維度。圖中的數(shù)據(jù),按照獲取的方式,可以分為:統(tǒng)計類標簽、規(guī)則類標簽、挖掘類標簽。
統(tǒng)計類標簽:這類標簽是最為基礎也最為常見的標簽類型,例如對于某個用戶來說,他的性別、年齡、城市、星座、近7日活躍時長、近7日活躍天數(shù)、近7日活躍次數(shù)等字段可以從用戶注冊數(shù)據(jù)、用戶訪問、消費類數(shù)據(jù)中統(tǒng)計得出;該類標簽構成了用戶畫像的基礎。
規(guī)則類標簽:該類標簽基于用戶行為及確定的規(guī)則產(chǎn)生;例如對平臺上“消費活躍”用戶這一口徑的定義為近30天交易次數(shù)>=2,在實際開發(fā)畫像的過程中,由于運營人員對業(yè)務更為熟悉、而數(shù)據(jù)人員對數(shù)據(jù)的結構、分布、特征更為熟悉;因此規(guī)則類標簽的規(guī)則確定由運營人員和數(shù)據(jù)人員共同協(xié)商確定。
挖掘類標簽:該類標簽通過數(shù)據(jù)挖掘產(chǎn)生,應用在對用戶的某些屬性或某些行為進行預測判斷;例如根據(jù)一個用戶的行為習慣判斷該用戶是男性還是女性,根據(jù)一個用戶的消費習慣判斷其對某商品的偏好程度;該類標簽需要通過算法挖掘產(chǎn)生。
六、形成初步用戶畫像
基于用戶畫像數(shù)據(jù),可以使運營人員、營銷人員,有更好的用戶認識,帶來更佳的用戶服務質量,實現(xiàn)精準運營、精準營銷。
設計用戶畫像的可視化展現(xiàn)時,可以使用以下工具:
其中tableau、powerbi等自助式數(shù)據(jù)分析工具,可以讓沒有編程經(jīng)驗的業(yè)務人員、運營人員等進行自我數(shù)據(jù)分析,不需要依賴IT人員。
七、評估用戶畫像效果
在初步形成了用戶畫像后,并不能直接交給運營、業(yè)務人員實際使用,還需要評估用戶畫像的準確性。
評估方式主要分為3種:邏輯驗證、A/B test、用戶回訪。
邏輯驗證:也叫做交叉驗證;在完整的用戶畫像標簽體系中,一些標簽往往會存在一些相關性;比如用戶的累計在線時長越長,訂單量通常會越高;比如購買3C產(chǎn)品的用戶群中,男性用戶數(shù)通常大于女性用戶數(shù);另外,如果公司購買了第三方機構的數(shù)據(jù),也可用于交叉驗證。
A/B test:也叫做灰度測試;以上述的忠誠度為例,保證對照組、實驗組的流量相同;對實驗組的用戶,進行提升忠誠度的運營策略(促銷活動、積分獎勵等);如果實驗組的用戶,忠誠度相比對照組用戶,有一定提升,則可以認為用戶畫像比較精確。
用戶回訪:最樸實的評估方法,比如用戶畫像系統(tǒng),定義了10萬用戶為低忠誠度用戶;此時從中隨機抽取1000人,交給客服,進行回訪。根據(jù)回訪結果,判斷用戶畫像結果是否準確;甚至可以對回訪結果進行文本挖掘,形成詞云,查看消極詞的占比。
八、總結
當公司業(yè)務規(guī)模,用戶體量上升到一定量級;業(yè)務、運營團隊,往往會提出對用戶精準運營的想法;此時就需要用戶畫像系統(tǒng),在支持業(yè)務運營的同時,也可以幫助產(chǎn)品經(jīng)理更好的了解用戶。
0-1搭建用戶畫像系統(tǒng),需要在已有比較成熟的數(shù)據(jù)倉庫的前提下進行:
- 數(shù)據(jù)建模:根據(jù)業(yè)務模式,設計相應的數(shù)據(jù)模型
- 梳理用戶畫像維度:不重疊、不遺漏的梳理用戶標簽體系
- 形成初步用戶畫像:可以使用tableau、powerBI、echarts等多種工具,生成可視化的用戶畫像
- 評估用戶畫像效果;通過邏輯驗證、A/B測試、用戶回訪等方式,驗證用戶畫像系統(tǒng)中的標簽是否準確
- 根據(jù)評估效果,持續(xù)優(yōu)化用戶標簽系統(tǒng)
本文由 @16哥 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉載。
題圖來自 unsplash,基于 CC0 協(xié)議
贊~