從0-1搭建用戶畫像系統(tǒng)的設計思路

16哥
1 評論 18799 瀏覽 102 收藏 11 分鐘
🔗 B端产品需要更多地依赖销售团队和渠道合作来推广产品,而C端产品需要更多地利用网络营销和口碑传播来推广产品..

編輯導語:如今在這個大數(shù)據(jù)時代,我們經(jīng)常會被“標簽化”,最常見的就是你逛淘寶時,會根據(jù)你的興趣愛好等等特征進行推薦;本文是作者分享的關于從0到1搭建用戶畫像系統(tǒng)的設計思路,我們一起來學習一下。

一、需求目的

1)商城已上線2周年,已有10萬+在售物品;數(shù)據(jù)倉庫中積累著大量的業(yè)務數(shù)據(jù)、日志數(shù)據(jù)及埋點數(shù)據(jù);如何充分挖掘沉淀在數(shù)據(jù)倉庫中的數(shù)據(jù)的價值,有效的支持用戶畫像的建設,成為當前的重要工作。

2)在保證用戶規(guī)模不斷增長的目標下,運營方考慮建立用戶流失預警機制,及時識別將要流失的用戶群體,及時采取運營策略換回用戶。

二、產(chǎn)品結構

三、用戶畫像系統(tǒng)搭建流程

目前團隊已經(jīng)搭建了比較成熟的數(shù)據(jù)倉庫。也就是說已經(jīng)有結構化的、清晰的用戶屬性、用戶行為相關數(shù)據(jù)。

在此基礎上,搭建用戶畫像系統(tǒng),需要:

四、數(shù)據(jù)建模

對人、貨、場進行分析,對用戶個體的性質和特征做出概括,形成相應的用戶屬性標簽、用戶行為標簽后。才可以開始建模。

建模需要分別從定性、定量,兩個方面入手:

  • 定性:在從已有數(shù)據(jù)中心,選擇特征;假設這些特征與你要預測的值有一個關系,這個關系就是一個原始的模型。
  • 定量:確定模型中涉及到的所有未知系數(shù)。

模型計算完成后,需要計算模型的置信度;此時根據(jù)測試數(shù)據(jù)(可以是團隊內部測試、灰度測試等方式),來判斷模型計算的結果,與預期是否相符。

如果相符,就可以用這個模型來預測用戶喜歡什么;如果與預期不相符,那么久需要重復上述過程。

比如商城系統(tǒng)中,有以下數(shù)據(jù)項:

用戶忠誠度指標(L),與用戶活躍度、購物車商品數(shù)、收藏數(shù)、下單數(shù)、在線時長的用戶行為指標有一定的關系;將這5項數(shù)據(jù)指標的熵權值,定義為用戶忠誠度指標,可以用以下公式表示:

其中a表示上表中A2-A6的歸一化值,歸一化計算公式如下:

w表示權重。權重系數(shù)計算公式如下:

其中,e為行為數(shù)據(jù)信息熵,計算公式如下:

最終計算所有的用戶的指標L后,例如可以取前25%為高忠誠用戶,25-50%為普通忠誠用戶,剩余為低忠誠用戶,取值范圍可以根據(jù)業(yè)務實際情況調整。

另外,由于權重系數(shù),有可能隨時間的增加而衰減;所以如果需要,還需要定義衰減因子r;加入衰減因子后,標簽權重=衰減因子*行為權重。

五、梳理用戶畫像維度

設計用戶畫像維度時,建議使用MECE(Mutually Exclusive Collectively Exhaustive)準則;也就是對于一個重大的議題,能夠做到不重疊、不遺漏的分類,而且能夠借此有效把握問題的核心,并成為有效解決問題的方法。

比如初步搭建用戶畫像維度,可以參考下圖:

上圖為商城系統(tǒng),初步的用戶畫像維度。圖中的數(shù)據(jù),按照獲取的方式,可以分為:統(tǒng)計類標簽、規(guī)則類標簽、挖掘類標簽。

統(tǒng)計類標簽:這類標簽是最為基礎也最為常見的標簽類型,例如對于某個用戶來說,他的性別、年齡、城市、星座、近7日活躍時長、近7日活躍天數(shù)、近7日活躍次數(shù)等字段可以從用戶注冊數(shù)據(jù)、用戶訪問、消費類數(shù)據(jù)中統(tǒng)計得出;該類標簽構成了用戶畫像的基礎。

規(guī)則類標簽:該類標簽基于用戶行為及確定的規(guī)則產(chǎn)生;例如對平臺上“消費活躍”用戶這一口徑的定義為近30天交易次數(shù)>=2,在實際開發(fā)畫像的過程中,由于運營人員對業(yè)務更為熟悉、而數(shù)據(jù)人員對數(shù)據(jù)的結構、分布、特征更為熟悉;因此規(guī)則類標簽的規(guī)則確定由運營人員和數(shù)據(jù)人員共同協(xié)商確定。

挖掘類標簽:該類標簽通過數(shù)據(jù)挖掘產(chǎn)生,應用在對用戶的某些屬性或某些行為進行預測判斷;例如根據(jù)一個用戶的行為習慣判斷該用戶是男性還是女性,根據(jù)一個用戶的消費習慣判斷其對某商品的偏好程度;該類標簽需要通過算法挖掘產(chǎn)生。

六、形成初步用戶畫像

基于用戶畫像數(shù)據(jù),可以使運營人員、營銷人員,有更好的用戶認識,帶來更佳的用戶服務質量,實現(xiàn)精準運營、精準營銷。

設計用戶畫像的可視化展現(xiàn)時,可以使用以下工具:

其中tableau、powerbi等自助式數(shù)據(jù)分析工具,可以讓沒有編程經(jīng)驗的業(yè)務人員、運營人員等進行自我數(shù)據(jù)分析,不需要依賴IT人員。

七、評估用戶畫像效果

在初步形成了用戶畫像后,并不能直接交給運營、業(yè)務人員實際使用,還需要評估用戶畫像的準確性。

評估方式主要分為3種:邏輯驗證、A/B test、用戶回訪。

邏輯驗證:也叫做交叉驗證;在完整的用戶畫像標簽體系中,一些標簽往往會存在一些相關性;比如用戶的累計在線時長越長,訂單量通常會越高;比如購買3C產(chǎn)品的用戶群中,男性用戶數(shù)通常大于女性用戶數(shù);另外,如果公司購買了第三方機構的數(shù)據(jù),也可用于交叉驗證。

A/B test:也叫做灰度測試;以上述的忠誠度為例,保證對照組、實驗組的流量相同;對實驗組的用戶,進行提升忠誠度的運營策略(促銷活動、積分獎勵等);如果實驗組的用戶,忠誠度相比對照組用戶,有一定提升,則可以認為用戶畫像比較精確。

用戶回訪:最樸實的評估方法,比如用戶畫像系統(tǒng),定義了10萬用戶為低忠誠度用戶;此時從中隨機抽取1000人,交給客服,進行回訪。根據(jù)回訪結果,判斷用戶畫像結果是否準確;甚至可以對回訪結果進行文本挖掘,形成詞云,查看消極詞的占比。

八、總結

當公司業(yè)務規(guī)模,用戶體量上升到一定量級;業(yè)務、運營團隊,往往會提出對用戶精準運營的想法;此時就需要用戶畫像系統(tǒng),在支持業(yè)務運營的同時,也可以幫助產(chǎn)品經(jīng)理更好的了解用戶。

0-1搭建用戶畫像系統(tǒng),需要在已有比較成熟的數(shù)據(jù)倉庫的前提下進行:

  • 數(shù)據(jù)建模:根據(jù)業(yè)務模式,設計相應的數(shù)據(jù)模型
  • 梳理用戶畫像維度:不重疊、不遺漏的梳理用戶標簽體系
  • 形成初步用戶畫像:可以使用tableau、powerBI、echarts等多種工具,生成可視化的用戶畫像
  • 評估用戶畫像效果;通過邏輯驗證、A/B測試、用戶回訪等方式,驗證用戶畫像系統(tǒng)中的標簽是否準確
  • 根據(jù)評估效果,持續(xù)優(yōu)化用戶標簽系統(tǒng)

 

本文由 @16哥 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉載。

題圖來自 unsplash,基于 CC0 協(xié)議

更多精彩內容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 贊~

    來自陜西 回復
专题
13389人已学习12篇文章
追热点蹭热点是互联网相关从业人员的一种潜意识,尤其是运营岗、市场岗。本专题的文章分享了如何做节日营销。
专题
90532人已学习13篇文章
不论你是产品经理还是运营,都要具备数据分析基本能力。
专题
12945人已学习13篇文章
对数据进行监控,分析异常数据,是数据分析常见的工作内容。本专题的文章分享了如何做好数据异常分析。
专题
17503人已学习13篇文章
当下人脸识别在生活中被应用得愈加广泛。本专题的文章分享了人脸识别的入门指南。
专题
16194人已学习16篇文章
企业服务(2B)公司的创业有8个阶段,所有SaaS公司或2B公司不可能跳过这些阶段,每个阶段都有明确的任务。本专题的文章分享了SaaS创业路线图。