深度 | 用戶畫(huà)像的精細(xì)化迭代完全演練

這篇文章主要講產(chǎn)品和運(yùn)營(yíng)角度的用戶畫(huà)像,希望看完后,解決你一切關(guān)于用戶畫(huà)像的疑問(wèn)。
深入剖析用戶畫(huà)像
承接上篇《如何進(jìn)行精準(zhǔn)化的用戶畫(huà)像?》,現(xiàn)在的運(yùn)營(yíng)一般都會(huì)按用戶生命周期設(shè)立了幾個(gè)標(biāo)簽,比如:新用戶、活躍用戶、流失用戶等等。這些標(biāo)簽是比較細(xì)分的,不過(guò)它真的是一個(gè)有效的好的標(biāo)簽嗎?
答案是否定的!原因也很簡(jiǎn)單,因?yàn)?strong>這些標(biāo)簽都是滯后性的。
聰明的運(yùn)營(yíng)都會(huì)設(shè)立一個(gè)這樣的標(biāo)簽:最近一次活躍距今天數(shù)。這個(gè)比單純的流失用戶標(biāo)簽要好很多,因?yàn)樗軕{此劃分不同的距今天數(shù),比如:設(shè)立30天、90天或者180天的時(shí)間節(jié)點(diǎn)。(如果用戶有6個(gè)月沒(méi)有活躍的話,那么天數(shù)就是180天。)
距今天數(shù)這樣的標(biāo)簽就是最好的嗎?當(dāng)然也不是最好的!為什么呢?
因?yàn)橛脩羰怯胁町惖模?/p>
同樣兩個(gè)用戶老王和老張,哪怕不活躍天數(shù)是相同的,我們也不能認(rèn)為它們的流失可能性是相等的,畢竟關(guān)于流失的原因多種多樣,不能單憑活躍天數(shù)加以預(yù)測(cè)。
而且,該問(wèn)題在低頻場(chǎng)景更嚴(yán)重。比如:旅游類的APP,即使是半年沒(méi)有活躍也是正常的,畢竟不是誰(shuí)天天都在旅游。
然后我們?cè)诳纯戳魇в脩暨@個(gè)概念,我們定義它不是為了設(shè)立一個(gè)高大上的系統(tǒng),任何的公司,都無(wú)一例外地希望流失用戶一開(kāi)始就越少越好,然后才是如何挽回的問(wèn)題。在這種業(yè)務(wù)前提下,預(yù)防性的減少流失用戶顯然比已經(jīng)流失的標(biāo)簽更重要得多。
所以我們就知道,最好的標(biāo)簽的標(biāo)簽是用戶流失概率,這才是最有用也是企業(yè)最應(yīng)該關(guān)心的問(wèn)題。
小結(jié):
標(biāo)簽優(yōu)先級(jí)排序:流失概率 > 距今消費(fèi)天數(shù) > 流失標(biāo)簽。
我們不要想當(dāng)然地歸納一個(gè)齊全完備的體系,卻忽略了畫(huà)像的核心價(jià)值,這是顧此失彼?。?/p>
必須要記住的是:用戶畫(huà)像一定得是某個(gè)商業(yè)目的下的用戶標(biāo)簽的集合。
舉個(gè)例子:
猜用戶是男是女、有沒(méi)有談戀愛(ài)、哪里生人、準(zhǔn)備剁手購(gòu)物嗎、喜歡什么、工資多少?探討這些是沒(méi)有多少意義的!
然而,是男是女如何影響消費(fèi)決策的?工資多少影響怎樣的消費(fèi)能力?有沒(méi)有談戀愛(ài)會(huì)否帶來(lái)新的營(yíng)銷和消費(fèi)場(chǎng)景?剁手購(gòu)物要如何做精準(zhǔn)推薦?這些才是我們用戶畫(huà)像真正應(yīng)該關(guān)心的問(wèn)題!
這里需要強(qiáng)調(diào)的一點(diǎn)是:不是因?yàn)槲矣辛擞脩舢?huà)像,才能驅(qū)動(dòng)和提高業(yè)務(wù),而是為了驅(qū)動(dòng)和提高業(yè)務(wù),才需要去建立用戶畫(huà)像,這是很容易犯的因果倒置的錯(cuò)誤!
用戶標(biāo)簽的獲得
用戶畫(huà)像的標(biāo)簽一般通過(guò)兩種形式獲得:
- 基于已有數(shù)據(jù)或者一定規(guī)則加工而來(lái),流失標(biāo)簽和距今天數(shù)皆是如此。
- 基于已有的數(shù)據(jù)計(jì)算概率模型而來(lái),這會(huì)用到機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘等內(nèi)容,其中的概率是介于 0~1 之間的數(shù)值。
拿性別來(lái)舉例:除非我們能直接獲取用戶的身份證信息,否則的話用戶很少會(huì)填寫(xiě)性別。即使填寫(xiě)了,性別信息也不一定是準(zhǔn)確的。所以你就能知道,網(wǎng)游中性別為女的扣腳大叔一抓一大把!
所以呢,這里就要增加一層推斷用戶真實(shí)性別的算法。
中國(guó)人的性別和名字是強(qiáng)相關(guān)的,像國(guó)慶利民、婷婷瑩瑩,很容易就能判斷出來(lái)。算法中常用貝葉斯(用來(lái)描述兩個(gè)條件概率之間的關(guān)系),通過(guò)已有的姓名性別庫(kù)來(lái)預(yù)測(cè)新加入的用戶的性別。
不過(guò)某種特殊情況下,不少姓名是中性的,即男女不是很容易分辨出來(lái),像愛(ài)華這樣的名字就可男可女。而且更特殊的情況,看上去是男性的名字也有可能是女性的。
像這種特殊情況就意味著特殊的概率,所以不能用非黑即白的二分法做計(jì)算。我們可以用概率來(lái)表示,即通過(guò)模型推斷,國(guó)慶有95%的可能是男性姓名,表示為0.95;愛(ài)華有55%的可能是男性名,表示為0.55。
除此之外,模型會(huì)設(shè)立閾值,這也是為了方便之用。比如:將50%以上的概率默認(rèn)為男性,以下默認(rèn)為女性,不過(guò)業(yè)務(wù)部門的同學(xué)要清楚的是,用戶標(biāo)簽的本質(zhì)是0~1之間的概率值,而不是0和1兩個(gè)值。
這里有個(gè)難點(diǎn)是什么呢?
我們都知道概率準(zhǔn)確性的前提是數(shù)據(jù)源的準(zhǔn)確,這里的數(shù)據(jù)源就是用戶標(biāo)簽,然而用戶標(biāo)簽往往是很難驗(yàn)證的!
比如:某位用戶被標(biāo)上學(xué)生的標(biāo)簽,但如果不是真的讓他上傳學(xué)籍證明的話,很難知道他是不是真的學(xué)生。在這種黑箱情況之下,我們針對(duì)學(xué)生用戶進(jìn)行的營(yíng)銷活動(dòng),效果好不好都受標(biāo)簽準(zhǔn)確率的影響。無(wú)論是廣告、推薦、精準(zhǔn)營(yíng)銷等都會(huì)受到這個(gè)問(wèn)題的影響。
學(xué)過(guò)中學(xué)概率的同學(xué)都知道:90%流失概率的用戶和30%流失概率的用戶相比有什么不同呢?
當(dāng)然是前者比后者更有離開(kāi)的可能性(雖然是模型建立出的預(yù)測(cè)值),然后我們會(huì)憑此設(shè)立運(yùn)營(yíng)策略。
所以我們就面臨一個(gè)新的問(wèn)題:如何選擇概率的閾值才是合理的呢?
比如:我們想要挽回流失用戶,選擇80%以上概率的人群,還是60%呢?
答案在之前已經(jīng)鋪墊過(guò)了,要考慮具體的業(yè)務(wù)目標(biāo)!
可以這么理解:挽回流失用戶只是手段而不是目的,實(shí)際目的是通過(guò)挽回流失用戶提高利潤(rùn)(當(dāng)然了,提高利潤(rùn)是所有非公益組織的目的)。所以閾值的選擇問(wèn)題就迎刃而解了:我們可以計(jì)算在不同閾值下挽回用戶的收入和成本,以此選擇最優(yōu)解。
推而廣之,無(wú)論是推薦系統(tǒng)也好,廣告系統(tǒng)也罷,雖然它們有更復(fù)雜的維度、標(biāo)簽和特征,但本質(zhì)也是找出用戶最近想不想買車、想不想旅游等這些用戶意愿和需求。然后在最合適的時(shí)機(jī)把最合適的信息推送給用戶,這就是獲取最大的利益的法寶!
要知道的是,以上案例是經(jīng)過(guò)簡(jiǎn)化的,實(shí)際的業(yè)務(wù)場(chǎng)景中會(huì)更復(fù)雜,比如:所說(shuō)的姓名,除了生理上的性別有時(shí)還會(huì)建立消費(fèi)模型上的性別標(biāo)簽,尤其是在電商和消費(fèi)行業(yè)。
所以你就能看到有些人雖然是男性,但購(gòu)物行為卻是女性,這是一定要做出區(qū)分的??傊?,一切的標(biāo)簽都要指向用戶的行為預(yù)測(cè)!
那么,一個(gè)用戶畫(huà)像要怎樣才能正確的建立起來(lái)呢?
從一個(gè)故事開(kāi)始的用戶畫(huà)像
通過(guò)上文的描述我們知道,用戶畫(huà)像一定是基于業(yè)務(wù)模型的,或者說(shuō)業(yè)務(wù)的目標(biāo)就是用戶畫(huà)像的導(dǎo)向。所以業(yè)務(wù)部門如果連業(yè)務(wù)模型都沒(méi)有想好的話,那么數(shù)據(jù)部門就只能巧婦難為無(wú)米之炊了。
當(dāng)然數(shù)據(jù)部門也別閉門造車,這和做產(chǎn)品是一樣的。如果連用戶需求都沒(méi)有理解透徹的話,就匆匆忙忙上線一個(gè)產(chǎn)品,無(wú)人問(wèn)津是自然的了。
故事開(kāi)篇
這里我們舉個(gè)假設(shè)的例子,通過(guò)一步步地畫(huà)像完善讓大家更明白用戶畫(huà)像真實(shí)的建立過(guò)程!
故事背景
老王是一家互聯(lián)網(wǎng)創(chuàng)業(yè)公司的核心人員,產(chǎn)品主營(yíng)綠色健康沙拉。有一天,這家公司推出了 APP 專賣各式各樣的沙拉服務(wù),現(xiàn)在需要建立用戶畫(huà)像來(lái)做運(yùn)營(yíng)指導(dǎo)。
故事分析
公司現(xiàn)階段在業(yè)務(wù)層面毫無(wú)疑問(wèn)是更關(guān)注營(yíng)銷和銷售,即如何將沙拉賣得更多更好?
梳理的運(yùn)營(yíng)流程
老王先是將顧客按是否購(gòu)買過(guò)沙拉,劃分成潛在用戶和新用戶。潛在用戶是注冊(cè)過(guò)APP但還沒(méi)有下單的用戶;而新用戶是只購(gòu)買過(guò)一次沙拉的用戶。除此以外還有老用戶,即消費(fèi)了兩次及以上的用戶。
這里我們用JSON格式表示一個(gè)簡(jiǎn)易的用戶畫(huà)像:
{
“ID”: 123456,
“姓名”: “Chance”,
“消費(fèi)”: {
“消費(fèi)標(biāo)簽”: “潛在用戶”
}
}
番外:JSON
JSON(JavaScript Object Notation,JS 對(duì)象簡(jiǎn)譜)是一種輕量級(jí)的數(shù)據(jù)交換格式。現(xiàn)在服務(wù)端和客戶端的數(shù)據(jù)交換所采用的幾乎都是JSON格式,它的格式固定且操作簡(jiǎn)單,不知道的同學(xué)還是建議了解下。
為什么獨(dú)立出新用戶標(biāo)簽?zāi)兀?/p>
因?yàn)槔贤醯纳忱槍?duì)未消費(fèi)的用戶會(huì)有新人紅包進(jìn)行引導(dǎo)消費(fèi),不過(guò)這也帶來(lái)了新用戶消費(fèi)一次后不再消費(fèi)的問(wèn)題(很多用戶就是為了占紅包的便宜才來(lái)的,紅包沒(méi)有了他們就走了),所以就更需要進(jìn)行潛在用戶、新用戶、老用戶的劃分。
如果你是一個(gè)有追求的運(yùn)營(yíng)人員的話,那么劃分老用戶也還是不夠的,這里還得繼續(xù)用戶分層才行。
傳統(tǒng)的分層用RFM三個(gè)維度衡量,沙拉的客單價(jià)比較固定,F(xiàn)和M取一個(gè)就夠用了。老王現(xiàn)在計(jì)算不同消費(fèi)檔次的用戶留存度差異,譬如:某時(shí)間段內(nèi)消費(fèi)達(dá)XX元的用戶,在未來(lái)時(shí)間段是否依舊消費(fèi)。
番外:RFM模型
它是衡量客戶價(jià)值和客戶創(chuàng)利能力的重要工具和手段,在眾多的客戶關(guān)系管理(CRM)的分析模式中,RFM模型是被廣泛提到的。該機(jī)械模型通過(guò)一個(gè)客戶的最近一次消費(fèi)(Recency)、消費(fèi)頻率(Frequency)以及消費(fèi)金額(Monetary)?3項(xiàng)指標(biāo)來(lái)描述該客戶的價(jià)值狀況。
像沙拉這類餐飲是高頻消費(fèi),應(yīng)該選擇一個(gè)較窄的時(shí)間窗口才行,對(duì)于統(tǒng)計(jì)365天內(nèi)的消費(fèi)意義不大。
還有一點(diǎn)需要注意的是:沙拉在不同季節(jié)的銷量是有差異的,冬天沙拉肯定賣的不如夏天,所以要綜合考慮消費(fèi)分布情況。
我們暫時(shí)這樣規(guī)定:30天內(nèi)消費(fèi)200元以上為VIP用戶,那么老王的生意如果特別好,就可以按照這樣的思路繼續(xù)劃分超級(jí)VIP。并且這種標(biāo)簽往往需要配合業(yè)務(wù)實(shí)現(xiàn),例如:VIP有贈(zèng)送果汁、可樂(lè),具有優(yōu)先配送的權(quán)益等。而對(duì)于非VIP人群,我們需要激勵(lì)該部分用戶,并想盡各種方法往VIP發(fā)展。
畫(huà)像屬性收集
對(duì)于畫(huà)像的人口統(tǒng)計(jì)屬性,老王靠用戶填寫(xiě)訂單上的收貨人姓名來(lái)收集。像籍貫?zāi)挲g這些對(duì)沙拉生意沒(méi)有特別大幫助的屬性,我們可以不用重點(diǎn)關(guān)注。
用戶地址可以通過(guò)收貨地的設(shè)立規(guī)則判斷,比如:某個(gè)地址出現(xiàn)X次的話,則可以將其認(rèn)為常用地址。然后再依據(jù)送貨地在寫(xiě)字樓還是學(xué)校,推算出用戶是白領(lǐng)還是學(xué)生。
這樣老王就可以針對(duì)不同屬性的人群,采取不同的運(yùn)營(yíng)策略。
(1)學(xué)生群體
考慮到7、8月份是暑假,所以老王提前預(yù)估到校園地區(qū)的銷售額會(huì)下降。而當(dāng)9月開(kāi)學(xué)季,則又能對(duì)返校學(xué)生進(jìn)行召回。
(2)白領(lǐng)相關(guān)的群體
這部分用戶更關(guān)注消費(fèi)體驗(yàn),對(duì)價(jià)格敏感是次要的。所以如果平臺(tái)女用戶的消費(fèi)占比高的話,老王就可以主打減肥功能的沙拉,然后以包月套餐的形式提高銷量。
下面是該階段下的用戶畫(huà)像格式:
{
“ID”: 123456,
“姓名”: “Chance”,
“性別”: “男”,
“社會(huì)屬性”: {
“常用地址”: {
“常用地址1”: {
“地理名稱”: “北京市海淀區(qū)XXX”,
“經(jīng)緯度”: “ABC.CBA”,
“類型”: “居住區(qū)”
},
“常用地址2”: {
“地理名稱”: “北京市朝陽(yáng)區(qū)XXX”,
“經(jīng)緯度”: “CBD.DBC”,
“類型”: “商業(yè)區(qū)”
}
},
“職業(yè)”: {
“職業(yè)標(biāo)簽”: “白領(lǐng)”,
“概率”: 0.97
}
},
“消費(fèi)”: {
“消費(fèi)標(biāo)簽”: “VIP用戶”,
“30天內(nèi)消費(fèi)金額”: “245元”,
“30天內(nèi)消費(fèi)次數(shù)”: “8次”
}
}
如果單以一家沙拉店來(lái)看,老王的用戶畫(huà)像已經(jīng)很不錯(cuò)了,但他還是焦頭爛額,因?yàn)橛脩袅魇书_(kāi)始上升了,這可怎么辦?
首先我們要意識(shí)到用戶流失有各種各樣的原因:比如對(duì)手老李沙拉的競(jìng)爭(zhēng)品影響、沙拉的口味影響、性價(jià)比的影響、甚至老王夠不夠帥等的影響。
用戶流失一直是一個(gè)難以預(yù)測(cè)的問(wèn)題,想要準(zhǔn)確地預(yù)測(cè),可以嘗試用機(jī)器學(xué)習(xí)進(jìn)行建模。
番外:機(jī)器建模
技術(shù)方面暫且不提,我用大白話給大家解釋一下:所謂的建模,其實(shí)就是建立一個(gè)復(fù)雜的方程組,只不過(guò)通常情況下的建模是通過(guò)算法工程師手動(dòng)建立的。但是隨著數(shù)據(jù)結(jié)構(gòu)的越發(fā)復(fù)雜,通常來(lái)講的建模方式已經(jīng)越來(lái)越困難了,于是人們想著用機(jī)器自動(dòng)完成建模,于是機(jī)器學(xué)習(xí)建模方式誕生了!
機(jī)器建模就是通過(guò)海量的數(shù)據(jù)喂養(yǎng),讓機(jī)器自己學(xué)會(huì)怎么建立模型。這樣的模型通常來(lái)講復(fù)雜無(wú)比,而且建模的過(guò)程和數(shù)據(jù)源質(zhì)量強(qiáng)相關(guān),所以就有了我們經(jīng)常聽(tīng)見(jiàn)的數(shù)據(jù)清洗、過(guò)濾等。
好了,科普完畢,好像把機(jī)器學(xué)習(xí)說(shuō)的玄乎其玄。不過(guò)再?gòu)?fù)雜它也是個(gè)方程組,那么毫無(wú)疑問(wèn)它的本質(zhì)就是找到兩個(gè)或者幾個(gè)變量之間的關(guān)系。所以呢,我們最好通過(guò)這種方式找到用戶開(kāi)始不消費(fèi)的時(shí)間點(diǎn)之前的關(guān)鍵因素,可以是行為,也可以是屬性。如果成功,我們就能更好地根據(jù)現(xiàn)有數(shù)據(jù)來(lái)預(yù)測(cè)用戶流失。
很有可能你得到的結(jié)果是這樣的:
- 用戶給過(guò)差評(píng),用戶有可能流失;
- 用戶歷史窗口內(nèi)消費(fèi)頻次低,用戶有可能流失;
- 用戶歷史窗口內(nèi)消費(fèi)金額少,用戶有可能流失;
- 用戶歷史窗口內(nèi)打開(kāi)APP次數(shù)少,用戶有可能流失;
- 用戶的性別差異,用戶有可能流失;
- 用戶等餐時(shí)間長(zhǎng),用戶有可能流失;
- 餐飲的季度因素,用戶有可能流失。
用戶太矯情了有木有…
這時(shí)我們就可以依據(jù)業(yè)務(wù)挑選可能影響業(yè)務(wù)的特征,然后提交給數(shù)據(jù)組去嘗試預(yù)測(cè)流失。不過(guò)需要注意的是,這些用戶行為并不能反應(yīng)真實(shí)的情況。
為什么呢?不是說(shuō)好了可以更好的預(yù)測(cè)的嗎?
因?yàn)榱魇в脩舻男袨椋且粋€(gè)變化的過(guò)程。比如:我雖然曾經(jīng)消費(fèi)過(guò)很多次,但是突然吃膩了,于是流失。這就像愛(ài)著愛(ài)著突然覺(jué)得累了膩了,然后高喊著“只在乎曾經(jīng)擁有”的嘹亮口號(hào)玩命分手。這事兒誰(shuí)能說(shuō)得準(zhǔn)呢~
要知道,單位時(shí)間段內(nèi)的消費(fèi)忠誠(chéng)度是梯度下降的。所以為了更好地描述變化過(guò)程,我們可以將時(shí)間窗口細(xì)分成多個(gè)等距段。比如:前30-20天、前20-10天、前10天內(nèi),這種切分可以比前30天內(nèi)可以更好地表達(dá)下降趨勢(shì),也可以更好的預(yù)測(cè)流失。
從老王的思路看,流失是可以通過(guò)用戶行為的細(xì)節(jié)進(jìn)行預(yù)判的。機(jī)器學(xué)習(xí)的建模雖然依賴于統(tǒng)計(jì)手段,但也離不開(kāi)業(yè)務(wù)洞察。所以,用戶畫(huà)像建立在業(yè)務(wù)模型上,這個(gè)道理被再次證明。
不管怎么說(shuō),流失概率的建立解決了老王的心頭之患。在提前發(fā)現(xiàn)并降低流失用戶,然后挽回流失用戶的手段推行一段時(shí)間后,老王發(fā)現(xiàn)流失用戶確實(shí)減少了很多,不過(guò)成本卻提高了,因?yàn)橥旎赜脩粢彩且ú簧馘X的啊。
虧本可怎么行!老王忿忿不平,于是他決定只挽回有價(jià)值的用戶。那種拿了紅包才消費(fèi)的用戶不要也罷,真愛(ài)粉才貼心?。?/p>
于是他配合消費(fèi)檔次進(jìn)行區(qū)別對(duì)待,雖然流失用戶的數(shù)量沒(méi)有控制好,但是利潤(rùn)卻提高了不少,這也算目的達(dá)到了。
我們能夠發(fā)現(xiàn),上述用戶畫(huà)像沒(méi)有一個(gè)標(biāo)簽是脫離于業(yè)務(wù)場(chǎng)景之外的。而且基于業(yè)務(wù)場(chǎng)景,我們甚至還能想象出更多用戶畫(huà)像的玩法。比如:沙拉有不同的口味,蔬果雞肉海鮮。
用戶的口味偏好可以用矩陣分解,模糊聚類或者多分類的問(wèn)題計(jì)算,也以0~1之間的數(shù)字表示喜好程度。當(dāng)然還有價(jià)格偏好,即價(jià)格敏感度。
于是用戶畫(huà)像就變成了這樣:
{
“ID”: 123456,
“姓名”: “Chance”,
“性別”: “男”,
“社會(huì)屬性”: {
“常用地址”: {
“常用地址1”: {
“地理名稱”: “北京市海淀區(qū)XXX”,
“經(jīng)緯度”: “ABC.CBA”,
“類型”: “居住區(qū)”
},
“常用地址2”: {
“地理名稱”: “北京市朝陽(yáng)區(qū)XXX”,
“經(jīng)緯度”: “CBD.DBC”,
“類型”: “商業(yè)區(qū)”
}
},
“職業(yè)”: {
“職業(yè)標(biāo)簽”: “白領(lǐng)”,
“概率”: 0.97
}
},
“消費(fèi)”: {
“消費(fèi)標(biāo)簽”: “VIP用戶”,
“30天內(nèi)消費(fèi)金額”: “245元”,
“30天內(nèi)消費(fèi)次數(shù)”: 8,
“流失概率”: 0.21,
“價(jià)格敏感”: 0.72,
“優(yōu)惠敏感”: 0.51,
“首次消費(fèi)時(shí)間”: “2018.06.01”,
“最后消費(fèi)時(shí)間”: “2019.07.02”
},
“行為”: {
“行為標(biāo)簽”: “活躍”,
“30天內(nèi)登場(chǎng)次數(shù)”: 12,
“30天內(nèi)評(píng)價(jià)次數(shù)”: 9,
“30天內(nèi)退貨次數(shù)”: 0,
“口味偏好”: {
“蔬菜沙拉”: 0.35,
“水果沙拉”: 0.62,
“海鮮沙拉”: 0.81
}
}
}
接下來(lái)再深入想一下業(yè)務(wù)場(chǎng)景,比如:某個(gè)辦公地點(diǎn)每天都有5、6筆的訂單,并且分屬不同的客戶不同的時(shí)段,那么外賣小哥得送個(gè)5、6次,這對(duì)人力成本是很大的浪費(fèi)。
這時(shí),運(yùn)營(yíng)就可以在后臺(tái)分析相關(guān)的數(shù)據(jù),然后以團(tuán)購(gòu)或拼單的形式促成訂單合并。這樣銷售額的利潤(rùn)或許會(huì)下降,但是外賣的人力成本也節(jié)約了不少。(這是用畫(huà)像作為數(shù)據(jù)分析的依據(jù))
相信通過(guò)老王的故事,你已經(jīng)對(duì)用戶畫(huà)像的建立有了一個(gè)重新的認(rèn)識(shí)!
用戶畫(huà)像的數(shù)據(jù)來(lái)源
下圖為一種常規(guī)的用戶畫(huà)像計(jì)算引擎示意圖,雖然用戶畫(huà)像是一個(gè)最終的整體結(jié)果,但是它是由各個(gè)子畫(huà)像綜合計(jì)算而來(lái)的。這些子畫(huà)像作為中間結(jié)果并不會(huì)被刪除,而是作為重要的畫(huà)像解釋和應(yīng)用數(shù)據(jù)保存下來(lái)。
拿視頻推薦來(lái)說(shuō),子畫(huà)像包括演員偏好畫(huà)像、導(dǎo)演偏好畫(huà)像、電影風(fēng)格偏好畫(huà)像,以及用戶的基本屬性等。
需要注意的是:屬性相對(duì)于其他子畫(huà)像更加不易變化,因此在圖中并沒(méi)有特別強(qiáng)調(diào)該部分畫(huà)像更新模塊。
用戶注冊(cè)等基本屬性信息往往用于刻畫(huà)相對(duì)靜態(tài)的畫(huà)像,而豐富的大量的用戶行為日志,則是用于捕捉動(dòng)態(tài)畫(huà)像的重要數(shù)據(jù)來(lái)源。
- 從數(shù)據(jù)的角度看:用戶畫(huà)像就是一個(gè)對(duì)原始數(shù)據(jù)二次計(jì)算重構(gòu)后的新數(shù)據(jù),對(duì)計(jì)算增加了負(fù)擔(dān),對(duì)存儲(chǔ)也增加了負(fù)擔(dān)。所以一開(kāi)始必須經(jīng)過(guò)邏輯設(shè)計(jì),從而才能確定數(shù)據(jù)結(jié)構(gòu)方面的設(shè)計(jì)。
- 從可視化的角度來(lái)看:不同于以往的傳統(tǒng)統(tǒng)計(jì)模式(如某個(gè)視頻某個(gè)月的觀看童按時(shí)間軸統(tǒng)計(jì)圖),用戶畫(huà)像可能會(huì)開(kāi)啟一個(gè)以用戶為核心牽引的新的入口呈現(xiàn)模式,如下圖所示。
每個(gè)標(biāo)簽單擊進(jìn)去都是詳細(xì)記錄和細(xì)節(jié),從抽象到細(xì)節(jié)逐步去體現(xiàn)用戶畫(huà)像數(shù)據(jù)結(jié)構(gòu),而這對(duì)于服務(wù)商來(lái)說(shuō),更加直觀和更有幫助。
用戶畫(huà)像的架構(gòu)
不同業(yè)務(wù)的畫(huà)像標(biāo)簽體系并不一致,這需要數(shù)據(jù)和運(yùn)營(yíng)有目的性的提煉。用戶畫(huà)像一般按業(yè)務(wù)屬性劃分成多個(gè)類別模塊,除了常見(jiàn)的人口統(tǒng)計(jì)、社會(huì)屬性外,還有用戶消費(fèi)畫(huà)像、用戶行為畫(huà)像、用戶興趣畫(huà)像等。
具體的畫(huà)像還得看產(chǎn)品的形態(tài),比如:金融領(lǐng)域,還會(huì)有風(fēng)險(xiǎn)畫(huà)像,包括征信、違約、洗錢、還款能力、保險(xiǎn)黑名單等。電商領(lǐng)域還會(huì)有商品的類目偏好、品類偏好、品牌偏好等。
畫(huà)一個(gè)架構(gòu)倒是不難,難的是了解每個(gè)標(biāo)簽背后的業(yè)務(wù)邏輯和相關(guān)落地方式。而至于算法嘛,我們后續(xù)單獨(dú)成文詳談。
從數(shù)據(jù)流向和加工來(lái)看,用戶畫(huà)像包含了上下級(jí)的遞進(jìn)關(guān)系。以上文的流失系數(shù)舉例來(lái)說(shuō),它是通過(guò)建模得出的,所以依賴于用戶早期的歷史行為。而用戶早期的歷史行為,即10天內(nèi)的消費(fèi)金額、消費(fèi)次數(shù)、登錄次數(shù)等,本身也是一個(gè)標(biāo)簽,它們是通過(guò)原始的明細(xì)數(shù)據(jù)獲得的。
上圖列舉了標(biāo)簽的加工和計(jì)算過(guò)程,這很好理解。最上層的策略標(biāo)簽是針對(duì)業(yè)務(wù)的落地,運(yùn)營(yíng)人員可以通過(guò)多個(gè)標(biāo)簽的組合形成一個(gè)用戶群組,這樣就非常方便執(zhí)行。
不用多說(shuō),公司越大則用戶畫(huà)像越復(fù)雜?,F(xiàn)在做個(gè)假設(shè),如果某家主打內(nèi)容分發(fā)的公司進(jìn)入了全新的視頻領(lǐng)域,那么用戶畫(huà)像的結(jié)構(gòu)也是需要改變的。至少要既有內(nèi)容相關(guān)的標(biāo)簽,也要有視頻相關(guān)的標(biāo)簽,而且兩者是并行且關(guān)聯(lián)的。
比如:老王在內(nèi)容標(biāo)簽下是重度使用者,而在視頻標(biāo)簽下是輕度使用者。老張很久沒(méi)打開(kāi)內(nèi)容APP有流失的風(fēng)險(xiǎn),但在視頻產(chǎn)品的使用時(shí)長(zhǎng)上卻很忠誠(chéng)。凡此種種,看的是靈活的應(yīng)用。當(dāng)然了,姓名、性別等這類人口統(tǒng)計(jì)標(biāo)簽是通用的。
基于營(yíng)銷和消費(fèi)相關(guān)的標(biāo)簽,比如:新用戶、老用戶、用戶的流失和忠誠(chéng)、用戶的消費(fèi)水平和頻率等,都是構(gòu)成 CRM(客戶關(guān)系管理;用戶/會(huì)員管理運(yùn)營(yíng)平臺(tái))的基礎(chǔ)。
它的作用在于:將數(shù)據(jù)化的標(biāo)簽轉(zhuǎn)換成產(chǎn)品運(yùn)營(yíng)策略。不同的標(biāo)簽對(duì)應(yīng)不同的用戶群體,自然就對(duì)應(yīng)著不同的營(yíng)銷手段。
另外,CRM的結(jié)構(gòu)中也會(huì)包含各類觸達(dá)用戶的常用渠道,比如:短信、郵件、推送等。同時(shí)也會(huì)包含CMS(內(nèi)容管理系統(tǒng)),執(zhí)行人員可以通過(guò)其快速地配置活動(dòng)頁(yè)、活動(dòng)通道、優(yōu)惠券等,然后靠營(yíng)銷活動(dòng)拉動(dòng)數(shù)據(jù)。
現(xiàn)在做個(gè)假設(shè),老王的沙拉業(yè)務(wù)如果要是做大的話,那么運(yùn)營(yíng)平臺(tái)就會(huì)以圖中的結(jié)構(gòu)搭建。那么老王可以在CRM中組合標(biāo)簽,然后新用戶、老用戶、流失用戶的數(shù)據(jù)借助BI監(jiān)控,最后通過(guò)CMS系統(tǒng)配置紅包、優(yōu)惠等等,通過(guò)短消息或推送Push觸達(dá)用戶端。
到現(xiàn)在我們知道,好的用戶畫(huà)像系統(tǒng),既是數(shù)據(jù)生態(tài)體系,也是業(yè)務(wù)和運(yùn)營(yíng)的生態(tài)體系,它是一門復(fù)雜的交叉領(lǐng)域。
路漫漫其修遠(yuǎn)兮,吾將上下而畫(huà)像。至此,用戶畫(huà)像的部分就暫時(shí)寫(xiě)到這里。
作者:百祝,公眾號(hào):常思行
本文由 @常思行 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自Unsplash,基于CC0協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
非常有價(jià)值的文章,已打賞支持
看了許多關(guān)于用戶畫(huà)像的文章,這篇寫(xiě)的最好,幫助很大,感謝。
非常同意,真的夠系統(tǒng)了!
mark
系統(tǒng)化的一篇,看上上一篇追過(guò)來(lái)看下一篇,兩篇加了起來(lái)應(yīng)該就能對(duì)“用戶畫(huà)像”知其然再知其所以然了,具體要怎么去“畫(huà)像”就要靠自己了,感覺(jué)通用的方法論已經(jīng)講的很透徹了,老王的例子還有JSON的演示很是具象,從一個(gè)小模型放大到大的系統(tǒng),適合不同階段、規(guī)模的產(chǎn)品學(xué)習(xí),當(dāng)然大的平臺(tái)應(yīng)該都是有了較為全面的數(shù)據(jù)系統(tǒng),數(shù)據(jù)有了就看怎么用怎么調(diào)整了。
好像百川寫(xiě)的那篇,非常之像。不過(guò)也挺好的。
嗯,分手那段,我覺(jué)得是真的,你就老實(shí)交代了吧!23333
分享prd最好
接下來(lái)該寫(xiě)什么啦,可以預(yù)告一下,收藏了
深度好文
老兄用戶畫(huà)像到底應(yīng)該如何正確使用呢?
厲害??學(xué)習(xí)了邏輯性非常的強(qiáng)
真的是干貨,厲害,微信公眾號(hào)已關(guān)注
感謝支持 ??
感謝樓主~最喜歡看干貨了
??
厲害
??