RFM模型:如何量化你的用戶價值?
上篇文章介紹了用戶體系搭建的思路,這里單獨開篇給大家介紹如何量化用戶價值。
在拓展市場初期沒有思路的時候,市場和運營同事絞盡腦汁做活動、上新品、蹭熱點、做營銷,不斷的拓展客戶、做回訪維系客戶感情,除了少數(shù)運氣好的之外,大部分效果寥寥。真正的用戶沒有幾個,到最后都便宜了羊毛黨。不同階段、不同類型的用戶需求點不同,有的客戶圖便宜,有的客戶看新品,有的客戶重服務(wù),大包大攬的營銷運營,最后的結(jié)果就是涼涼。
解決得分方法也很簡單,就是用戶精細化運營,通過各類運營手段提高不同類型的用戶在產(chǎn)品中的活躍度、留存率和付費率。而如何將用戶從一個整體拆分成特征明顯的群體決定了運營的成敗。這里介紹一個最經(jīng)典的用戶分群工具就是RFM模型。RFM模型是衡量用戶價值和用戶創(chuàng)利能力的經(jīng)典工具,依托于用戶最近一次購買時間、消費頻次以及消費金額。
在應(yīng)用RFM模型時,要有用戶最基礎(chǔ)的交易數(shù)據(jù),至少包含用戶ID,交易金額,交易時間三個字段。
RFM的含義:
- R(Recency)最近一次消費時間:表示用戶最近一次消費距離現(xiàn)在的時間。消費時間越近的客戶價值越大。1年前消費過的用戶肯定沒有1周前消費過的用戶價值大。
- F(Frequency)消費頻率:消費頻率是指用戶在統(tǒng)計周期內(nèi)購買商品的次數(shù),經(jīng)常購買的用戶也就是熟客,價值肯定比偶爾來一次的客戶價值大。
- M(Monetary)消費金額:消費金額是指用戶在統(tǒng)計周期內(nèi)消費的總金額,體現(xiàn)了消費者為企業(yè)創(chuàng)利的多少,自然是消費越多的用戶價值越大。
基于這三個維度,將每個維度分為高低兩種情況,我們構(gòu)建出了一個三維的坐標系。
(來源自網(wǎng)絡(luò))
通過圖表很直觀的發(fā)現(xiàn),我們把客戶分為了2的三次方也就是8個群體。
如果某個用戶最近一次消費時間距今比較久遠,沒有再消費了,但是累計消費金額和消費頻次都很高,說明這個用戶曾經(jīng)很有價值也就是RFM模型中的重要保持客戶,我們不希望他流失,所以運營人員就會專門針對這類型用戶設(shè)計召回策略,這也就是RFM模型的核心價值。
當然這里有個默認前提:
- 最近有過交易行為的客戶,二次發(fā)生交易的可能性要高于最近沒有交易行為的客戶;
- 交易頻率較高的客戶比交易頻率較低的客戶,更有可能發(fā)生二次交易;
- 過去所有交易總金額較多的客戶,比交易總金額較少的客戶,更有可能發(fā)生二次交易。
舉例來說明:
以下是模擬我近一年的消費行為(腦海中蹦出了一年逛兩次海瀾之家…):
假設(shè)當前統(tǒng)計時間為2019年12月31日,經(jīng)過簡單的統(tǒng)計計算可得:
- R值?=?12月31日?–?11月11日?=?50;
- F值?=?計數(shù)消費次數(shù)?=?4;
- M值?=?1200+300+900+2000?=?4400;
這里會遇到第一個問題:
R值最近一次消費時間表示用戶最近一次消費距離現(xiàn)在的時間,消費時間越近的客戶價值越大。以上方式計算出的R值越大說明當前用戶最近一次消費時間越遠用戶價值越小,而F值還有M值越大代表用戶價值越大,三組數(shù)據(jù)不在同一個描述維度,而且R值、F值、M值存在量級之間的差距,無法直觀的通過加減來衡量用戶價值。
這里有兩種處理辦法分別是評分方式和算法。
評分方式
評分方式是根據(jù)三組數(shù)據(jù)各個值的特性,采用5分制為各個數(shù)據(jù)賦予一個評分值,R值的評分機制是R值越大,評分越小。具體評分的規(guī)則可以根據(jù)經(jīng)驗設(shè)定分值的給予區(qū)間,或者將數(shù)據(jù)平均分配成為5組,對應(yīng)5個分值。
在基于三組數(shù)據(jù)對應(yīng)的評分值來計算評分值的平均數(shù),大于等于平均數(shù)的數(shù)據(jù)劃到高的維度,低于平均數(shù)的數(shù)據(jù)劃到低的維度,自然將三組數(shù)據(jù)每組分別劃分為高低兩組,交叉組合后就是我們上面說過的8種情況。然后在將三組數(shù)據(jù)對應(yīng)的評分值做累加就是RFM總值了。
評分機制的優(yōu)勢
計算RFM總值時解決了不同量級數(shù)據(jù)相加時影響權(quán)重不均衡的問題。由于用戶的交易行為中R值和F值相對較小,如果三個值不處理就累加,M值直接決定了總值的量級,R值、F值對總值的影響很小,無法體現(xiàn)出用戶的真實價值。
同樣以剛剛的數(shù)據(jù)為例:RFM總值 = 50+4+4400= 4454
可見M值4400直接決定了最后計算結(jié)果的量級,前面R值、F值對結(jié)果的影響基本忽略不計。采用評分制的方法后,將R、F、M值都映射到了1至5的區(qū)間之內(nèi),保證了各數(shù)據(jù)之間的可比性。
評分制的劣勢
賦值指標的設(shè)定需要資深的業(yè)務(wù)經(jīng)驗,什么樣的算高頻,什么樣的算高額都是經(jīng)驗,并且用戶的消費數(shù)據(jù)是不斷膨脹的,根據(jù)手動設(shè)定的劃分區(qū)間無法隨著數(shù)據(jù)的不斷膨脹而自動適配,所以需要根據(jù)經(jīng)驗和數(shù)據(jù)反饋不斷修正。
算法方式
算法方式是根據(jù)數(shù)據(jù)特性將數(shù)據(jù)基于模型處理后量化用戶價值,分劃分高低維度、量化用戶價值兩步。
第一步:劃分高低維度
根據(jù)數(shù)據(jù)分布情況將數(shù)據(jù)分為高低兩組,這里區(qū)分的方式一般采用四分位數(shù)(將一組數(shù)據(jù)由小到大排列并分成四等份,處于三個分割點位置的數(shù)值就是四分位數(shù)。處于正中位置的數(shù)字就叫做中位數(shù),如果數(shù)組個數(shù)為奇數(shù)個,則中位數(shù)為排序后中間的一個數(shù),如果數(shù)組個數(shù)為偶數(shù)個,則中位數(shù)為排序后中間兩個數(shù)的平均數(shù)。),而不是評分制的平均數(shù)。
分位數(shù)相對于平均數(shù)應(yīng)用場景更廣,由于大部分數(shù)據(jù)都呈現(xiàn)長尾分布,80%甚至90%以上都集中在低頻低額區(qū)間,少數(shù)的用戶提供了大部分銷售,采用平均數(shù)無法很好的體現(xiàn)數(shù)組的特性,長尾用戶很容易被平均,
下面舉個例子:土豪身價2個億,屌絲產(chǎn)品經(jīng)理身價20萬,兩人平均后,平均身價1個億……
例子并不恰當,但是能看出在數(shù)據(jù)呈現(xiàn)長尾分布的場景中,平均數(shù)在很多場景并不合適,而采用四分位數(shù)時,可以根據(jù)數(shù)據(jù)分布情況,選擇中位數(shù)、四分之一位數(shù)或者四分之三位數(shù),然后高于則劃分為高緯度,低于則劃分為低緯度。
這里有一點需要注意!
由于R值的大小和用戶價值呈現(xiàn)反比,所以高于分位數(shù)的時候算低緯度,低于分位數(shù)時算高緯度。
第二步:量化用戶價值
首先解決R、F、M三值量級不均衡的問題,然后計算RFM總值量化用戶價值。可將三組數(shù)據(jù)分別無量綱化處理映射至0到1的區(qū)間在合理放大然后相加。很多同學一聽到算法就暈了,我挑選了這個方法中最簡單的一種,只用到了我們初中所學的數(shù)學,邏輯非常簡單,下面我為大家介紹min-max歸一化。
min-max歸一化
先貼公式:
上式中,min是數(shù)組中的最小值,max是數(shù)組中的最大值。只要將數(shù)組中的數(shù)據(jù)依次經(jīng)過上述公式處理,最后發(fā)現(xiàn)原數(shù)組收斂到了0至1的區(qū)間之內(nèi),是不是很簡單。
下面是我隨機生成的一組數(shù)據(jù)為大家示例:
第一組源數(shù)據(jù)經(jīng)過無量綱化處理后收斂至了0到1區(qū)間之內(nèi),可將不同量級的數(shù)據(jù)歸一化至同一量級,歸一化后的數(shù)據(jù)是一個位數(shù)極多的小數(shù),而一般用戶對于極小數(shù)和極大數(shù)沒有直觀的感受。
所以這里我把所有的數(shù)據(jù)同比放大了100倍,將源數(shù)據(jù)擴大到了0至100的區(qū)間,同時做了四舍五入,讓數(shù)據(jù)可讀性更強。經(jīng)過這樣的處理就將數(shù)據(jù)從原來不同量級無法直觀對比,歸一化到了0至100的區(qū)間,方便大家直觀計算RFM總值。
最后計算RFM總值的公式如下:RFM總值?=?R值*(-1)+F值+M值+100;
公式中同樣為了解決R值同F(xiàn)、M值統(tǒng)計維度不一樣的問題,這里給R值乘以了負1,同時為了保證數(shù)據(jù)結(jié)果不會出現(xiàn)負數(shù),又在最后加了100。這樣處理之后保證最后的RFM總值落在了0至400的區(qū)間之內(nèi),讓大家可以通過分值很直觀的量化用戶價值。
總之,RFM最終的目的就是幫助業(yè)務(wù)提高運營效率和產(chǎn)出價值,上述介紹了兩種方法,一種通過經(jīng)驗人工劃分出用戶群體,一種通過數(shù)據(jù)挖掘,給與業(yè)務(wù)運營建議。
具體的業(yè)務(wù)應(yīng)用場景還是以淘氣值為例(均為個人猜想,如果哪里說得不對,還請留言告知,謝謝)。
- 購物分:是近12個月購買金額的綜合分值。每一筆訂單、每日、每月、每一類商品、每一個店鋪,可獲得的最高可得分都不同,另外,購買更多種類的、高信譽商家的商品可以得到更多分;
- 獎勵分:獎勵分是近12個月內(nèi)購買的商品類目數(shù),反映真實消費體驗的文字評價、帶圖評價、追評、分享被點擊數(shù)、問大家參與次數(shù)、購買成交天數(shù)、連續(xù)購買月數(shù)的綜合分值。獎勵分受購物分正向影響,購物分越高,獎勵分越高;
- 基礎(chǔ)分:基礎(chǔ)分由當前信譽等級決定。信譽等級越高,基礎(chǔ)分越高,并且可得購物分和獎勵分的分數(shù)越高。
購物分圍繞著用戶的近12個月消費記錄,獎勵分則是圍繞著用戶的實際互動行為,包括評價、分享、參與次數(shù)等。這里特別強調(diào)一點RFM模型不僅僅針對消費數(shù)據(jù),可以試試其他新的花樣,比如:
- 互動行為:最近一次互動時間、互動頻次、用戶的互動次數(shù);
- 直播行為:最近一次觀看直播時間、直播觀看頻次、觀看直播累計時長;
- 內(nèi)容行為:最近一次觀看內(nèi)容時間、觀看內(nèi)容頻次、觀看內(nèi)容字數(shù);
- 評論行為:最近一次評論時間、評論頻次、累計評論次數(shù)等等等等。
以上這些只是我的簡單思考,希望可以給大家更多的啟發(fā)。
淘寶根據(jù)用戶的淘氣值將用戶分成了三種類型:
- 普通會員:0?≤?淘氣值?<?1000;
- 超級會員:1000?≤?淘氣值?<?2500;
- APASS會員:2500??≤?淘氣值。
分別設(shè)定了不同的權(quán)益針對性運營,在推出88會員的時候淘氣值高于1000分的用戶可以以88元直接購買會員。同時在淘氣值頁面看到了88會員中心【敬請期待】的頁面,在結(jié)合88會員入口處【花小積分?兌大權(quán)益】的文案,相信未來淘寶會在88會員上有新的運營動作。
最后關(guān)于無量綱化處理的方法還有很多,我這里介紹了最簡單的一種,喜歡研究的同學可以自行百度。
會員系列的第二篇,終于在糾結(jié)了兩周反復難產(chǎn)的過程中完成了。
相關(guān)閱讀
本文由 @萌面趙先生 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議
你咋這么牛?
膜拜
你用評分法的時候,提到了用5分制來打分。有講到了單組數(shù)列根據(jù)四分法來講數(shù)組分成4段,請問4段區(qū)間,怎么用5分制來打分?那豈不是有一個數(shù)字用不到嗎?
謝謝分享,很有幫助!
還想問個問題,如何確定合適的統(tǒng)計周期呢?比如我選取1個月的數(shù)據(jù),那么近一個月未消費的用戶是不是R為30、F和M都是0?但是他可能1個月之前消費了,這里我還不太清楚是不是理解錯了,還是說任何時候都跑全量數(shù)據(jù)?能否指導一下。
我也有同樣的問題:
1. 數(shù)據(jù)集的時間范圍,是不是任何時候都是全量數(shù)據(jù);
2. F與M的統(tǒng)計周期是否一致,這個統(tǒng)計周期是不是就是數(shù)據(jù)集的時間范圍;
3. 不同時間的RFM對比有無意義;
第二種方式說的還是不夠清楚,看完還是不懂怎么計算
這個錄音是ai嗎
作者你好,請問下,在衡量M的平均值的時候是中位數(shù)還是四分位數(shù)?有沒有針對不同的數(shù)據(jù)分布,用不同的數(shù)值來衡量的情況?
您好,請問下,量化數(shù)據(jù)的時候,max和min分別取的是個人消費中金額的最大最小值還是所有用戶消費中的最大最小值呢?
所有用戶的最大值和最小值
你好,RFM模型的比例應(yīng)該怎么算呢
謝謝,收獲很大。
有幾個個拙見
1)建議RFM值都添加上權(quán)重
2)歸一化的過程中建議添加專家接入的接口
3)增加數(shù)據(jù)驗證和調(diào)試的手段
說的很棒!
權(quán)重根據(jù)業(yè)務(wù)大家可以自行調(diào)整,是個不斷摸索的過程,初期不建議大家上來就直接上權(quán)重,不同的權(quán)重能直接導致用戶分群質(zhì)量的不同,錯誤的業(yè)務(wù)理解有可能帶來災(zāi)難性的后果
歸一化的過程看公司的技術(shù)實力。。。之前業(yè)務(wù)部門研發(fā)實力有限,所以采用了這種實現(xiàn)簡單,但是效率不足的方案。此時有專家介入給出專業(yè)方案自然更好
沒看明白計算RFM總值的意義是啥?是為了分組后同組內(nèi)價值評估嗎?
你好 ,請問R值為什么要乘以負1呢
你好,因為R值表示的是用戶距離最近一次消費的時間,距離當前越遠值越大。但是真實的用戶行為是活躍的用戶更容易發(fā)生交易,而活躍就意味著距離當前時間越短越好,所以整體將R值乘以-1,將數(shù)值的大小轉(zhuǎn)置,從而體現(xiàn)真實的用戶行為
核心理解是時間距離越短越好,所以
1、如果R的時間距離越遠,賦值越大,則需要乘以-1
2、如果R的時間距離越近,賦值越大,則不需要乘以-1
算法方式中,通過四分位點已經(jīng)可以把用戶劃分成不同的種類,那后面把它們?nèi)チ烤V化后,計算它們的評分的作用是什么呢?
同問?
有rfm分箱模型分析的介紹嗎
這個用excel能處理么
可以的,文中示例就是用Excel處理的 ,具體還是要看數(shù)據(jù)量
處理之后保證最后的RFM總值是不是落在了0至300的區(qū)間之內(nèi)
是的,筆誤 ?? 處理之后的總值是在0至300之內(nèi) ~
比其他講rfm的文章更深入… 不錯
還有,可否細致講講建立rfm分層時候的注意點呢
在利用中位數(shù)區(qū)分單個維度的高低時,要根據(jù)實際情況以及數(shù)據(jù)質(zhì)量決定是否去除異常值。
例:
大部分數(shù)據(jù)是呈現(xiàn)長尾形態(tài)的,很多體驗型客戶可能互動時間在好幾年以上,成交金額只有幾分,或者累計只成交過一次,如果把這類型數(shù)據(jù)也考慮進來的話會導致高緯度區(qū)間直接包含了所有的活躍用戶,導致分群用戶特征不明顯,所以在處理時,建議根據(jù)業(yè)務(wù)特性,將異常值或者長尾值先處理掉在進行分群。
直接說是進行數(shù)據(jù)預處理就好了,講高低維度什么的,然后也沒發(fā)現(xiàn)這個高低維度和下文啥關(guān)系,看了你評論才知道,原來這個高低維度是用來進行數(shù)據(jù)預處理的……
文章棒棒的,清晰明了,但里面有個邏輯想問下。
為何要對RFM總值進行量化,而不是根據(jù)單獨的R,F,M三個值在中位數(shù)的高低組合來進行分類。
何為量化?因為要明確,清楚,具體,而根據(jù)單獨的R,F,M三個值在中位數(shù)的高低組合來進行分類不夠具象。
1.R、F、M三個值的高低組合反饋的是用戶的特征,然后針對特征制定運營策略;
2.如果用戶量進一步擴大,而運營資源又有限的情況下,就需要對單一群體內(nèi)的用戶價值在量化,這時就需要用戶總值了;
3.某些場景下可能需要針對總體用戶池的用戶做價值量化,單純的高低維分組無法滿足,所以同樣需要RFM總值。