不會算法只用EXCEL如何構(gòu)建RFM會員價值模型
編輯導語:RFM模型是與用戶價值相關(guān)的常見模型之一。那么,RFM模型具體應該如何應用?如果非專業(yè)數(shù)據(jù)師,又該如何利用常見工具Excel來計算RFM值、得出有效數(shù)據(jù)呢?本文作者就介紹了用Excel來構(gòu)建RFM模型的方法,讓我們來看一下。
一、引言
如果你聽過客戶關(guān)系管理(CRM),那么你大概率上也曾聽到過RFM模型。在精細化運營的今天,在解決如何更好的挖掘用戶價值之前,首先要解決的問題是如何衡量用戶價值?
和用戶價值有關(guān)的模型非常多,除了RFM模型之外,還有客戶生命周期價值模型(CLV模型)、客戶生命周期模型(AARRR模型)等。不同的模型切入的角度以及具體的應用不同,我們今天主要講的是RFM模型。
本文主要分為兩個部分:一是理論部分,簡單告訴大家RFM模型是什么?能夠給生意帶來什么幫助?二是計算部分,如何只用EXCEL就可以計算RFM值并得出用戶分層數(shù)據(jù)。
二、理論部分
1. RFM模型有什么用?
舉例來說:某品牌經(jīng)過10年的運營,擁有了500萬的注冊會員,這個數(shù)字是明確且可統(tǒng)計的。在這500萬的注冊會員中有400萬的注冊會員產(chǎn)生過購買行為。那么這400萬產(chǎn)生過購買行為的會員中,有多少會員是品牌的忠誠用戶?有多少會員已經(jīng)流失?又有多少會員即將流失?
針對這些不同類型的用戶,如何才能實現(xiàn)快速獲取并快速定制運營方案?甚至可以直接設(shè)置自動化精準定向營銷呢?
RFM模型可以給你解答這一系列的問題,只有掌握了品牌會員的不同分類以及價值,才能夠有針對性地設(shè)計運營活動,從而提高最終的成交轉(zhuǎn)化。
2. 什么是RFM模型?
根據(jù)美國數(shù)據(jù)庫營銷研究所Arthur Hughes教授的研究表明,在客戶的數(shù)據(jù)庫中有三個要素,這三個要素構(gòu)成了分析用戶價值的重要指標:
- R (Recency) : 最近一次交易時間間隔;
- F(Frequency) : 消費頻率;
- M(Monetary): 消費金額。
RFM模型即是這三個單詞的首字母組合。
R (Recency) : 最近一次交易時間間隔,指的是消費者最后一次成交距統(tǒng)計時間的間隔。
例如消費者最后一次的交易時間是2021年3月6日,統(tǒng)計時間是2021年4月6號,那么間隔時間R=30天,即消費者最后一次成交發(fā)生的時間距統(tǒng)計時間的間隔是30天。
F(Frequency) : 消費頻率,指的是在統(tǒng)計時間段內(nèi),消費者的消費次數(shù)。
例如統(tǒng)計時間是2021年的1月到3月,消費者在這期間一共消費了5次,那么正常情況下F=5。
有人可能會問:如果這5次消費行為中,有兩次消費行為(兩筆訂單)發(fā)生在很短的時間內(nèi),例如10分鐘以內(nèi),那么F=5還是F=4更合理呢?
筆者認為這需要根據(jù)公司的具體業(yè)務形態(tài)擬定。我們在定義F值的時候之所以會有這樣的顧慮是因為通常情況下,我們把消費者在很短時間內(nèi)多次下單的行為看做是一次消費行為,消費者拆單可能是為了湊滿減滿贈等。
回到問題的本源:我們統(tǒng)計F這個指標主要是為了衡量消費者的活躍性,哪種方式更能夠代表行業(yè)特征或公司業(yè)務形態(tài)就采用哪種方式。當然業(yè)務特殊(例如生鮮外賣)或是為了統(tǒng)計方便,也可以直接把F=消費次數(shù),不考慮消費時間間隔極短的情況。
M(Monetary): 消費金額,指的是在統(tǒng)計時間段內(nèi),消費者的累計消費金額。
在其他條件相同的情況下,R/F/M值具備如下特征:
- R值越小,用戶價值越高,1年前在本店消費過的用戶,價值肯定沒有1天前在本店消費過的客戶價值高。
- F值越大,用戶越活躍且忠誠,也就是說經(jīng)常購買的用戶肯定比偶爾購買的用戶價值要高。
- M值越大,用戶價值越高。M值體現(xiàn)的是用戶的購買力,購買力越高的用戶價值自然也越大。
我們基于RFM三個值,可以構(gòu)建出一個三維的坐標體系,把用戶分成8個層級,如下圖所示:
用表格的形式展現(xiàn)更便于理解:
整理成這樣的形式就比較好理解了,我們把所有的用戶,從RFM三個維度切分成了8種不同的類型。
3. RFM模型的應用場景
簡單舉幾個例子來說明不同類型的用戶,運營策略的不同。
1)針對【重要價值客戶】
即RFM值均高的用戶,我們通常稱之為“至尊用戶”,也是整個品牌用戶群體中金字塔頂端的那一撥人,購買頻率高,金額貢獻高,而且頻繁光顧店鋪。
針對這波用戶,運營的主要策略是:保持穩(wěn)定增長,“至尊用戶”的數(shù)量不要出現(xiàn)流失,并且能夠不斷從下層用戶中往上輸送新的“至尊用戶”。很多公司都會針對這波用戶出具一些特殊的權(quán)益,例如專屬服務或“專屬生日禮盒”等。
2)針對【重要挽留用戶】
即很久沒有進行復購,但之前的購物金額以及購物頻率都很高的用戶,如果放任不管,這波用戶很可能隨著時間的流逝而流失。
運營的主要策略是復購,可通過發(fā)放專屬權(quán)益、針對性折扣、贈品等一系列的定向優(yōu)惠形式使得這波用戶重新光臨店鋪,對比拉新的成本,重新讓這波用戶再次回購的成本要低的多了。
3)針對【一般價值客戶】
即RF值高但是M值小的用戶,比較活躍但是成交金額比較低的用戶。一般這類用戶我們會稱之為活躍用戶,而且價格敏感型居多。
運營的主要策略是針對這波用戶提高他們的客單價,可以通過定向搭配購、加錢換購等形式不斷提高該波用戶的客單價,商品購物籃推薦也是非常有用的。
這些運營策略僅供拋磚引玉,不同公司業(yè)務模式不同,因此在定義【用戶等級】以及主要的運營策略過程中,需要根據(jù)業(yè)務的實際情況進行擬定,不可直接照搬。
三、如何構(gòu)建RFM模型?
“道理我懂了,關(guān)鍵是怎么落地呢?”作為一名運營,尤其是公司有專業(yè)的數(shù)據(jù)分析團隊以及CRM團隊的運營來說,一般情況下,知道用戶分層定義的邏輯就可以了。
日常工作中,運營做的更多的是,知道本公司的用戶是如何分類的,每一種類型的定義是什么?針對不同的人群應該出具何種運營策略,這些運營策略實施的效果如何?并且如何不斷優(yōu)化運營策略……更多的重心是放在數(shù)據(jù)的應用上,對于模型的構(gòu)建以及算法的應用,知道的不多。
而且通常情況下,一家公司的會員模型構(gòu)建完成后,在相當長的一段時間內(nèi)不會有任何的調(diào)整(除非業(yè)務模式發(fā)生變化)。
那么問題來了。
公司規(guī)模比較小或者項目初期,公司沒有CRM部門、沒有數(shù)據(jù)分析部門,很多工作需要運營去張羅的時候,如何能夠利用RFM模型對現(xiàn)有人群做分層管理呢?
不懂算法、不會Python、不會SQL、統(tǒng)計學也不太好的情況下,只是利用Excel,如何能夠把手頭上已有的用戶人群來進行分層打標簽呢?
這里和大家分享兩種只用EXCEL就可以計算的方法。
1. 數(shù)據(jù)源準備
在開始之前我們需要準備好分析用的源始數(shù)據(jù) 。
我們能夠方便獲得的是店鋪在一定時間內(nèi)的交易數(shù)據(jù),包含:用戶名、訂單編號、訂單金額、訂單時間等字段的數(shù)據(jù)。我們利用交易數(shù)據(jù)可以提取到我們需要的RFM數(shù)據(jù),利用簡單的IF函數(shù)和數(shù)據(jù)透視表就可以實現(xiàn)了。
因為Excel表格太大拖不動的緣故,我選擇了網(wǎng)站2018年-2020年,2年的交易數(shù)據(jù),對他們進行處理后得到如下數(shù)據(jù):
對會員ID做了模糊化處理,一共得到19萬條的用戶數(shù)據(jù),分別知道每一個會員的RFM對應的值是多少。
2. 數(shù)據(jù)計算方法
在我們知道每一名用戶對應的R/F/M值以后,我們需要知道RFM三個數(shù)值分別是多少才算是高 or 低?
1)方法一:四分位數(shù)法
① 四分位數(shù)理論
四分位數(shù)是統(tǒng)計學分位數(shù)中的一種,把所有數(shù)值從低到高(或者從高到底)排列并分成四等份,處于三個分割點位置的數(shù)值就是四分位數(shù)。
一般表示為:
- Q1:樣本排列中處于25%位置的數(shù)字;
- Q2:又稱為中位數(shù),指的是樣本排列中處于50%位置,即中間位置的數(shù)據(jù);
- Q3:樣本排列中處于75%位置的數(shù)字。
假設(shè)樣本數(shù)據(jù)項數(shù)一共是N:
- 則Q1的位置數(shù)值=(N+1)/4;
- Q2的位置數(shù)值=(N+1)/2;
- Q3的位置數(shù)值=3(N+1)/4。
如果(N+1)恰好是4的倍數(shù),則確定四分位數(shù)比較簡單,如果不是4的倍數(shù),相關(guān)位置的四分位數(shù)就應該是相鄰兩個數(shù)值的標志值的平均數(shù)。
權(quán)數(shù)的大小取決于兩個數(shù)值距離的遠近,距離越近權(quán)數(shù)越大,距離越遠,權(quán)數(shù)越小,權(quán)數(shù)之和等于1。
例如一組樣本數(shù)據(jù)如下所示:
N=10,則Q1的位置=11/4=2.75(12和196兩個數(shù)值);Q2的位置=5.5;Q3的位置=8.25。
則有:
- Q1=0.25*第2項+0.75*第3項=0.25*12+0.75*196=150;
- Q2=0.5*第5項+0.5*第6項=0.5*204+0.5*211=207.5;
- Q3=0.75*第8項+0.25*第9項=0.75*234+0.25*261=240.75。
在對應到RFM值的時候,我們可以定義為50%位置以下的數(shù)據(jù)值為【低】,即小于207.5的數(shù)值為低,50%位置以上的數(shù)據(jù)值為【高】,即大于207.5的數(shù)值為高。
也可以定義為75%位置以下的數(shù)據(jù)值為【低】,即小于240.75的數(shù)值為低,75%位置以上的數(shù)據(jù)值為【高】,即大于240.75的數(shù)值為高。
筆者的一般做法是:這兩種劃分位置都算一下,最后看結(jié)果,根據(jù)二八原則來確定選擇哪一種高低分類更合理。
② 四分位數(shù)的應用
筆者直接按照“75%位置以下的數(shù)據(jù)值算低,75%以上的數(shù)據(jù)值算高”的方式來分別計算RFM三個數(shù)值的高低。
先算【R】值,因為R值越小越好,所以R值我們這邊先按【倒序】排列,如此可得:
- N=1096,Q3的位置=3(N+1)/4=822.75;
- Q3=0.75*第822項+0.25*第823項=0.75*274+0.25*273=273.75。
所以,R值≥273.75的值定性為低,R值<273.75的值定性為高,即距離統(tǒng)計時間越短的用戶,價值越高。
計算【F】值:
- N=158,Q3的位置=3(N+1)/4=119.25;
- Q3=0.75*第119項+0.25*第120項=0.75*129+0.25*131=129.5。
所以,F(xiàn)值≥129.5的值定性為高,F(xiàn)值<129.5的值定性為低。
計算【M】值:
N=26387,Q3的位置=3(N+1)/4=19791,恰好是4的倍數(shù),故Q3=第19791項=2018。所以M值≥2018的值定性為高,M值<2018的值定性為低。
三個數(shù)值都計算好之后,整理如下:
如此,我們通過簡單的IF函數(shù)就可以計算出每一名用戶R值的屬性了,如下圖所示:
按照相同的方式為F值和M值作出高低定義,結(jié)果如下:
然后我們根據(jù)如下表格,對所有的用戶進行分層:
就可以得到各個用戶的標簽了,如下圖所示:
2)方法二:評分法
評分法就是先將RFM的價值按照從低到高劃分為1-5分,然后對每一個RFM的值進行打分,這樣每一個RFM值都在1-5分之間,然后分再分別算出RFM三個數(shù)值各自的平均值,高于平均值的定性為“高”,反之定性為“低”。
我們用同樣的一組數(shù)據(jù)來實操給大家看一下。
我們先給RFM三個數(shù)值進行打分,結(jié)合業(yè)務的具體特點,筆者做出如下定義:
有人會問了,我怎么知道小于90天的就是5分呢?
這里推薦三種方式:
- 經(jīng)驗法,根據(jù)自己對業(yè)務所積累的經(jīng)驗來進行劃分,當然也可以參考行業(yè)的常規(guī)定義;
- 將數(shù)據(jù)進行5等分,分成5個區(qū)間塊,每一個區(qū)間范圍分別從高到低進行打分;
- 有點復雜,舉例來說:要算F值的劃分,可以利用數(shù)據(jù)透視知道不同的購買次數(shù)對應的會員人數(shù)是多少?然后對購買次數(shù)進行分組,看會員數(shù)的占比情況,不斷調(diào)整分組步長來進行劃分。也就是說統(tǒng)計歷史數(shù)據(jù),看F值對應的會員人數(shù)占比分別是多少(F=2的在歷史數(shù)據(jù)中的會員人數(shù)占比)?掌握F的數(shù)據(jù)分布情況后再進行打分。
根據(jù)上表,我們對RFM三個數(shù)值分別進行打分,同樣用的是IF公式,我們將會得到如下表格:
然后分別算出R值的平均值是1.78,F(xiàn)值的平均值是1.41,M值的平均值是1.96。
如果某一用戶的R值大于整列的平均值,則定性為“高”,如果低于平均值,則定性為“低”,如下圖所示:
之后的步驟就同方式一所介紹的一樣了,根據(jù)RFM值高低的不同,將所有的用戶分成8個類型即可。
這里介紹的兩種方法是只要通過EXCEL的形式就可以計算出來的,針對規(guī)模較小,或者是沒有數(shù)據(jù)分析部的公司。
而一般情況下,構(gòu)建RFM模型常用的是K-means聚類算法來進行人群RFM值的定義與劃分,但是K-means對于運營人員來說有些吃力了,多是數(shù)據(jù)分析工程師具備的技能了。
還是那句老話,運營通常情況下,會用就可以了,當然如果能知道這個模型的計算邏輯就更好了。
分享結(jié)束,歡迎交流~~~
本文由 @Trinity 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于 CC0 協(xié)議
你好,四分位計算那里不太懂,Q3=0.75*第822項+0.25*第823項,為啥是0.75和0.25呢?
“看F值對應的會員人數(shù)占比分別是多少(F=2的在歷史數(shù)據(jù)中的會員人數(shù)占比)?掌握F的數(shù)據(jù)分布情況后再進行打分。” 這里能否再講講,知道了F的數(shù)據(jù)分布,在打分時應該按照什么方法打分呢? 非常感謝(*^▽^*)!
供應商關(guān)系管理 又有什么 用戶價值模型可以參考。有研究嘛
自己的工作沒有涉及到供應商管理,所以完全沒有研究呢,抱歉~~
感謝lz,請教個問題:四分位數(shù)法里的rfm各自的樣本量n為啥不一樣呢?
我是去重來統(tǒng)計的,例如一組R值可能是:1,1,1,1,2,3,3,6,30,60這樣,然后我對于重復的數(shù)值是做了去重處理的,看的是每一個RFM去重之后的值的分布情況;因為如果不去重的話,劃分出來的區(qū)間數(shù)據(jù)會大量向重復數(shù)值傾斜,尤其是M值。不知道這樣文字表述是否能明白?
理解了!感謝lz分享,受益匪淺!