評分算法(3):服務分策略設計的3個方法
按照服務分的更新機制,服務分可以分為兩類:一類是每次服務后更新,一類是定期更新。在介紹了服務分的設計場景和思路之后,本文作者對服務分策略設計的具體方法展開了分析和總結,包括:歸一化、權重設計和歸因。
一、服務分分類
1. 服務后更新
服務后更新顧名思義,比如每次打車后根據(jù)用戶的評價進行服務分的調(diào)整,滴滴就是這么做的。記不清哪里看的了(反正肯定不是兩年前看的內(nèi)部文檔),滴滴的服務分主要部分會根據(jù)好評、差評和默認好評去打分,每次用戶打分會對應分值的變化。
這樣的好處是可以及時更新,服務者會有及時反饋。
當然,局限性也很明顯。乘客的好評不能完全評價司機的服務能力,比如司機接單少業(yè)績差、高峰期不愿意出門等。而如果平臺派單問題導致乘客體驗下降,差評由司機承擔也不公平。與此同時,全靠好評會造成司機索要好評的問題,對服務質(zhì)量也有影響。
2. 定期更新
定期更新是本文的重點,也是上一篇文章重點討論的內(nèi)容。因為用了更復雜的計算機制,可以涵蓋更多的數(shù)據(jù),比如上一篇文章提到的,服務分的三部分構成:員工屬性、SOP執(zhí)行情況、業(yè)績結果。這里面涉及了多種策略設計的方法。
二、歸一化
員工屬性和SOP執(zhí)行情況的數(shù)據(jù)各種各樣,比如有沒有某個資格證是0和1;某個資格證分等級,則可能是(1,2,3);電話的通話時長是一個大于等于零的小數(shù);服務次數(shù)是一個非負整數(shù)。
為了將這些不同類型的數(shù)據(jù)融合,需要進行歸一化,這些方法我在《產(chǎn)品邏輯之美》中也寫過。
線性函數(shù)是一種簡單的歸一化方式,就是直接除以數(shù)據(jù)中的最大值,讓所有值都在0~1之間,并保留原有的變化性質(zhì)。用公式表示為:
這樣的處理方法受極值的影響比較大。而且如果大部分分值比極值低很多,則低分值將沒有區(qū)分度,以閱讀量為例,如果最大閱讀量的文章的閱讀量為10萬,而大部分文章閱讀量集中在500左右。這樣直接除以極大值處理后,大部分內(nèi)容分值都趨近于0,缺乏區(qū)分度。
這個時候就需要在使用線性函數(shù)處理前,對數(shù)值進行對數(shù)處理,用公式表示為:
對數(shù)處理后的數(shù)據(jù)結果表示原始數(shù)據(jù)數(shù)量級的大小,在互聯(lián)網(wǎng)數(shù)據(jù)中,長尾分布的案例比較多,使用對數(shù)函數(shù)轉(zhuǎn)換是一種非常有效的方法。除了對數(shù)函數(shù),也可以根據(jù)數(shù)據(jù)的分布,使用其他函數(shù)來改變數(shù)據(jù)的分布性質(zhì),比如多項式函數(shù),這里就不再贅述。
z分數(shù)(z-score)標準化也是常用的一種歸一化方法。在一組數(shù)據(jù)中,x為某一具體分數(shù),μ為平均數(shù),σ為標準差,用公式表示為:
z代表著原始分數(shù)和母體平均值之間的距離,以標準差為單位計算。在原始分數(shù)低于平均值時,z則為負數(shù),反之則為正數(shù)。當然,z分數(shù)標準化處理的隱含前提是數(shù)據(jù)符合正態(tài)分布,或者類似正態(tài)分布。如果數(shù)據(jù)分布和正態(tài)分布差距明顯時,用z分數(shù)標準化則可能會有問題。
當然,z標準化后的數(shù)據(jù)也需要處理一下,這個就根據(jù)正態(tài)函數(shù)的性質(zhì)處理了。
比如下面的公式就可以控制在0~1之間,而這個公式的數(shù)學含義就不展開討論了,感興趣可以自己推導一下。
三、權重設計
當數(shù)據(jù)歸一化之后就要進行加權求和,加權求和的公式是很常見的,如下所示:
這里需要考慮到如何設計權重。主要有以下幾種思路。
1. 信息權重
從信息的角度,如果一個信息出現(xiàn)的概率越小,則信息量越大,一個信息越常見,則信息量越小。那么比如某個證書是否取得這個數(shù)據(jù)。取得證書的人越多,取得后的權重應該越少。這里的權重需要設計出一個函數(shù),函數(shù)值和比例負相關。比如最簡單的線性函數(shù)如下:
2. 置信度權重
置信度提權的原理是“數(shù)據(jù)量越大,信息越靠譜”,平均值、打分等方法都有比較好的效果,比如平均時長,平均評分。如下所示,N代表數(shù)據(jù)的數(shù)量,score代表原始打分。
3. 時間衰減
時間衰減降權,顧名思義,讓過去的信息權重更低,最近的信息權重更高。因為行為具有連續(xù)性,所以最新的行為包含了更大的信息量。下面的公式是最常見的時間衰減公式,也是物體降溫和自然衰變的公式,其中t是數(shù)據(jù)發(fā)生時間到現(xiàn)在的時間差。
4. 業(yè)務權重
當然,不同因素之間彼此哪個更重要,的確是一個業(yè)務問題,需要和業(yè)務方共同商定。業(yè)務方不一定需要給出具體的權重,可以給出優(yōu)先級,根據(jù)優(yōu)先級確定具體的數(shù)學規(guī)則。這里的方法不展開講了,核心是達成共識。
四、歸因
歸因本質(zhì)上是確定清楚具體的服務人員的貢獻。因為一個服務的結果(比如是否下單)背后是多因素的,服務人員只是多個環(huán)節(jié)中的一環(huán)。
歸因是策略分析中最復雜的問題,但是也有很多系統(tǒng)性的歸因方法。數(shù)學功底比較好的同學我推薦系統(tǒng)看下《基本有用的計量學》。那這里長話短說,我去掉復雜的數(shù)學語言,艱難表述下也是兩種書中提到的方法。
第一種就是回歸算法,多個因素的話,可以使用多元線性回歸和邏輯回歸,如果需要考慮時序上的區(qū)別,時間序列的算法也可以考慮。每種算法都有對應的數(shù)學假設,在使用前要確保業(yè)務場景符合數(shù)學假設。
第二種就是找到一個指標找到一個參考標準,具體服務者的數(shù)據(jù)和參考基線的數(shù)據(jù)差是對應的貢獻值。比如配送員的配送準時率,參考標準可以是同配送站準時率的均值。每個配送員計算后,再用這個差值作為配送時效分值計算的基礎數(shù)據(jù),進行歸一化和后續(xù)的加權求和。
還有一些更復雜的衡量因果效應的方法,還是建議去閱讀專業(yè)書籍。本文已經(jīng)有太多公式了,再加真要沒閱讀量了。
小結
關于服務分一共寫了三期文章,這是B端策略的一個重要課題,但是在整個產(chǎn)品經(jīng)理的業(yè)務范圍內(nèi),還是一個非常窄的選題。大部分同學可能對這個選題不感興趣,但希望這些內(nèi)容可以幫助到工作中涉及到服務分和服務者績效衡量的同學。
#相關閱讀#
#專欄作家#
潘一鳴,公眾號:產(chǎn)品邏輯之美,人人都是產(chǎn)品經(jīng)理專欄作家。畢業(yè)于清華大學,暢銷書《產(chǎn)品邏輯之美》作者;先后在多家互聯(lián)網(wǎng)公司從事產(chǎn)品經(jīng)理工作,有很多復雜系統(tǒng)的構建實踐經(jīng)驗。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議
這個就比上一篇好多了。略牛逼