如何處理多因子權(quán)重賦值的問(wèn)題?

14 評(píng)論 13298 瀏覽 60 收藏 7 分鐘

已知參與計(jì)算的各個(gè)feature,如何去確定每個(gè)feature的權(quán)重呢?本文將為大家介紹一種相對(duì)科學(xué)的辦法,來(lái)處理這種多因子權(quán)重設(shè)置的問(wèn)題。

數(shù)據(jù)處理領(lǐng)域,在進(jìn)行相關(guān)指標(biāo)計(jì)算的時(shí)候,一個(gè)指標(biāo)通常有若干了因子(通常稱之為feature,下同)參與計(jì)算,而每個(gè)因子對(duì)該指標(biāo)的貢獻(xiàn)度(通常稱之為weight或contribution,下同)又不同,比如GMV,商品人氣分,用戶滿意度等等。通??梢员硎緸槿缦鹿剑?/p>

這時(shí),我們通常遇到下面這個(gè)問(wèn)題:

已知參與計(jì)算的各個(gè)feature,如何去確定每個(gè)feature的權(quán)重呢?

夏唬人目前在做電商推薦策略相關(guān)的事情,經(jīng)常遇到這種問(wèn)題。

比如在物品(通常稱之為item,下同)召回的時(shí)候,如何對(duì)每個(gè)item進(jìn)行排序呢?

比如以人氣分作為排序依據(jù),那么通常會(huì)考慮銷量,評(píng)價(jià),瀏覽次數(shù),下單次數(shù),收藏次數(shù),加購(gòu)次數(shù)等等。

如果一味的按照經(jīng)驗(yàn)去進(jìn)行初始化權(quán)重,然后不停的A/B測(cè)試、權(quán)重調(diào)整,是一件研發(fā)成本特別高的事情。

今天就給大家介紹一種相對(duì)科學(xué)的辦法來(lái)處理這種多因子權(quán)重設(shè)置的問(wèn)題。

AHP

簡(jiǎn)單介紹一下什么是AHP?

層次分析法,簡(jiǎn)稱AHP,它是一種運(yùn)籌學(xué)理論。

是指將與決策總是有關(guān)的元素分解成目標(biāo)、準(zhǔn)則、方案等層次,在此基礎(chǔ)之上進(jìn)行定性和定量分析的決策方法。

“該方法是美國(guó)運(yùn)籌學(xué)家匹茨堡大學(xué)教授薩蒂于20世紀(jì)70年代初,在為美國(guó)國(guó)防部研究”根據(jù)各個(gè)工業(yè)部門(mén)對(duì)國(guó)家福利的貢獻(xiàn)大小而進(jìn)行電力分配”課題時(shí),應(yīng)用網(wǎng)絡(luò)系統(tǒng)理論和多目標(biāo)綜合評(píng)價(jià)方法,提出的一種層次權(quán)重決策分析方法?!?/p>

所以,AHP理論本質(zhì)是通過(guò)把一個(gè)復(fù)雜的問(wèn)題拆解為多個(gè)目標(biāo)或準(zhǔn)則,并且通過(guò)定性量化的方式為每個(gè)目標(biāo)進(jìn)行賦權(quán)的一個(gè)過(guò)程。

簡(jiǎn)單來(lái)說(shuō)AHP就是拆解加賦權(quán),下面詳細(xì)講一下過(guò)程。

AHP多因子賦權(quán)應(yīng)用

1. 構(gòu)造判斷矩陣

什么是判斷矩陣?

判斷矩陣就是以參與指標(biāo)計(jì)算的所有ferture組成的一個(gè)方陣,并且給出兩兩“比較量化值”。舉例如下:

對(duì)于A和B兩個(gè)因子,1表示:A和B一樣重要;3表示:A比B重要一些;5表示:A比B重要;7表示:A比B重要的多;9表示:A比B極其重要,具體標(biāo)準(zhǔn)如下圖所示:

這其實(shí)就是一個(gè)典型的小組投票的過(guò)程,通過(guò)在方陣行列元素的兩兩比較,最終可以生成一個(gè)判斷矩陣。比如對(duì)于有A,B,C,D四個(gè)feature的判斷矩陣如下圖所示:

2. 一致性校驗(yàn)

所謂一致性校驗(yàn)是指在進(jìn)行投票的時(shí)候的公平性和一致性。

比如你認(rèn)為A比B重要,B比C重要,但是從最后的結(jié)果來(lái)看是C比A重要,這樣即為不一致。

一致性校驗(yàn)是通過(guò)計(jì)算校驗(yàn)系數(shù)來(lái)實(shí)現(xiàn)的,通常用CR來(lái)表示,小于0.1即表示一致性校驗(yàn)通過(guò)。

CR包含一致性指標(biāo)(CI)和隨機(jī)一致性指標(biāo)(RI)兩部分,CR=CI/RI。

CI和RI是一個(gè)固定值,與矩陣的階數(shù)有關(guān)。

剩下的是一個(gè)比較復(fù)雜的數(shù)學(xué)過(guò)程,簡(jiǎn)單介紹幾個(gè)概念,計(jì)算過(guò)程大家可以百度一下即可。

下圖是通過(guò)excel進(jìn)行計(jì)算的:

通過(guò)進(jìn)行小組投票和自動(dòng)計(jì)算,最終CR的值為0.06,因此一致性檢驗(yàn)通過(guò)。

權(quán)重Wi列即為每個(gè)feature的權(quán)重,因此最終我們可以得出該指標(biāo)的計(jì)算公式為:

完美解決!

說(shuō)在最后

大家這里或許會(huì)有個(gè)疑問(wèn):

采用AHP的方法進(jìn)行賦權(quán),小組投票階段是主觀判斷重要性的,所以是不是會(huì)帶來(lái)誤差?

會(huì),一定會(huì)。

不過(guò)還是我之前說(shuō)的,策略一定是建立在業(yè)務(wù)之上的,撇開(kāi)業(yè)務(wù)談策略都是偽策略。

采用AHP模型進(jìn)行多因子賦權(quán),

需要對(duì)該業(yè)務(wù)有足夠的了解,更需要對(duì)該target下的多個(gè)feature有足夠的了解,哪個(gè)對(duì)于target的貢獻(xiàn)度是最大的。

比如對(duì)于一個(gè)商品,什么樣的商品是用戶喜歡的?用戶喜歡的商品有哪些feature?每個(gè)feature對(duì)于用戶喜歡的貢獻(xiàn)程度是什么樣的?這些都是需要業(yè)務(wù)經(jīng)驗(yàn)參與的。

如果說(shuō)科學(xué)的方法都有一個(gè)前提假設(shè),那么AHP也有一個(gè)前提,就是先了解業(yè)務(wù),再談策略。

以上,希望能幫助到大家。

 

作者:夏唬人。公眾號(hào):夏唬人,某廠推薦策略產(chǎn)品經(jīng)理。

本文由 @夏唬人 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來(lái)自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 作者你好,我想問(wèn)一下,在前期的工作中,小組投投票后怎么計(jì)算分值?平均值?還是其他方法?還有就是A對(duì)B通過(guò)投票出來(lái)了,那B對(duì)A是倒數(shù)一下就好了還是也要投票?

    來(lái)自浙江 回復(fù)
  2. 會(huì)的不用看,看的也不會(huì),說(shuō)的太模糊了

    來(lái)自北京 回復(fù)
  3. 為什么excel里的RI是0.89

    來(lái)自廣東 回復(fù)
  4. 看不懂,能說(shuō)下具體每個(gè)值的計(jì)算嗎?

    來(lái)自廣東 回復(fù)
    1. 有時(shí)候沒(méi)必要了解具體每一個(gè)值的計(jì)算方式~

      來(lái)自北京 回復(fù)
  5. 那個(gè)1.67是怎么來(lái)的,第一個(gè)表里寫(xiě)的重要不重要用奇數(shù)表示,但是下邊的表里出現(xiàn)了1.67

    來(lái)自北京 回復(fù)
    1. 那個(gè)0.6的倒數(shù)。第一個(gè)表只是個(gè)判斷標(biāo)準(zhǔn),非固定的值

      來(lái)自北京 回復(fù)
  6. 2.11如何得來(lái),求解釋

    回復(fù)
    1. 計(jì)算很復(fù)雜,可以從我公眾號(hào)后臺(tái)拿到模板,看具體的公式設(shè)置

      來(lái)自北京 回復(fù)
  7. 2.11如何得來(lái)

    回復(fù)
  8. 作者可以解釋一下為什么矩陣表里的ibc是1.67嗎,這里看不太懂,謝謝啊~

    來(lái)自江蘇 回復(fù)
    1. 以對(duì)角線為界,右上角是左下角的倒數(shù)。舉個(gè)例子,好比A比B重要5倍,那么B比A的話就是“重要”0.2倍了

      來(lái)自北京 回復(fù)
  9. 上面我是用excel進(jìn)行推導(dǎo)計(jì)算的,相關(guān)的模板都已經(jīng)放在公眾號(hào)后臺(tái),計(jì)算公式已經(jīng)設(shè)置好下載即可直接用,公眾號(hào)回復(fù)“AHP”領(lǐng)取計(jì)算模板。

    來(lái)自北京 回復(fù)
    1. 沒(méi)有完全看懂,決定再看一遍

      回復(fù)