基于物品相似度的智慧推薦算法

Smile
4 評(píng)論 5986 瀏覽 14 收藏 10 分鐘

編輯導(dǎo)語:智能推薦算法的目的就在于實(shí)現(xiàn)個(gè)性化推薦,根據(jù)用戶興趣和行為特點(diǎn),向用戶推薦所需的信息或商品,幫助用戶在過載信息中快速發(fā)現(xiàn)真正所需的商品,提高用戶黏性;本文作者分享了關(guān)于智慧推薦算法的分析,我們一起來了解一下。

最近接到一個(gè)任務(wù),是一個(gè)教育類App上的智慧推薦版塊,要針對(duì)用戶的購買習(xí)慣推薦相應(yīng)的可購買內(nèi)容,千人千面的滿足客戶的個(gè)性化需求,提高商品的點(diǎn)擊量和購買量。

一、業(yè)務(wù)邏輯及適用機(jī)制

客戶需求具體如下:

  • 展覽服務(wù):結(jié)合以用戶的年齡、興趣、過往觀展記錄生成的用戶畫像,以及展方主推內(nèi)容,為用戶智能推薦展出內(nèi)容,加強(qiáng)用戶體驗(yàn)。
  • 比賽服務(wù):根據(jù)用戶以往參賽、訂閱記錄,以及系統(tǒng)中的參賽選手檔案信息,智能推薦比賽內(nèi)容。
  • 演出服務(wù):根據(jù)用戶購票、退票、觀演歷史和用戶演出評(píng)價(jià)記錄,智能推送用戶可能感興趣的演出。

可以看出,此處智慧推薦的用戶個(gè)性化需求十分強(qiáng)烈,預(yù)設(shè)了用戶比較傾心于他以前購買過的相同類型的物品。

目前,市面上商用的主流推薦算法大致可分為如下幾類:

  • 基于內(nèi)容相似度的推薦;
  • 基于用戶相似度的協(xié)同過濾;
  • 基于物品相似度的協(xié)同過濾;
  • 基于流行度的推薦算法;
  • 基于模型的推薦(輸入一些用戶特征建立模型,進(jìn)而產(chǎn)生推薦結(jié)果);
  • 人工推薦(人工運(yùn)營添加推薦條目)。

本項(xiàng)目非常符合基于物品相似度的協(xié)同過濾算法的使用場景。

二、算法的特點(diǎn)

基于物品相似度的協(xié)同過濾算法的適用場景有如下特征:

長尾物品豐富,用戶個(gè)性化需求強(qiáng)烈的領(lǐng)域;長尾效應(yīng)很好理解,舉個(gè)例子,最主流、最熱門的書籍總是占據(jù)書店最顯眼的位置,而相同類型的冷門書籍?dāng)[上貨架的可能性就小得多,哪怕這些冷門書確實(shí)還是有市場需求的。那用戶購買過某熱門書籍,那我把相同類型但賣的不那么好的書推薦給老用戶,這是非常合理的吧?而每個(gè)人所看的書籍類型千差萬別,我告訴你有某個(gè)你不認(rèn)識(shí)的人也愛看某本書,你恐怕也不一定愿意買吧。

物品數(shù)遠(yuǎn)小于用戶數(shù)的場合;物品數(shù)據(jù)相對(duì)用戶數(shù)據(jù)本身就更為穩(wěn)定,再者物品數(shù)據(jù)的樣本量小,此時(shí)計(jì)算物品的相似度不但計(jì)算量較小,也不必頻繁更新,程序壓力小。

因此該算法往往應(yīng)用在圖書、電子商務(wù)、教育及電影網(wǎng)站,這些領(lǐng)域均符合以上兩點(diǎn)特征。

基于物品相似度的協(xié)同過濾算法,其關(guān)注點(diǎn)在于維系用戶的歷史興趣,而其交互特點(diǎn)在于推薦結(jié)果的實(shí)時(shí)變化。其優(yōu)缺點(diǎn)如下:

  • 缺點(diǎn):存在App冷啟動(dòng)的問題,即App剛開始使用時(shí)用戶數(shù)少,內(nèi)容也少,未形成用戶喜好池;對(duì)于本項(xiàng)目來說,也即是在缺少用戶的歷史記錄,無法據(jù)此推薦內(nèi)容的情況下,適用范圍受限。
  • 優(yōu)點(diǎn):推薦結(jié)果解釋性強(qiáng);隨著用戶的瀏覽記錄數(shù)據(jù)的增加,推薦一般也會(huì)越來越準(zhǔn)確。

三、算法的實(shí)現(xiàn)

在本次項(xiàng)目中,基于物品相似度的協(xié)同過濾算法的實(shí)現(xiàn)大致如下所示:

計(jì)算物品(課程/活動(dòng)/演出/展覽/比賽等)的相似度。

步驟如下:

利用物品的內(nèi)容屬性計(jì)算相似度。內(nèi)容屬性類似于一種標(biāo)簽,能體現(xiàn)出物品的共性。

物品可以是實(shí)體的物件,也可以是虛擬的娛樂服務(wù)。比如某演出的類型,是話劇、舞蹈還是歌唱?演出的適宜人群是10-18歲的青少年,還是二十來歲的大學(xué)生,還是工作穩(wěn)定家庭圓滿的中年人?演出的地點(diǎn)在茶館、體育館還是歌劇廳?

一個(gè)物品可以有多個(gè)標(biāo)簽,而兩個(gè)物品相同的標(biāo)簽越多,兩者的相似度也就越高。

分析用戶的行為記錄計(jì)算相似度。用戶的行為記錄包括曾經(jīng)觀看過的演出、展覽,參加過的比賽,購買過的商品等。確認(rèn)了用戶的行為偏好,就“投其所好”。

為用戶生成推薦列表。將物品和用戶的行為關(guān)聯(lián)起來,和用戶歷史上感興趣的物品越相似的物品,越有可能在用戶的推薦列表中獲得更高的排名。需要考慮以下幾個(gè)方面:

業(yè)務(wù)場景:共可分為冷啟動(dòng)、非冷啟動(dòng)新用戶、非冷啟動(dòng)老用戶、匿名用戶四種。不同的業(yè)務(wù)場景適用的算法不同,對(duì)于本項(xiàng)目,基于物品協(xié)同過濾推薦算法適用于非冷啟動(dòng)老用戶。

不同業(yè)務(wù)場景適用的算法不同

推薦位置:需考慮前端推薦列表的入口(首頁或某個(gè)模塊),以及其內(nèi)部的界面層級(jí)。

結(jié)果評(píng)測:推薦列表上線后,收集數(shù)據(jù)用于算法的優(yōu)化。需對(duì)比算法使用前后商品銷售量和銷售額的增長情況,以此衡量算法的有效性并及時(shí)調(diào)整推薦機(jī)制。

  • 商品的數(shù)量層面的相關(guān)數(shù)據(jù):點(diǎn)擊量、點(diǎn)擊率、收藏量(若允許收藏)、加購量、加購率、提交訂單量、提交訂單率、訂單付款率、占比等等。
  • 商品的金額層面的相關(guān)數(shù)據(jù):點(diǎn)擊量、收藏金額、加購金額、提交訂單金額、付款額、占比等等。

本次項(xiàng)目中,前端給定了一個(gè)智能推薦主入口,提供展覽服務(wù)、比賽服務(wù)、演出服務(wù)三個(gè)次級(jí)入口。

需要注意的是,這三個(gè)次級(jí)入口所導(dǎo)入的內(nèi)容,均是已經(jīng)維護(hù)好的,只是處于同種物品的長尾列表內(nèi),曝光率可能較低。智慧推薦要做的就是提升這些內(nèi)容的曝光率。

考慮的物品內(nèi)容屬性及權(quán)重系數(shù)有所區(qū)別:

展覽服務(wù)(展覽):

  • 展覽位置:考慮到不同場館給用戶帶來的體驗(yàn)不同,用戶可能偏向于在某個(gè)展館內(nèi)觀展,因此會(huì)對(duì)相同展館內(nèi)舉辦的展覽進(jìn)行推薦。權(quán)重系數(shù)低。
  • 展覽時(shí)間:用于相近時(shí)間段的推薦。如某展覽舉辦期間還有其他展覽也在舉辦;或者用戶在觀賞某演出的當(dāng)天,也有某個(gè)展覽正在舉行,希望用戶可以“順便”參加某展覽。權(quán)重系數(shù)低。
  • 展覽類型:展覽可分為書法展、繪畫展、科技展等不同類型,每種類型又可細(xì)分為多個(gè)小類,如繪畫展可細(xì)分為中國畫展、油畫展、 版畫展等等。實(shí)際上,在維護(hù)展覽的相關(guān)信息時(shí),已經(jīng)為不同展覽設(shè)定了標(biāo)簽。權(quán)重系數(shù)高。
  • 適宜人群:不同年齡段的人所愛好的東西有其相似性,因此要對(duì)展覽的受眾進(jìn)行區(qū)分,如10歲以下的幼童、10~18歲的青少年、18歲以上等等。

比賽服務(wù)(比賽):比賽類型(書法、繪畫、朗誦、小發(fā)明等標(biāo)簽)。

演出服務(wù)(演出):演出位置、演出類型(朗誦、歌唱、舞蹈、小品等標(biāo)簽)、演出時(shí)間(近期推薦)等,類似展覽。

后臺(tái)給定了算法的模板配置頁面,推薦位配置頁面以及結(jié)果評(píng)測頁面。

 

本文由 @Smile 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自 Unsplash ,基于 CC0 協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 如果要寫一個(gè)推薦相關(guān)的產(chǎn)品文檔,應(yīng)該跟開發(fā)列出具體的算法實(shí)現(xiàn)邏輯嗎

    來自廣東 回復(fù)
    1. 可以呀,只要你很會(huì)~

      來自江蘇 回復(fù)
  2. ?。。。?/p>

    來自廣東 回復(fù)
    1. 咩呀?有問題歡迎指正嘿嘿嘿

      來自江蘇 回復(fù)