聊一聊推薦系統(tǒng)的召回

2 評論 9973 瀏覽 68 收藏 11 分鐘

編輯導(dǎo)讀:在推薦系統(tǒng)中,召回是從物料庫中獲取一小部分物料,這一小部分物料會在后續(xù)的環(huán)節(jié)被模型用來打分排序。本文作者圍繞推薦系統(tǒng)的召回進(jìn)行了策略和場景兩個(gè)維度的分析,希望對你有幫助。

本文主要覆蓋以下2個(gè)topic:

  1. 召回
  2. 召回策略與場景

如果你對本文有興趣,就繼續(xù)往下看吧~

一、召回

本模塊主要回答以下幾個(gè)問題:

  1. 召回是什么?
  2. 為什么需要召回?
  3. 工業(yè)界大家都是怎么做召回的?

1.1 召回是什么

在推薦系統(tǒng)中,召回是從物料庫中,獲取一小部分物料,這一小部分物料會在后續(xù)的環(huán)節(jié)被模型用來進(jìn)行打分排序。

1.2 為什么需要召回

在真實(shí)的生產(chǎn)中,往往有數(shù)以億計(jì)的item,如果直接用模型對這些item進(jìn)行打分,完全不現(xiàn)實(shí)。所以需要召回環(huán)節(jié)。

召回環(huán)節(jié)主要數(shù)以億計(jì)的數(shù)據(jù)中,檢索出百級別的候選物品。

1.3 工業(yè)界大家都是怎么做召回的?

看幾個(gè)行業(yè)case。

(微信看一看)

(愛奇藝段視頻)

蜻蜓FM

(蜻蜓FM)

總結(jié)一下:多路召回是當(dāng)前推薦系統(tǒng)的主流架構(gòu)。

KNOW-WHY環(huán)節(jié),為什么大家都要用多路召回這種架構(gòu)呢?

這樣的設(shè)計(jì)主要有如下考慮:

  1. 考慮用戶層面:用戶興趣的多元化,用戶需求與場景的多元化。例如:新聞需求,重大要聞,相關(guān)內(nèi)容沉浸閱讀等等
  2. 考慮系統(tǒng)層面:增強(qiáng)系統(tǒng)的魯棒性;部分召回失效,其余召回隊(duì)列兜底不會導(dǎo)致整個(gè)召回層失效;排序?qū)邮?,召回?duì)列兜底不會導(dǎo)致整個(gè)推薦系統(tǒng)失效。
  3. 系統(tǒng)多樣性內(nèi)容分發(fā):圖文、視頻、小視頻;精準(zhǔn)、試探、時(shí)效一定比例;召回目標(biāo)的多元化,例如:相關(guān)性,沉浸時(shí)長,時(shí)效性,特色內(nèi)容等等
  4. 可解釋性推薦一部分召回是有明確推薦理由的:很好的解決產(chǎn)品性數(shù)據(jù)的引入;

二、召回策略與場景

本模塊主要回答如下幾個(gè)問題:

  1. 策略與場景的關(guān)系?
  2. 如何設(shè)置場景的策略?

2.1 策略與場景的關(guān)系

先說結(jié)論:策略是強(qiáng)場景相關(guān)的~!

如何validate上述結(jié)論?

用戶逛首頁:這個(gè)時(shí)候,用戶暫時(shí)沒有明確的購物意圖,就是想來看看,有什么什么物品能夠吸引自己的興趣。所以這個(gè)時(shí)候的召回策略,偏興趣試探。

用戶逛詳情頁:比如你這個(gè)時(shí)候就想買一只奶茶色的口紅,你在某只口紅的詳情頁研究了3分鐘,并且下單了,這個(gè)時(shí)候給你推薦的,肯定還是奶茶色的口紅。畢竟對女人來說,一只口紅是買,兩只口紅也是買。

2.2 如何設(shè)置場景的策略?

是否有一些可以遵循的標(biāo)準(zhǔn)步驟/思考模式可以復(fù)用?

2.2.1 第一步:看數(shù)據(jù)

原則:任何策略都需要數(shù)據(jù)的支持。

use-case:

場景:

運(yùn)營同學(xué)、算法同學(xué)、還有你,大家在一起討論是否要增加一路召回,這路召回的具體邏輯是按照用戶興趣topic進(jìn)行召回。

思考邏輯:

按照興趣topic召回具體實(shí)現(xiàn)邏輯梳理:即用戶畫像有興趣topic字段,比如我西藍(lán)花,我的用戶畫像興趣topic字段有健身,那么可以用這一路進(jìn)行召回。

數(shù)據(jù)現(xiàn)狀梳理:經(jīng)過review用戶畫像數(shù)據(jù),發(fā)現(xiàn)99%的用戶,都沒有興趣topic字段。那這樣的話,就算上了這一路召回,也沒有多大價(jià)值。

如果思考到這里就結(jié)束了,那我覺得還是不夠,我們還需要思考,如何獲得用戶的興趣topic字段。這就需要從產(chǎn)品設(shè)計(jì)上進(jìn)行考慮~比如小紅書的引導(dǎo)

2.2.2 第二步:看場景

原則:

  1. 推薦策略最本質(zhì)的功能是參與構(gòu)建使得用戶沉浸其中的場景
  2. 用戶帶著不同的動機(jī)進(jìn)入不同的場景,在用戶的瀏覽鏈路中,各個(gè)場景應(yīng)該滿足或者引導(dǎo)用戶的需求。具體到召回與場景,不同的場景需要不同的召回通道,或者不同的場景對同一個(gè)召回通道有所偏重。舉例,app推薦首頁,更側(cè)重用戶興趣試探,展示內(nèi)容比較發(fā)散,使得用戶能夠找到自己感興趣的主題。用戶點(diǎn)擊推薦頁進(jìn)入詳情頁,用戶的興趣進(jìn)一步明確,在該頁推薦的內(nèi)容應(yīng)該比較收斂。因此,結(jié)合業(yè)務(wù)需求,推薦頁可能需要各種不同類型的召回通道,從召回上保證多樣性。詳情頁可能不需要那么多召回通道,同時(shí)召回上保證相關(guān)性。

use-case:

場景:美團(tuán)買菜,商品詳情頁,用戶點(diǎn)擊“加入購物車”,底部會彈出“買了又買”模塊。

策略:在該場景,買了又買模塊是當(dāng)前場景,給用戶推薦其加購商品同一類的商品。比如用戶加購冰淇淋,則推薦冰淇淋;用戶買零食,則推薦零食;用戶買水果,則推薦水果。

一點(diǎn)延伸思考,美團(tuán)買菜的這個(gè)產(chǎn)品設(shè)計(jì),目標(biāo)是什么?

先和大家分享一個(gè)群里的故事,群里有個(gè)朋友提問:”想請教下對于用戶冷啟動,這些方法怎么能比較靠靠譜滴落地呢?user、item的embedding沒有行為數(shù)據(jù)情況還有什么方法可以得到嗎?”

我的回答分為兩層:

  1. 第一,建議你梳理并講解一下你們的業(yè)務(wù)背景;
  2. 第二,你們做這個(gè)冷啟動,業(yè)務(wù)目標(biāo)是什么?是提升轉(zhuǎn)化率還是點(diǎn)擊率?

明白為什么我講這個(gè)故事了嗎?產(chǎn)品設(shè)計(jì)與目標(biāo)永遠(yuǎn)都是結(jié)伴而行,不可分割。

如果看到一個(gè)推薦場景,我們不能條件反射地去思考,這個(gè)場景的目標(biāo)是什么?背后站著的產(chǎn)品設(shè)計(jì)者(creator)是如何構(gòu)建他所期望讓用戶沉浸其中的場景?也就是KNOW WHY 和KNOW HOW。那我們就應(yīng)該強(qiáng)制自己這樣思考。

回到美團(tuán)買菜這個(gè)case本身。

  • KNOW-WHY。該場景目標(biāo)是什么?讓用戶購買更多的商品,提升的是GMV。
  • KNOW-HOW。creator如何構(gòu)建這個(gè)該場景?用戶在詳情頁,加購某一商品,這個(gè)時(shí)候用戶的興趣意圖是非常明確的。比如用戶買鐘薛高的冰淇淋,那么用戶的意圖可以分為:第一,用戶希望買冰淇淋;第二,用戶希望買鐘薛高的冰淇淋。那么這個(gè)時(shí)候可以給用戶推薦符合這兩種條件的冰淇淋。

一點(diǎn)題外話:總會看到有人討論推薦產(chǎn)品經(jīng)理的價(jià)值,在推薦這整個(gè)系統(tǒng)中,主導(dǎo)的是算法,那策略產(chǎn)品的價(jià)值是什么。我的理解是,策略產(chǎn)品很大一部分價(jià)值就是在挖掘場景,構(gòu)建場景。像用戶加購商品后的買了又買模塊,就是一個(gè)非常好的場景。

美團(tuán)買菜這個(gè)場景的構(gòu)建是蠻好的~既然有好的case,就必須說一個(gè)我覺得很差的case,沒有對比哪能知道孰好孰壞

這是7fresh的一個(gè)加購頁面,給我推薦了油麥菜和鱸魚。我是7fresh的忠實(shí)用戶,消費(fèi)頻率高,一周3-4次的購買行為。主要集中在:零食、飲料、化妝品、護(hù)膚品等模塊。我從來不做飯不做菜,所以我真的沒有理解為什么要推薦這個(gè)。

2.2.3 第三步:多路召回,冗余過濾

原則:審視多路召回,冗余過濾。同一個(gè)場景可能會篩選出多路召回,各路召回盡量不要冗余。如果兩路召回拉取的帖子屬性非常相近,那么這兩路召回冗余性較大,其中一路召回可以去掉。

use-case:這個(gè)暫時(shí)沒有use-case,主要考慮是如果兩路召回,其分別召回的內(nèi)容差不多,效用不大,還新增了需要去重,不劃算。

最后,如果你覺得本篇文章對你有幫助~記得收藏并且關(guān)注我哦~

#專欄作家#

一顆西蘭花,人人都是產(chǎn)品經(jīng)理專欄作家。關(guān)注AI產(chǎn)業(yè)與寫作工具,擅長數(shù)據(jù)分析,產(chǎn)品研發(fā)管理。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 催更,求博主趕緊更呀,不更我司業(yè)務(wù)沒法跑了

    來自上海 回復(fù)
  2. 催更一下

    來自上海 回復(fù)
  3. 寫的很好,受益匪淺~我也是專欄作家,希望可以互相關(guān)注,相互學(xué)習(xí)交流~

    來自上海 回復(fù)