搜索策略產(chǎn)品經(jīng)理必讀系列—第三講電商搜索排序
導(dǎo)讀:上一篇為大家介紹完電商APP搜索引擎中如何召回搜索結(jié)果,本篇為大家詳細(xì)介紹如何排序搜索結(jié)果,建議新手讀者先閱讀前兩篇文章。
一、排序的目標(biāo)
電商APP搜索返回的召回結(jié)果如何進(jìn)行排序了?首先我們要明確排序的目標(biāo),為什么我們要對(duì)搜索召回結(jié)果進(jìn)行排序,如果亂排會(huì)怎么樣?
1.1 提升用戶體驗(yàn)
排序的直接目的就是為了提升用戶對(duì)于搜索功能的使用體驗(yàn),用戶搜索“礦泉水”,搜索引擎能夠?qū)⒂脩羝綍r(shí)常買,興趣度最高的“農(nóng)夫山泉”排序在前,不符合用戶消費(fèi)習(xí)慣的“百歲山”等排序在后。
如果搜索引擎經(jīng)常將一些和Query相關(guān)度低以及用戶感興趣不高的商品排序在前,用戶就需要經(jīng)常一直下滑去找自己想要的搜索結(jié)果,或者用戶更換Query詞重新進(jìn)行搜索,整體對(duì)用戶體驗(yàn)影響很大。大家通過下圖就可以感受出排序?qū)τ脩趔w驗(yàn)的影響。
1.2 提升點(diǎn)擊率、轉(zhuǎn)化率、下單率
在提升了用戶體驗(yàn)的同時(shí),用戶對(duì)于搜索結(jié)果感興趣了進(jìn)而提升了對(duì)于搜索結(jié)果的點(diǎn)擊率,最終轉(zhuǎn)化率、下單率也會(huì)提升,從而提升了整體的流量轉(zhuǎn)化,提升整體的GMV。
1.3 提升GMV
影響搜索功能的整體成交金額的因素會(huì)有很多,但排序效果提升了,一定程度是會(huì)對(duì)搜索功能促成的整體交易額GMV有提升。但是我們?cè)谠u(píng)估該指標(biāo)時(shí)會(huì)考慮比較多的因素,因?yàn)檎wGMV提升了,是不是將較多促銷的商品排序在前了,短期內(nèi)GMV確實(shí)提升了,但是否會(huì)出現(xiàn)業(yè)務(wù)的毛利率下滑了。
二、排序策略
目前工業(yè)界一般是三大類排序策略:相關(guān)性排序、粗排和精排。
2.1 相關(guān)性排序
相關(guān)性的整體策略就是考慮搜索召回結(jié)果和Query的相關(guān)性,按照相關(guān)性進(jìn)行打分,最終相關(guān)性從高到低進(jìn)行排序。簡(jiǎn)單的搜索,比如用戶搜索“水”,實(shí)體識(shí)別以后水是一個(gè)SPU+CATEGORY屬性的搜索詞,我們分別去結(jié)構(gòu)化的物料庫(kù)里面,SPU列和CATEGORY列進(jìn)行召回,命中的商品則進(jìn)行加分。
實(shí)體的屬性Label,我們是存在優(yōu)先級(jí)的,每個(gè)實(shí)體我們會(huì)配置一個(gè)相應(yīng)的分?jǐn)?shù),比如我們認(rèn)為SPU的重要性高于CATEGORY,我們給SPU設(shè)置為100分,CATEGORY為80分。那么一個(gè)商品如果SPU和CATEGORY都命中了,則相關(guān)性分?jǐn)?shù)就為180分。同時(shí)對(duì)于同義詞、近義詞、意圖詞召回的結(jié)果我們進(jìn)行相應(yīng)的降權(quán)。比如用戶搜索“圣女果”,A商品名為“小番茄”,“小番茄”和“圣女果”是同義詞,我們對(duì)同義詞命中的乘以0.9系數(shù),則A商品的相關(guān)性分?jǐn)?shù)即為100*0.9=90分。
下圖即為用戶搜索“康師傅方便面”,每個(gè)商品對(duì)應(yīng)的相關(guān)性Score。
對(duì)于上述相關(guān)度分?jǐn)?shù)一致的商品,ES索引會(huì)自行隨機(jī)排序,線下測(cè)試時(shí)會(huì)發(fā)現(xiàn)相同分?jǐn)?shù)的商品每次排序可能都不太一樣。
2.2 粗排 (相關(guān)性 + 人氣 + 歷史購(gòu)買記錄等)
用戶搜索“礦泉水”,物料庫(kù)里的“康師傅礦泉水”、“怡寶礦泉水”、“依云礦泉水”。這三個(gè)物料的相關(guān)性都是和“礦泉水”完全一樣,那么如何排序了?隨機(jī)排序嘛?所以很多時(shí)候我們只考慮Query的相關(guān)性是完全不夠的,我們還需要考慮業(yè)務(wù)因素。
2.2.1 考慮業(yè)務(wù)因素
業(yè)務(wù)因素總的來說就是希望通過歷史數(shù)據(jù)來評(píng)估用戶對(duì)商品的喜好程度,然后將“喜好程度”進(jìn)行量化,不同商品之間可以相互比較。一般情況下我們考慮的業(yè)務(wù)因素有:
- 銷量:銷量是排序當(dāng)中非常重要的一個(gè)因素,銷量直接反映該商品的受歡迎程度;
- 收藏:商品的收藏量也間接反映出用戶對(duì)該商品的期待程度和受歡迎程度;
- 點(diǎn)擊&加購(gòu):通過埋點(diǎn)行為數(shù)據(jù)跟蹤商品的歷史點(diǎn)擊和加購(gòu)行為,也可以一部分反映用戶對(duì)商品的喜好程度。
可以考慮的業(yè)務(wù)因素有很多,同時(shí)每個(gè)業(yè)務(wù)因素的配對(duì)的比重分?jǐn)?shù)具體看每個(gè)業(yè)務(wù)方的業(yè)務(wù)需求。但業(yè)務(wù)因素配置的分?jǐn)?shù)肯定不會(huì)超過相關(guān)性,而且一般會(huì)低較多,比如SPU設(shè)置100分,可能銷量只設(shè)置50分。具體分?jǐn)?shù)也要根據(jù)實(shí)際情況進(jìn)行調(diào)試。
促銷:有時(shí)候我們?cè)O(shè)置要考慮當(dāng)前商品是否促銷,為了配合市場(chǎng)推廣策略等,有時(shí)業(yè)務(wù)部門希望將促銷的商品排序靠前,短期內(nèi)增加商品的總銷量。這時(shí)排序的時(shí)候也需要針對(duì)“促銷”這個(gè)因素設(shè)置一定的排序權(quán)重分?jǐn)?shù),不同的促銷類型配置不同的分?jǐn)?shù)。
2.2.2 歸一化方法
業(yè)務(wù)因素我們羅列完以后,如何將這些因素進(jìn)行量化?讓不同商品之間可以進(jìn)行比較。
統(tǒng)計(jì)口徑:
銷量的統(tǒng)計(jì)通常我們會(huì)按照訂單維度進(jìn)行統(tǒng)計(jì),而不是商品的具體銷售個(gè)數(shù)。因?yàn)橛行┥唐分g按照銷售個(gè)數(shù)是無法比較的,完全不在一個(gè)維度,比如瓶裝康師傅礦泉水和茅臺(tái)的銷量對(duì)比,前者肯定要多很多。雖然是這樣
同時(shí)銷量的統(tǒng)計(jì)我們還會(huì)把那些大促期間的銷量剔除掉,因?yàn)檫@部分銷量并不能代表用戶真實(shí)的需求和意志。
統(tǒng)計(jì)周期:
統(tǒng)計(jì)近半年,近三個(gè)月,近一個(gè)月,近15天等等。時(shí)間周期一般會(huì)設(shè)置多個(gè),然后不同的時(shí)間周期我們會(huì)按照重要性進(jìn)行百分比權(quán)重配比,最后加起來等于100%。只統(tǒng)計(jì)一個(gè)時(shí)間維度,很多時(shí)候商品的銷量具有欺騙性。比如夏天的時(shí)候冷飲銷量火爆,但如果將時(shí)間維度拉長(zhǎng)到半年,可能冷飲銷量就沒有那么火爆,所以需要不同的時(shí)間維度進(jìn)行組合。
統(tǒng)計(jì)門店or區(qū)域:
我們不會(huì)將平臺(tái)上所有的數(shù)據(jù)匯總在一起統(tǒng)計(jì),一般情況下像生鮮電商類APP,我們會(huì)按照門店進(jìn)行數(shù)據(jù)統(tǒng)計(jì),綜合性電商APP我們可以按照每個(gè)省份區(qū)域進(jìn)行數(shù)據(jù)統(tǒng)計(jì)。因?yàn)椴煌瑓^(qū)域不同門店的用戶偏好是完全不一樣的,比如北方人可能偏好康師傅礦泉水,南方人偏好怡寶礦泉水。
歸一化公式:
歸一化比較簡(jiǎn)單的公式,我們可以用:
(商品訂單數(shù) — 門店最少的商品訂單數(shù) )/ (門店最高的商品訂單數(shù) — 門店最少的商品訂單數(shù) ),這只是其中一種方法,有很多種歸一化的方法。最終我們計(jì)算出的是一個(gè)系數(shù),然后我們將該系數(shù)乘以我們最初設(shè)置的權(quán)重分?jǐn)?shù),比如銷量為50分,康師傅礦泉數(shù)計(jì)算出來的系數(shù)為0.5,那么0.5*50 = 25分,再將該分?jǐn)?shù)和相關(guān)性分?jǐn)?shù)進(jìn)行相加,得到一個(gè)綜合性分?jǐn)?shù)再排序。
2.2.3 潛在問題
上述將業(yè)務(wù)因素考慮進(jìn)排序中也會(huì)帶來一些實(shí)際的問題
馬太效應(yīng):
銷量高的商品得到的曝光機(jī)會(huì)越來越多,銷量低的商品得到的曝光機(jī)會(huì)會(huì)越來越少;
新品曝光機(jī)會(huì)少:
很多新品剛上市,根本不存在任何銷量,此時(shí)相關(guān)業(yè)務(wù)性分?jǐn)?shù)均為零,導(dǎo)致新品得到的曝光機(jī)會(huì)非常少;
品類會(huì)比較集中:
因?yàn)橄M(fèi)品的使用周期完全不一樣,比如像礦泉水可能幾天就會(huì)購(gòu)買一次,但是像SK-2神仙水可能幾個(gè)月才會(huì)購(gòu)買一次。對(duì)于部分表述比較寬泛的搜索詞,有可能排序前列的都來自于一個(gè)小品類,比如用戶搜索肉,可能豬肉相關(guān)的商品整體銷量就是高于鴨肉、雞肉等,那么展示的結(jié)果中排序前列的可能都是豬肉。
當(dāng)然上述列舉的三大類問題,我們都可以有相應(yīng)策略進(jìn)行調(diào)整和優(yōu)化,但基于粗排和精排的模式對(duì)于整個(gè)業(yè)務(wù)的增長(zhǎng)慢慢來到了瓶頸期?;ヂ?lián)網(wǎng)電商巨頭們慢慢積累了大量的用戶行為數(shù)據(jù),工業(yè)界開始探索構(gòu)建模型來進(jìn)行排序,預(yù)測(cè)探索用戶的偏好,實(shí)現(xiàn)按照用戶維度的千人千面排序。
2.3 精排
上述介紹的“相關(guān)性排序”或者是“粗排”,其實(shí)都是基于規(guī)則來做的。目前工業(yè)界電商巨頭們更加常用的做法是基于歷史訂單數(shù)據(jù)、用戶信息、埋點(diǎn)數(shù)據(jù)、用戶歷史Query等,使用傳統(tǒng)機(jī)器學(xué)習(xí)或者深度學(xué)習(xí)來構(gòu)建CTR模型。構(gòu)建排序模型,第一件事情就是模型的學(xué)習(xí)目標(biāo)是什么,是以CTR為目標(biāo)還是CVR為目標(biāo)。通常情況下,模型一般以CTR為目標(biāo),同時(shí)也會(huì)關(guān)注CVR和整體帶來的GMV提升等相關(guān)指標(biāo)。
關(guān)于千人千面排序模型,工業(yè)界也存在一個(gè)演進(jìn)的過程。下面我們引用美團(tuán)點(diǎn)評(píng)技術(shù)團(tuán)隊(duì)公開發(fā)布的文章里面部分的真實(shí)數(shù)據(jù)進(jìn)行講解,講解各個(gè)排序模型的特點(diǎn)和實(shí)際的線上效果。
在美團(tuán)酒店業(yè)務(wù)搜索這個(gè)場(chǎng)景中,效果最好的模型是以高維Wide特征為基礎(chǔ)的LR模型和以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的Deep模型相結(jié)合得到的一個(gè)綜合類模型。但不同的業(yè)務(wù)場(chǎng)景,用戶的數(shù)據(jù)維度和數(shù)據(jù)量都完全不一樣,所以相同的模型在不同業(yè)務(wù)場(chǎng)景的效果完全不一樣,需要具體問題具體分析。
2.4 業(yè)務(wù)策略干預(yù)
模型排序完的結(jié)果并不是最終展示給用戶的結(jié)果,因?yàn)楹芏鄷r(shí)候會(huì)存在一些業(yè)務(wù)策略的干預(yù),強(qiáng)制將某些商品排序靠前或者調(diào)后,甚至將一些商品過濾掉;
- 比如說生鮮電商盒馬搜索場(chǎng)景中,排序完的結(jié)果會(huì)需要根據(jù)定位的門店進(jìn)行商品有無上架,商品當(dāng)前有無庫(kù)存等進(jìn)行過濾,未上架和當(dāng)前無庫(kù)存的商品會(huì)直接過濾掉;假設(shè)當(dāng)前盒馬和康師傅品牌達(dá)成合作,康師傅希望借助盒馬的平臺(tái)做一些新品的市場(chǎng)推廣活動(dòng),則搜索結(jié)果中存在該新品的,盒馬都會(huì)一定程度排序調(diào)前甚至是置頂;
- 比如說綜合電商淘寶搜索場(chǎng)景中。購(gòu)買了淘寶的店鋪推廣服務(wù)的店鋪,這些店鋪的商品最終排序時(shí)淘寶就會(huì)適當(dāng)?shù)赝芭拧?/li>
業(yè)務(wù)策略會(huì)有很多很多,具體視每一家電商平臺(tái)的業(yè)務(wù)需求而制定。一般這種業(yè)務(wù)策略,都是通過后臺(tái)產(chǎn)品化的工具進(jìn)行配置,而不是說通過hard code寫進(jìn)代碼中。產(chǎn)品化的工具更加靈活,因?yàn)檫@些策略經(jīng)常變動(dòng),需要支持產(chǎn)品運(yùn)營(yíng)人員更加靈活地進(jìn)行配置。
2.5 小結(jié)
相關(guān)性排序和粗排我們統(tǒng)稱為專家規(guī)則,每次調(diào)整影響比較大,無法及時(shí)地發(fā)現(xiàn)用戶的行為變化,但是可解釋性很強(qiáng)。
排序模型,能夠讓模型不停地訓(xùn)練自學(xué)習(xí),及時(shí)發(fā)現(xiàn)用戶的行為變化,不過需要大量數(shù)據(jù)的支撐。有些時(shí)候在部分業(yè)務(wù)場(chǎng)景下,排序模型的線上效果并不一定強(qiáng)于專家規(guī)則。業(yè)務(wù)量小的電商APP,專家規(guī)則的效果要優(yōu)于排序模型,LR模型的效果要優(yōu)于深度學(xué)習(xí)模型。
只有一些業(yè)務(wù)量很大的電商APP,數(shù)據(jù)量足夠,用戶特征維度足夠,排序模型效果才會(huì)優(yōu)于專家規(guī)則,深度學(xué)習(xí)模型效果才會(huì)優(yōu)于高維LR模型。實(shí)際場(chǎng)景采用哪種策略,都需要根據(jù)線下靜態(tài)測(cè)試效果和線上生產(chǎn)效果PK,最終決定使用哪種方式。
該系列其他文章:
http://www.theventurebank.com/pmd/5544514.html
http://www.theventurebank.com/pmd/5549184.html
本文由 @King James 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議
本文由 @King James 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議
文章好不好就沒必要評(píng)價(jià)了 中式英文整的是把我整的一愣一愣的
三篇看下來,感覺好太高深了啊
+1 難得在人人都是產(chǎn)品經(jīng)理上看到講的這么透徹的分享貼
請(qǐng)問:“給SPU設(shè)置為100分,CATEGORY為80分”,以及同義詞,近義詞屬性,是都需要開發(fā)成通用的運(yùn)營(yíng)操作界面,由管理人員進(jìn)行設(shè)置嗎?
是的,可以開發(fā)成頁(yè)面,其實(shí)也可以算法直接底層配置。
謝謝大佬