4個步驟,小結(jié)搜索系統(tǒng)
搜索系統(tǒng)作為用戶自行使用的引導工具,重要程度不言而喻;本文主要從4步:需求識別、檢索、排序、展現(xiàn)來總結(jié)搜索系統(tǒng)的工作機制。
搜索是一個比較有年份的功能,他不是一個簡單的搜索框,畢竟搜索造就了一個百度帝國。
搜索系統(tǒng)在產(chǎn)品架構(gòu)中是幫助用戶搜索到他們想要的內(nèi)容,當用戶不知道如何通過其他路徑直接獲取特定內(nèi)容的時候才會使用,也就是說搜索是用戶自行使用最后的一個引導工具,重要程度不言而喻。
首先對搜索建立一個整體大概的認知,搜索工作機制如上圖,主要分為4步:需求識別、檢索、排序、展現(xiàn)。
一、需求識別
用戶在搜索框中輸入的關(guān)鍵詞即用戶想要查詢的內(nèi)容,首先需要機器去識別出用戶想要的是什么,才能把用戶想要的東西遞給用戶,首先介入工作就是分詞系統(tǒng),通過對關(guān)鍵詞的整分詞匹配或通過語義解析盡可能的了解當前用戶的需求。
- 檢索:了解用戶想要什么東西了后,就去倉庫里面把不同區(qū)存在的貨物提取出來,準備交付。
- 排序:為了賣出更多的貨物,會對自己的倉庫定一系列的規(guī)則,如:近期要賣的優(yōu)先、信譽好的供應商優(yōu)先等進行排序,保證給到用戶我們最好的貨物。
- 展現(xiàn):知道用戶想要什么、也從倉庫提取了后,按照排序規(guī)則展現(xiàn)給用戶就可以了。
接下來落實到具體的產(chǎn)品方案,堅持一個底層原則:從業(yè)務中來,到業(yè)務中去。
明確本次搜素策略優(yōu)化目標,圍繞目標高舉高打:
如:能夠準確識別用戶query背后對商品的需求,并根據(jù)排序規(guī)則在頁面反饋結(jié)果集。
關(guān)鍵衡量指標:
- 商品需求識別準確率:已識別出的query中真正帶有商品需求的query占比,越高越好;
- 商品需求識別召回率:已識別query中真正帶有商品需求數(shù)量的query在所有帶有商品需求query中占比,越高越好。
檢驗策略效果計算方式:
- 正確率 = 提取出的正確信息條數(shù) / 提取出的信息條數(shù)
- 召回率 = 提取出的正確信息條數(shù) / 樣本中的信息條數(shù)
想要更好的優(yōu)化方案,可以對現(xiàn)有的搜索關(guān)鍵詞和模塊數(shù)據(jù)進行分析,從某交易產(chǎn)品月上萬個搜索關(guān)鍵詞中,隨機抽取了1000條搜索關(guān)鍵詞字數(shù)分布如下圖:
通過對用戶輸入的關(guān)鍵詞進行分析,結(jié)論:
- 用戶輸入關(guān)鍵詞數(shù)量:2、3、4占據(jù)總字數(shù)的80%,所以:我們需要做一個搜索聯(lián)想提升用戶搜索效率。
- 用戶關(guān)鍵詞主要分布在:品牌、商品名、品類名、其他特殊字詞等,所以:我們要根據(jù)各種場景細化出不同的排序方案。
- 用戶有較多次出現(xiàn)搜索為空的情況,引起這種結(jié)果有兩種可能:① 搜索現(xiàn)有的準確率較低。 ② 現(xiàn)在平臺商品SKU 較少。
二、用戶搜索輸入分析
該部分需要考慮到用戶在使用搜索時有什么使用場景,在不同場景下有怎樣的行為反應:
三、排序計算方式
排序是整個搜素平臺最為關(guān)鍵的一環(huán),此處需要權(quán)衡商家、用戶、平臺的綜合利益考慮,如商品搜索可以將特征維度分為:商品維度、賣家維度、平臺維度、個性化、反作弊等維度,通過落地到自身業(yè)務的當前狀態(tài),可得出關(guān)鍵參考點有:
- 商品名稱:商品的全稱匹配率。
- 副標題:副標題與關(guān)鍵詞的匹配率。
- 銷量:商品銷售數(shù)據(jù)權(quán)重較高。
- 標簽:有標簽的商品比沒有標簽的商品權(quán)重更高,標簽排名:促銷(滿減、N元任選)>秒殺>包郵 >其他。
- 權(quán)重參考值排序:商品名稱 > 副標題 > 銷量 > 標簽
四、展現(xiàn)
最后根據(jù)用戶搜索不同的關(guān)鍵詞,使用特定的排序方案,輸入機器得出的結(jié)果集 :
本文由 @World 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于CC0協(xié)議。
- 目前還沒評論,等你發(fā)揮!