電商搜索主要就這3個(gè)事
本篇文章介紹了電商搜索的工具——搜做引擎,其3個(gè)核心能力:詞庫、權(quán)重、索引。
最簡單的電商搜索是針對商品名稱,隨著技術(shù)進(jìn)步,用戶搜索的內(nèi)容五花八門,只僅針對商品名稱的搜索已經(jīng)遠(yuǎn)遠(yuǎn)不能滿足用戶的需求,這個(gè)時(shí)候行業(yè)里面引入了一個(gè)工具——搜索引擎。
搜索引擎主要為我們提供3個(gè)核心能力:詞庫、權(quán)重、索引,還可能包含其他一些附屬功能,比如評(píng)價(jià)體系、數(shù)據(jù)統(tǒng)計(jì)等,下面我們主要來說下搜索引擎的這3個(gè)核心能力。
一、詞庫
1.1 數(shù)據(jù)準(zhǔn)備
搜索引擎可以對用戶輸入的搜索詞做預(yù)處理,以此提供用戶更想要的搜索結(jié)果,比如近義詞、分詞、兼容拼音、糾錯(cuò)功能等,除了有通用的詞庫可以解決掉一般性的輸入問題之外,最主要的就是針對用戶以往的搜索詞去定期完善相應(yīng)的詞庫。
所以在構(gòu)建相應(yīng)的詞庫之前,需要對用戶以往的搜索詞做好相應(yīng)的統(tǒng)計(jì),包括每個(gè)搜索詞的搜索人數(shù)占比、搜索結(jié)果點(diǎn)擊率以及每個(gè)搜索詞的下單轉(zhuǎn)化情況等,有了這些數(shù)據(jù),我們就可以有針對性的優(yōu)先優(yōu)化最有價(jià)值的搜索詞,另外還可以通過這些數(shù)據(jù)查看優(yōu)化后的結(jié)果。
1.2 近義詞
比如用戶搜索的是“充電寶”,但實(shí)際上專業(yè)名詞叫“移動(dòng)電源”,再比如“充電器”,專業(yè)名詞叫“電源適配器”等等,根據(jù)用戶的搜索數(shù)據(jù),我們需要定期把這些對應(yīng)關(guān)系更新到近義詞庫,如圖15-1。
圖15-1 近義詞詞庫(圖片來源:小米商城)
1.3 分詞
分詞的意思是說,如果用戶的搜索詞比較長,比如“防霧霾口罩”,但是商品標(biāo)題是“過濾防護(hù)口罩”,這個(gè)時(shí)候如果按照完全匹配是匹配不到的,分詞的作用就是把搜索詞分成“防霧霾”+“口罩”,這樣搜索的結(jié)果集就會(huì)大大增加。如圖15-2:
目前已經(jīng)有通用的分詞詞庫,用來處理常見的分詞,但是對于一些專有名詞,或者一些需要系統(tǒng)特別處理的詞,比如手機(jī)行業(yè)里的“全面屏”,需要我們自己根據(jù)數(shù)據(jù)統(tǒng)計(jì)的結(jié)果定時(shí)更新到分詞詞庫。
圖15-2 分詞(圖片來源:天貓)
1.4 其他
包括錯(cuò)別字、兼容拼音、去重等,原理跟近義詞、分詞類似,這里想討論一個(gè)問題:如果用戶的搜索詞是錯(cuò)的,我們應(yīng)該如何處理?如圖15-3,第一張圖,用戶搜索了“xiaomi”,小米商城直接給用戶顯示了“小米”的搜索結(jié)果,也就是幫用戶糾正了錯(cuò)誤。而第二張圖,用戶搜索“永衣”,天貓先給用戶顯示了“永衣”的搜索結(jié)果,再問用戶是不是在找“泳衣”。
那到底是先顯示“永衣”的搜索結(jié)果,再問用戶是不是搜索“泳衣”,還是直接幫用戶糾正為“泳衣”的搜素結(jié)果,再問用戶是否仍然搜“永衣”?
我個(gè)人的建議是,在“永衣”有搜索結(jié)果的情況下,先幫用戶顯示“永衣”的搜索結(jié)果,再問用戶是不是搜索“泳衣”。因?yàn)椤坝酪隆庇兴阉鹘Y(jié)果,所以我們并不能完全確認(rèn)用戶的搜索詞是否錯(cuò)誤,如果直接幫用戶糾正錯(cuò)誤,從尊重用戶的角度來說是不合適的,甚至可能是多余的。
如果“永衣”沒有搜索結(jié)果,則直接給用戶顯示“泳衣”的搜索結(jié)果,并且不是提示用戶是否仍然搜索“永衣”,因?yàn)椤坝酪隆睕]有搜索結(jié)果,還讓用戶搜索干嘛?而是類似圖15-2,告訴用戶“永衣”沒有搜索結(jié)果,已為您推薦“泳衣”的相關(guān)商品。
圖15-3 糾錯(cuò)(圖片來源:小米、天貓)
二、權(quán)重
權(quán)重就是跟搜索結(jié)果排序相關(guān)的,從電商的角度來說,包括但不限于商品、用戶、運(yùn)營等維度。
商品可能包括品類、商品名稱、副標(biāo)題、顏色、規(guī)格參數(shù)等,用戶相關(guān)的就包括購買、推薦、收藏、點(diǎn)擊等,運(yùn)營相關(guān)的包括促銷、新品、熱賣等。
每一項(xiàng)有一個(gè)權(quán)重值,經(jīng)過一系列的算法計(jì)算,權(quán)重越高的商品搜索結(jié)果越靠前。跟詞庫類似,權(quán)重也是需要定期更新不斷完善的過程。
三、索引
索引是搜索引擎的一個(gè)重要特性,我們知道一般的數(shù)據(jù)庫也可以創(chuàng)建索引,但主要是針對具體數(shù)據(jù)類型確切數(shù)值的精確篩選,而大數(shù)據(jù)量下的實(shí)時(shí)處理能力,以及基于語義、相關(guān)性方面的搜索,還需要搜索引擎的支持。
搜索引擎需要定期從商城獲取數(shù)據(jù)創(chuàng)建索引,數(shù)據(jù)內(nèi)容包括了之前提到的商品、用戶、運(yùn)營等相關(guān)的數(shù)據(jù),如果對實(shí)時(shí)性要求比較高,就增量同步,實(shí)時(shí)性要求不高,則可以定期全量同步。
用戶從搜索到最終獲得搜索結(jié)果的流程如圖15-4:
圖15-4 用戶搜索流程
總結(jié)
本文以電商為例,詳細(xì)講解了搜索引擎提供的詞庫、權(quán)重、索引3個(gè)核心能力,包括它們是如何應(yīng)用在我們的產(chǎn)品當(dāng)中,以及在日常的搜索優(yōu)化工作中,需要做哪些事情,希望對各位有所幫助。
#專欄作家#
張旭東,微信公眾號(hào):旭東愛折騰,人人都是產(chǎn)品經(jīng)理專欄作家。努比亞手機(jī)商城產(chǎn)品經(jīng)理,前華強(qiáng)旗艦店產(chǎn)品經(jīng)理,F(xiàn)ON樂隊(duì)吉他手。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
- 目前還沒評(píng)論,等你發(fā)揮!