電商搜索系統(tǒng)精講系列:業(yè)務(wù)分析及召回模型
編輯導(dǎo)讀:搜索功能是產(chǎn)品的必備功能之一,用戶(hù)可以利用搜索功能找到自己想要的信息。本文作者以電商產(chǎn)品為例,分析其搜索系統(tǒng),本文先介紹業(yè)務(wù)分析及召回模型,一起來(lái)看看吧。
前幾天編寫(xiě)的那篇《一個(gè)產(chǎn)品經(jīng)理五味雜陳的十年》的文章意外收獲了很大反響,說(shuō)句實(shí)在話沒(méi)想過(guò)這個(gè),實(shí)屬意外,因?yàn)閷?xiě)文章的初衷也只是想花點(diǎn)時(shí)間對(duì)過(guò)去十幾年的工作做個(gè)總結(jié)和復(fù)盤(pán),加我微信的人也多了很多,微信社群也超員滿(mǎn)員,不過(guò)沒(méi)關(guān)系,只要大家還在,微信群就一定會(huì)有,不要著急,后續(xù)我會(huì)通過(guò)公眾號(hào)把最新的微信社群二維碼推送給大家(不要著急);
通過(guò)在和小伙伴微信聊天的時(shí)候,發(fā)現(xiàn)了一些問(wèn)題,比如產(chǎn)品經(jīng)理容易受制于終端、行業(yè)以及業(yè)務(wù)經(jīng)驗(yàn)的限制,比如說(shuō)下面的三種情況:
- 之前做的是電商前臺(tái)產(chǎn)品的設(shè)計(jì),現(xiàn)在做電商后臺(tái),感覺(jué)比較困難;
- 之前做APP移動(dòng)應(yīng)用的產(chǎn)品設(shè)計(jì)現(xiàn)在開(kāi)始搞移動(dòng)應(yīng)用后臺(tái)設(shè)計(jì);
- 之前做物流產(chǎn)品現(xiàn)在做采購(gòu)系統(tǒng),又或者是現(xiàn)在做C端產(chǎn)品;
怎么突破?這個(gè)問(wèn)題我們暫且不討論細(xì)節(jié),最根本的突破就是要找到適合自己的方法論,關(guān)于如何找到自己適合的方法論,我也在整理梳理,后續(xù)會(huì)推送給大家;
我們言歸正傳,回到今天的主題,就是搜索。我們作為產(chǎn)品經(jīng)理,在之前的文章中也提到過(guò),任何產(chǎn)品原型的設(shè)計(jì)都是能在日常的生活中找到場(chǎng)景模型,我們需要做的就是將這個(gè)場(chǎng)景模型映射到線上,就能解決線上的問(wèn)題,關(guān)鍵是怎么映射,我們依然采用之前文章編寫(xiě)的思路,來(lái)推導(dǎo)電商搜索系統(tǒng)該怎么設(shè)計(jì),首先我們先了解下搜索的業(yè)務(wù)(離開(kāi)業(yè)務(wù)的產(chǎn)品都是牛氓產(chǎn)品!?。。。?/p>
01 為什么要去做搜索
在講搜索系統(tǒng)怎么設(shè)計(jì)的之前,首先明白一個(gè)問(wèn)題,為什么要去做搜索?
好,回答這個(gè)問(wèn)題之前依然再問(wèn)大家一個(gè)問(wèn)題?那就是你去超市購(gòu)物,你的第一件事是做什么,毋庸置疑,一定也是去找商品,比如你要去購(gòu)買(mǎi)白酒,你是不是直接從進(jìn)入超市的那一刻開(kāi)始徑直走向超市白酒專(zhuān)區(qū)去尋找你想購(gòu)買(mǎi)的白酒,然后呢,你通過(guò)不同的白酒品牌、度數(shù)、生產(chǎn)地、包裝等因素去選擇你要的商品,這個(gè)就是現(xiàn)實(shí)生活中尋找商品的場(chǎng)景模型,我們下文把尋找替換成搜索,顯得更專(zhuān)業(yè)一點(diǎn),那就是搜索商品;
搜索商品的目的當(dāng)然是為了能夠快速在超市海量的商品中篩選出自己想要的商品,一來(lái)滿(mǎn)足用戶(hù)的需求,二來(lái)通過(guò)制定一些搜索的規(guī)則提高用戶(hù)搜索商品的效率,降低用戶(hù)的搜索成本,這個(gè)就是為什么要去做搜索的目的。
那么在互聯(lián)網(wǎng)的世界里,既沒(méi)有超市這個(gè)概念也沒(méi)有實(shí)物商品的概念,一切都是數(shù)據(jù),無(wú)論你是做什么都是通過(guò)數(shù)據(jù)的方式來(lái)實(shí)現(xiàn),這個(gè)時(shí)候怎么把搜索(尋找)商品的場(chǎng)景模型搬遷到互聯(lián)網(wǎng)的世界里,我們一步一步看;
02 搜索場(chǎng)景分析
有了線下業(yè)務(wù)的場(chǎng)景,那么第二步就是怎么映射線上場(chǎng)景,首先要去做的就是線上業(yè)務(wù)場(chǎng)景建模,我們來(lái)分析下上文提到的線下搜索商品的過(guò)程:
- 用戶(hù)進(jìn)入超市——對(duì)應(yīng):用戶(hù)打開(kāi)某個(gè)電商平臺(tái);
- 用戶(hù)徑直走向白酒專(zhuān)區(qū)——對(duì)應(yīng):選擇電商某個(gè)大類(lèi)比如服裝;
- 用戶(hù)用眼睛掃描超市白酒專(zhuān)區(qū)各類(lèi)品種的酒
上面的第3個(gè),為什么沒(méi)有寫(xiě)對(duì)應(yīng)到線上的場(chǎng)景?首先大家思考;
我們?nèi)祟?lèi)有眼睛有鼻子有手有腳,能通過(guò)我們的視覺(jué)、聽(tīng)覺(jué)等各種感官系統(tǒng)去感知外面的世界,但是計(jì)算機(jī)沒(méi)有眼睛沒(méi)有鼻子也沒(méi)有視覺(jué)聽(tīng)覺(jué),還是那句話,計(jì)算機(jī)只認(rèn)識(shí)數(shù)據(jù)這個(gè)祖宗,所以用戶(hù)用眼睛去查閱白酒,怎么做線上場(chǎng)景的映射和建模,這個(gè)時(shí)候就需要做搜索,超市是個(gè)巨大的實(shí)物類(lèi)空間載體,空間比較大,用戶(hù)可以在這個(gè)空間里慢慢看慢慢挑,但是在移動(dòng)互聯(lián)網(wǎng)高度發(fā)達(dá)的今天,手機(jī)屏幕大小有限,我們是不可能把這些白酒或者用戶(hù)需要購(gòu)買(mǎi)的所有商品都一次性的展示在用戶(hù)面前,這個(gè)時(shí)候怎么辦—–需要借助于搜索這個(gè)功能來(lái)幫助用戶(hù)觸達(dá)自己的目標(biāo)商品;
所以上面的:用戶(hù)用眼睛掃描超市白酒專(zhuān)區(qū)各類(lèi)品種的酒——對(duì)應(yīng):搜索
線上業(yè)務(wù)建模是不是就結(jié)束了,當(dāng)然不是,人類(lèi)可以用眼睛、用視覺(jué)、用聽(tīng)覺(jué)以及自己的邏輯判斷和思考能力去搜索商品,這個(gè)過(guò)程本身就是各種復(fù)雜的規(guī)則在你的大腦里不停的運(yùn)算和處理,比如我需要個(gè)55度的白酒,那么這個(gè)55度的白酒我是送人還是自己喝呢?如果送人我買(mǎi)什么包裝的合適呢?55度的白酒價(jià)格我能承受多少呢?我需要購(gòu)買(mǎi)幾瓶白酒呢?我買(mǎi)了十箱白酒回去我怎么運(yùn)回家呢?如果白酒有破損我該怎么退換呢?
這些問(wèn)題的性質(zhì)是什么,說(shuō)白了就是不停的問(wèn)自己不停的讓自己的大腦在思考,給出答案,最終讓自己決策到底要購(gòu)買(mǎi)什么白酒買(mǎi)多少;
那么同樣的道理,計(jì)算機(jī)也需要有一套這種認(rèn)知系統(tǒng),計(jì)算機(jī)雖沒(méi)有像人類(lèi)那樣擁有聰明智慧的大腦,好就好在它能被我們?nèi)祟?lèi)主宰,但是人類(lèi)需要給他一系列的運(yùn)算規(guī)則才能主宰它,告訴計(jì)算機(jī)怎么想,怎么決策,怎么查詢(xún),怎么篩選,最后把運(yùn)算結(jié)果給到用戶(hù),那么就能達(dá)到我們?nèi)祟?lèi)的目標(biāo);
我們的目標(biāo)是能夠讓計(jì)算機(jī)理解我們的人類(lèi)的意思,如何去做?
接下來(lái)引入一個(gè)新的概念:自然語(yǔ)言處理(Natural Language Processing, NLP)
首先來(lái)解釋下:NLP是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域的一個(gè)重要研究方向。
它研究能實(shí)現(xiàn)人與計(jì)算機(jī)之間用自然語(yǔ)言進(jìn)行有效通信的各種理論和方法。
自然語(yǔ)言處理是一門(mén)融語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)于一體的科學(xué)。因此,這一領(lǐng)域的研究將涉及自然語(yǔ)言,即人們?nèi)粘J褂玫恼Z(yǔ)言,自然語(yǔ)言處理并不是一般地研究自然語(yǔ)言,而在于研究能有效地實(shí)現(xiàn)自然語(yǔ)言通信的計(jì)算機(jī)系統(tǒng),特別是其中的軟件系統(tǒng),所以呢也算是計(jì)算機(jī)科學(xué)的一部分,反正這個(gè)內(nèi)容我在大學(xué)沒(méi)學(xué)過(guò);
好了,接下來(lái)聊的內(nèi)容都會(huì)跟這個(gè)概念有關(guān),接著往下看:
首先我們來(lái)看用戶(hù)在淘寶APP搜索框中搜索“蘋(píng)果”兩個(gè)字后的結(jié)果:
問(wèn)下自己:為什么在搜索結(jié)果的推薦內(nèi)容里沒(méi)有食物類(lèi)的蘋(píng)果,而全都是手機(jī)類(lèi)的蘋(píng)果?
答案是:計(jì)算機(jī)理解了用戶(hù)需要搜索的是手機(jī)類(lèi)蘋(píng)果而不是食物類(lèi)的蘋(píng)果;
那么計(jì)算機(jī)憑什么理解了用戶(hù)的意圖?計(jì)算機(jī)是怎么給出這個(gè)搜索結(jié)論的?這個(gè)里面就要引入另外兩個(gè)概念——-分析器和召回;
03 分析器與召回
所謂分析器指的是電商平臺(tái)在接收到用戶(hù)搜索的關(guān)鍵詞之后,計(jì)算機(jī)需要通過(guò)某種策略和方式去理解用戶(hù)的意圖,這種方式和策略的呈現(xiàn)就是分析器,說(shuō)白了分析器是關(guān)鍵詞的大腦,沒(méi)有分析器,用戶(hù)搜索就是白搭,因?yàn)橛?jì)算機(jī)并不明白你要搜索什么;
再來(lái)看召回:指的是通過(guò)分析器既定的規(guī)則查詢(xún)到結(jié)果的整個(gè)過(guò)程統(tǒng)稱(chēng)為召回,比如用戶(hù)在淘寶APP搜索框中輸入“2021年夏季新款連衣裙”幾個(gè)字,點(diǎn)擊搜索,查詢(xún)到所有連衣裙完整的過(guò)程就是召回;
好,那么在解釋上面的截圖當(dāng)中為什么搜索的結(jié)果里面只有蘋(píng)果手機(jī)而沒(méi)有食物類(lèi)蘋(píng)果這個(gè)問(wèn)題之前,我們先來(lái)剖析分析器:
分析器的分類(lèi):
關(guān)鍵詞分析器:
適合一些需要精確匹配的場(chǎng)景。如標(biāo)簽、關(guān)鍵詞等,不拆分關(guān)鍵詞(下文統(tǒng)一定義為不分詞,拆分關(guān)鍵詞就是分詞)的字符串或數(shù)值內(nèi)容
舉例:用戶(hù)在淘寶APP搜索框里搜索“連衣裙”,查詢(xún)結(jié)果的商品里面必須要有“連衣裙”完整的三個(gè)字,才會(huì)被召回展示在界面上,如果輸入“連衣”、“裙”,則不會(huì)被召回,這里類(lèi)似于常見(jiàn)的精確查詢(xún);
通用分析器:
計(jì)算機(jī)基于對(duì)漢語(yǔ)的語(yǔ)義理解進(jìn)行詞條切割,對(duì)切割后的關(guān)鍵詞進(jìn)行查詢(xún)
舉例:用戶(hù)在淘寶APP搜索框里搜索“茉莉花茶”,查詢(xún)結(jié)果的商品里面只要包含“茉莉”、“茉莉花”、“茶”、“花茶”的信息都會(huì)被召回;
行業(yè)分析器(如電商)
計(jì)算機(jī)針對(duì)某個(gè)特定的行業(yè)的語(yǔ)義理解,來(lái)進(jìn)行詞條切割,對(duì)切割后的關(guān)鍵詞進(jìn)行查詢(xún)
舉例:
用戶(hù)在淘寶APP搜索框里搜索“籃球NIKE運(yùn)動(dòng)鞋”,查詢(xún)結(jié)果的商品里面只要包含“籃球”、“NIKE”、“NIKE運(yùn)動(dòng)”、“運(yùn)動(dòng)”、“運(yùn)動(dòng)鞋”都會(huì)被召回;
單字分析器:
按照單字/單詞分詞,適合非語(yǔ)義的中文搜索場(chǎng)景,如小說(shuō)作者名稱(chēng)、店鋪名
舉例:
用戶(hù)在淘寶APP搜索框里搜索“運(yùn)動(dòng)鞋”,查詢(xún)結(jié)果的商品里面只要包含“運(yùn)動(dòng)”、“鞋”、“運(yùn)動(dòng)鞋”、“運(yùn)鞋”、“動(dòng)鞋”都會(huì)被召回;
模糊分析器:
按照中文對(duì)應(yīng)的拼音搜索、數(shù)字前后綴搜索
舉例:
用戶(hù)在淘寶APP中搜索“籃球鞋”,查詢(xún)結(jié)果的商品里面只要包含籃球鞋、籃球、鞋、lqx、qx、lx等都會(huì)被召回;
全拼分析器:
按照中文漢字的全拼進(jìn)行搜索,必須包含中文的全拼音才能被召回
這里不再舉例,很好理解
簡(jiǎn)拼分析器:
按照中文漢字的全拼首字母進(jìn)行搜索,只要包含全拼首字母的商品均可被召回;
這里不再舉例,很好理解;
好了,說(shuō)到此,常見(jiàn)的電商分析器模型基本就這幾種,當(dāng)然了具體業(yè)務(wù)還要具體對(duì)待,正所謂產(chǎn)品領(lǐng)域沒(méi)有絕對(duì)的對(duì)與錯(cuò),只有適用和不適用,有些公司還有自定義分析器、數(shù)值分析器、地理位置分析器、物流專(zhuān)用分析器、醫(yī)療專(zhuān)用分析器等等,具體業(yè)務(wù)具體對(duì)待;
我們來(lái)對(duì)分析器做個(gè)總結(jié),電商平臺(tái)拿到用戶(hù)輸入的關(guān)鍵詞之后,通過(guò)一定的規(guī)則召回用戶(hù)的目標(biāo)商品,這個(gè)規(guī)則就是分析器規(guī)則;
那么是不是商品被召回只有這一個(gè)規(guī)則呢?顯然不是,我們還要看召回的條件,參與召回的關(guān)鍵詞,因?yàn)閷?duì)于搜索引擎系統(tǒng)而言關(guān)鍵詞是最基礎(chǔ)的但也是最核心的功能,對(duì)于用戶(hù)而言,輸入的關(guān)鍵詞也是五花八門(mén),比如輸錯(cuò)文字、輸入拼音、輸入簡(jiǎn)寫(xiě)、輸入同義詞等等,這些因素都可能會(huì)影響到商品的召回率,所以我們需要一個(gè)模塊能夠?qū)τ脩?hù)輸入的關(guān)鍵字進(jìn)行邏輯處理和過(guò)濾,既能通過(guò)轉(zhuǎn)化非標(biāo)準(zhǔn)的搜索關(guān)鍵詞提升搜索效率,也能提升搜索商品的召回率,提升用戶(hù)的搜索體驗(yàn),所以接下了我們接著聊(不急):
接下來(lái)我們看幾個(gè)關(guān)鍵詞處理模型:
來(lái)看下面這張截圖:
用戶(hù)輸入關(guān)鍵詞“簡(jiǎn)議床”,為什么會(huì)召回了“簡(jiǎn)易床”的相關(guān)商品??
我們來(lái)反推下,用戶(hù)在正常的文本輸入的時(shí)候,完全是存在輸錯(cuò)漢字的可能的,就像上面的截圖一樣,把 “易” 輸錯(cuò)成 “議” 了,所以,如果按照上述的分析器規(guī)則,那么某些符合用戶(hù)意圖的商品就不會(huì)被召回,就會(huì)出現(xiàn)查詢(xún)無(wú)此商品的結(jié)果,不能完全滿(mǎn)足用戶(hù)的需求,所以這個(gè)時(shí)候怎么辦?
需要設(shè)置一個(gè)容錯(cuò)模型,業(yè)內(nèi)我們稱(chēng)它為“拼寫(xiě)糾錯(cuò)”;
所謂“拼寫(xiě)糾錯(cuò)”,就是在用戶(hù)輸入的關(guān)鍵詞不正確的時(shí)候,錯(cuò)誤的輸入可能導(dǎo)致查詢(xún)結(jié)果不符合預(yù)期或者根本就不會(huì)有查詢(xún)結(jié)果,因此需要對(duì)用戶(hù)的輸入進(jìn)行拼寫(xiě)檢查,對(duì)查詢(xún)?cè)~中的錯(cuò)誤進(jìn)行糾正,給出正確的查詢(xún)?cè)~。并根據(jù)糾錯(cuò)的可信度高低,決定當(dāng)前查詢(xún)是否用糾錯(cuò)后的詞進(jìn)行查詢(xún);
那現(xiàn)在又一個(gè)問(wèn)題來(lái)了,你輸入了“簡(jiǎn)議床”,計(jì)算機(jī)怎么知道有錯(cuò)別字?這個(gè)又涉及到另外一個(gè)概念—–詞典;
大家小時(shí)候都用過(guò)新華字典,里面羅列了中華文明的所有漢字,你寫(xiě)的漢字對(duì)與錯(cuò),也都是以新華字典為參照物來(lái)比對(duì),同樣的道理,以此類(lèi)推,電商平臺(tái)也有詞典,這個(gè)詞典里面涵蓋了很多的名次、動(dòng)詞、形容詞、狀態(tài)詞、還有商品、評(píng)價(jià)等信息,當(dāng)然這些信息也都是源自于業(yè)務(wù)系統(tǒng),所謂的業(yè)務(wù)系統(tǒng)就是用戶(hù)的行為數(shù)據(jù)、商品數(shù)據(jù)、評(píng)價(jià)數(shù)據(jù)、分享數(shù)據(jù)等等,計(jì)算機(jī)通過(guò)大數(shù)據(jù)算法進(jìn)行詞典挖掘,形成動(dòng)態(tài)的詞典庫(kù),更好的賦能于電商搜索業(yè)務(wù),關(guān)于詞典業(yè)務(wù)本篇不做過(guò)多介紹,有興趣可私下交流;
好了,正是因?yàn)?strong>詞典庫(kù)的存在,當(dāng)用戶(hù)輸入“簡(jiǎn)議床”的時(shí)候,在電商平臺(tái)自然會(huì)分析比對(duì)這個(gè)“簡(jiǎn)議床”三個(gè)漢字,包括對(duì)中文漢字的理解、詞典的匹配、拼音的匹配、簡(jiǎn)拼的匹配,最后決策出這個(gè)關(guān)鍵詞是否存在可疑的錯(cuò)別字,如果存在則糾正錯(cuò)別字后按照正確的關(guān)鍵詞進(jìn)行搜索,召回商品;
除此之外還有另外一種模型——同義詞模型
首先我們接著看一副截圖:
用戶(hù)輸入了“蘋(píng)果”,搜索結(jié)果里面為什么會(huì)召回了iphone12 Pro Max的商品?(假設(shè)我們的商品信息里面沒(méi)有蘋(píng)果兩個(gè)漢字)
這個(gè)時(shí)候就要用到一個(gè)模型——同義詞模型
在實(shí)際搜索場(chǎng)景中,會(huì)經(jīng)常出現(xiàn)包含同義詞的表達(dá)。例如,我們希望用戶(hù)在搜索蘋(píng)果的同時(shí),也能找出和iphone有關(guān)的信息;
在現(xiàn)實(shí)生活中,相同語(yǔ)義的表述詞匯往往有很多,而用戶(hù)在輸入關(guān)鍵字查詢(xún)的時(shí)候很難通過(guò)一條關(guān)鍵詞中將它們?nèi)矿w現(xiàn),所以識(shí)別和提供同義詞檢索顯然可以獲得更高的商品召回率。
同義詞功能主要是對(duì)查詢(xún)的關(guān)鍵詞進(jìn)行同義擴(kuò)展,擴(kuò)大召回和查詢(xún)關(guān)鍵詞同義的詞組。
舉例:“包菜” 存在一個(gè)同義詞是“圓白菜”,在沒(méi)有使用同義詞功能時(shí),搜索“包菜”時(shí)是無(wú)法召回商品中僅包含“圓白菜”的商品,如果使用同義詞功能,則能召回,就像上文中的截圖,如果同義詞功能被使用了,那么輸入蘋(píng)果兩個(gè)漢字就能召回iphone的商品;
說(shuō)完了糾錯(cuò)模型、同義詞模型,再看停止詞模型
所謂停止詞模型一般應(yīng)用在查詢(xún)關(guān)鍵詞里包含語(yǔ)氣助詞、標(biāo)點(diǎn)符號(hào)等特殊搜索場(chǎng)景;
舉例:用戶(hù)A在淘寶APP搜素框中輸入“你好!今晚一起吃飯好嗎?”,那么停止詞模型則過(guò)濾掉感嘆號(hào)、問(wèn)好還有個(gè)語(yǔ)氣助詞“嗎”,直接參與召回的關(guān)鍵詞變?yōu)椤澳愫媒裢硪黄鸪燥埡脝帷?,符合條件的商品則被召回;
大家思考一個(gè)問(wèn)題,為什么要設(shè)置這個(gè)模型?
顧名思義,用戶(hù)在電商平臺(tái)輸入關(guān)鍵詞的時(shí)候難免會(huì)因誤操作輸入如空格、標(biāo)點(diǎn)等等特殊詞,如果這些詞也要參與商品的召回的話,勢(shì)必會(huì)對(duì)搜索引擎系統(tǒng)性能和資源的浪費(fèi)(原因呢,你們自己思考),另外一個(gè)也是能將輸入的關(guān)鍵詞標(biāo)準(zhǔn)化,有利于分析器模型的抽象;
我剛剛講了停止詞模型一般應(yīng)用在查詢(xún)關(guān)鍵詞里包含語(yǔ)氣助詞、標(biāo)點(diǎn)符號(hào)等特殊搜索場(chǎng)景,那么這些語(yǔ)氣助詞和標(biāo)點(diǎn)符號(hào)從哪來(lái)?
顧名思義,依然是詞典庫(kù)中來(lái),當(dāng)然了,話又說(shuō)回來(lái),詞典庫(kù)也不是萬(wàn)能的,也都是靠計(jì)算機(jī)采集和人工錄入,那么當(dāng)用戶(hù)輸入了一個(gè)特別另類(lèi)的字符的時(shí)候,這個(gè)時(shí)候會(huì)參與召回么,答案是當(dāng)然會(huì),不過(guò)召回的結(jié)果一定會(huì)收到影響,所以計(jì)算機(jī)大數(shù)據(jù)系統(tǒng)要具備實(shí)時(shí)捕捉用戶(hù)的各種行為數(shù)據(jù),分析、加工后采集到詞典庫(kù),當(dāng)然也可進(jìn)行人工干預(yù)的手段來(lái)避免另類(lèi)字符參與召回,所以這個(gè)時(shí)候另外一個(gè)功能也就推導(dǎo)出來(lái)了——停止詞人工干預(yù)詞典庫(kù)(包括上文提到的糾錯(cuò)模型、同義詞模型都有人工干預(yù)的場(chǎng)景);
當(dāng)標(biāo)點(diǎn)符號(hào)作為停止詞被系統(tǒng)過(guò)濾掉之后,不參與商品的召回,那么現(xiàn)在有一個(gè)特殊場(chǎng)景,先看下圖這個(gè)一旦@網(wǎng):
如果我們的商品庫(kù)中有一個(gè)商品品牌(一旦@網(wǎng)),這個(gè)商品品牌名稱(chēng)中包含標(biāo)點(diǎn)符號(hào)@,這個(gè)時(shí)候,當(dāng)用戶(hù)在搜索框中輸入商品品牌一旦@網(wǎng),可能就會(huì)導(dǎo)致商品無(wú)法被召回,這個(gè)時(shí)候該怎么處理?
我們?cè)俅我氲谒膫€(gè)模型:實(shí)體識(shí)別模型
實(shí)體識(shí)別,全稱(chēng)命名實(shí)體識(shí)別(Named Entity Recognition,簡(jiǎn)稱(chēng)NER),指對(duì)關(guān)鍵詞中的具有特定意義的語(yǔ)義實(shí)體進(jìn)行識(shí)別。
實(shí)體識(shí)別模型根據(jù)識(shí)別的結(jié)果,依據(jù)實(shí)體類(lèi)型的權(quán)重對(duì)關(guān)鍵詞進(jìn)行改寫(xiě)或糾正,使得召回的商品符合查詢(xún)的意圖,目前該模型一般應(yīng)用在電商領(lǐng)域的搜索業(yè)務(wù),其他行業(yè)暫時(shí)未得到很好的普及;
常見(jiàn)的實(shí)體類(lèi)型,參考下圖:
以上所有內(nèi)容是針對(duì)用戶(hù)在電商平臺(tái)輸入的關(guān)鍵詞進(jìn)行搜索,召回商品的模型和決策規(guī)則模型,當(dāng)然規(guī)則的細(xì)節(jié)遠(yuǎn)不止于上面講的這些,因本篇文章重點(diǎn)分析搜索業(yè)務(wù),具體產(chǎn)品的設(shè)計(jì)放到下篇再續(xù);
現(xiàn)在規(guī)則有了,當(dāng)用戶(hù)輸入關(guān)鍵詞,搜索引擎系統(tǒng)根據(jù)決策規(guī)則去召回商品,召回的商品返回給前臺(tái)后,這個(gè)時(shí)候商品的展示怎么展示、排序怎么排序?
我們放到電商搜索系統(tǒng)精講系列三步曲的第二步與大家分享;
本文由 @產(chǎn)品研究站?原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自Pexels,基于CC0協(xié)議
我必須給樓主點(diǎn)贊,看了那么多文章,就你這個(gè)有干貨,實(shí)在。大贊
純干貨,寫(xiě)的接地氣,很好理解
挺好,希望多一點(diǎn)這種原理解析的干貨。