電商搜索邏輯全解析

8 評(píng)論 34156 瀏覽 265 收藏 12 分鐘

編輯導(dǎo)語(yǔ):對(duì)于電商平臺(tái)來(lái)說(shuō),搜索功能是至關(guān)重要的,可以說(shuō)是最核心的功能,好的搜索設(shè)計(jì)往往可以吸引用戶(hù),促進(jìn)用戶(hù)點(diǎn)擊商品,從而實(shí)現(xiàn)交易的轉(zhuǎn)化。接下來(lái),本文作者通過(guò)剖析電商行業(yè)的專(zhuān)屬特點(diǎn)和需求,并結(jié)合其個(gè)人經(jīng)驗(yàn),為我們分享了他總結(jié)的解決方案,并且預(yù)測(cè)了電商搜索的未來(lái)趨勢(shì)。

搜索功能一定是一家電商平臺(tái)技術(shù)中最重要的核心的功能,我相信大家對(duì)此都無(wú)異議。

因?yàn)闊o(wú)論產(chǎn)品經(jīng)理設(shè)計(jì)了多么完美的產(chǎn)品邏輯,老板砸了多少錢(qián)去做拉新用戶(hù),如果用戶(hù)在搜索體驗(yàn)時(shí),搜索結(jié)果不符合預(yù)期或者不滿(mǎn)足其搜索需求,那么之前所做的工作都會(huì)付之東流了。

畢竟電商服務(wù)的行業(yè)屬性還是促進(jìn)業(yè)務(wù)的轉(zhuǎn)化,實(shí)現(xiàn)買(mǎi)賣(mài)成單。

本文通過(guò)剖析電商行業(yè)的專(zhuān)屬特點(diǎn)和需求,并結(jié)合個(gè)人經(jīng)驗(yàn)分享解決方案,希望對(duì)大家有所啟發(fā)~

一、搜索的業(yè)務(wù)邏輯

“搜索Query→查詢(xún)語(yǔ)義理解→召回→排序→搜索結(jié)果”

當(dāng)用戶(hù)在搜索框輸入一個(gè)Query時(shí),系統(tǒng)通過(guò)對(duì)語(yǔ)義的理解,召回相關(guān)文檔或商品,在通過(guò)算法排序,安客戶(hù)實(shí)際的搜索意圖進(jìn)行前后排序,最終解決其搜索需求,實(shí)現(xiàn)業(yè)務(wù)轉(zhuǎn)化。

其中【查詢(xún)語(yǔ)義理解】與【排序】對(duì)搜索引導(dǎo)的業(yè)務(wù)目標(biāo)最為重要。

二、自然語(yǔ)言處理技術(shù)(NLP)在搜索上的應(yīng)用

1. 概念介紹

想實(shí)現(xiàn)搜索引擎效果的優(yōu)化,就一定要對(duì)自然語(yǔ)言處理技術(shù)有一定的了解,因?yàn)橛脩?hù)輸入一個(gè)Query里從學(xué)術(shù)角度解讀,自然語(yǔ)言智能研究實(shí)現(xiàn)了人與計(jì)算機(jī)之間用語(yǔ)言進(jìn)行有效通信,它是融合語(yǔ)言學(xué)、心理學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)于一體的科學(xué)。

自然語(yǔ)言處理被學(xué)者譽(yù)為”人工智能皇冠上的明珠“,研究覆蓋了感知智能、認(rèn)知智能、創(chuàng)造智能這樣的學(xué)科,是實(shí)現(xiàn)完整人工智能的必要技術(shù)。

1)感知智能

是指從無(wú)結(jié)構(gòu)化數(shù)據(jù)中識(shí)別出重要的要素。比如給一個(gè)query,分析出包含的人民、地名、機(jī)構(gòu)名等。

2)認(rèn)知智能

是在感知之上,能夠理解其中要素的含義以及進(jìn)行一些推理。比如“謝霆鋒是誰(shuí)的兒子 ?誰(shuí)是謝霆鋒的兒子”兩句話(huà)。詞和實(shí)體都差不多,但語(yǔ)義差別很多。這是認(rèn)知智能要解決的問(wèn)題。

3)創(chuàng)造智能

比如計(jì)算機(jī)指能夠理解語(yǔ)義的基礎(chǔ)上,創(chuàng)造出符合常識(shí)、語(yǔ)義、邏輯的句子。比如自動(dòng)寫(xiě)出行云流水的小說(shuō)、創(chuàng)造娓娓動(dòng)聽(tīng)的音樂(lè) ? ?能夠無(wú)違和跟人自然聊天等。

2. NLP搜索分析路徑

三、電商搜索的特點(diǎn)

1. 關(guān)鍵詞堆砌

例如:楊冪同款夏季連衣裙包郵。

2. 詞序?qū)φZ(yǔ)義影響不大

例如:楊冪同款女夏季連衣裙包郵;女夏季連衣裙包郵楊冪同款。

3. 類(lèi)目預(yù)測(cè)問(wèn)題

例如:當(dāng)用戶(hù)查詢(xún)“蘋(píng)果”時(shí),可能查詢(xún)的是水果,也可能是手機(jī)品牌。

4. 搜索引導(dǎo)的業(yè)務(wù)轉(zhuǎn)化比重較大

據(jù)統(tǒng)計(jì),綜合類(lèi)電商搜索引導(dǎo)轉(zhuǎn)化占比40%以上,垂直類(lèi)電商搜索引導(dǎo)轉(zhuǎn)化占比60%以上。

5. 穩(wěn)定性要求較高,支持彈性擴(kuò)容

活動(dòng)、大促系統(tǒng)QPS可能是平時(shí)的百倍千倍,需要平滑的擴(kuò)縮容,保障系統(tǒng)的穩(wěn)定。

四、電商搜索優(yōu)化核心內(nèi)容

1. 分詞(劃重點(diǎn)?。?/h3>

1)分詞效果的優(yōu)化直接影響召回?cái)?shù)量,減少無(wú)結(jié)果率,提高搜索召回質(zhì)量

例如:

“火鍋九塊九包郵”

  • 效果差的分詞方式:“火、鍋、九、塊、九、包、郵”;“火鍋、九、塊、九、包郵”
  • 效果好的分詞方式:“火鍋、九塊九、包郵”

”925銀耳飾“

  • 效果差的分詞方式:“925、銀耳、銀、耳飾”
  • 效果好的分詞方式:“925、銀、耳飾”

2)不同的分詞方式直接影響著參與召回的關(guān)鍵詞,從而影響召回的準(zhǔn)確性

目前很多開(kāi)源自建系統(tǒng)難以實(shí)現(xiàn)很好的分詞效果,主要原因是訓(xùn)練語(yǔ)料的數(shù)據(jù)量有限,不足以形成可以不斷打磨深耕的行業(yè)數(shù)據(jù)。

尤其電商行業(yè)商品種類(lèi)豐富,中文字、詞表達(dá)的意義多樣,多音字、同義詞又眾多的情況下,靠自身算法工程師和開(kāi)發(fā)團(tuán)隊(duì)很難實(shí)現(xiàn)快速的解決優(yōu)化,這是一個(gè)不斷積累訓(xùn)練的漫長(zhǎng)過(guò)程。

3)強(qiáng)烈建議選擇云產(chǎn)品(電商推薦阿里云開(kāi)放搜索、內(nèi)容\日志搜索推薦ES)

現(xiàn)成的百萬(wàn)級(jí)訓(xùn)練語(yǔ)料、行業(yè)模板直接接入,畢竟專(zhuān)業(yè)領(lǐng)域交給更專(zhuān)業(yè)的人,我們才有更多資源投身到業(yè)務(wù)迭代中去。

2. 實(shí)體識(shí)別

1)電商搜索-實(shí)體識(shí)別含義

識(shí)別Query中的品牌、品類(lèi)、款式、風(fēng)格等具有電商行業(yè)特色的實(shí)體。

2)召回時(shí)保留重要性高的實(shí)體詞,對(duì)重要性低的部分不影響召回,只影響算法排序

例如:在電商Query中,在實(shí)體重要性如果按高、中、低三檔來(lái)分。

其中“品牌、品類(lèi)”是在高檔,也就是最重要的;其次“風(fēng)格、款式、顏色、季節(jié)、人群、地點(diǎn)…”處于中檔;最后“尺寸、修飾詞、影響服務(wù)、系列、單位…”處于低檔,可以丟棄不參與召回。

3. 類(lèi)目預(yù)測(cè)

舉例說(shuō)明:

  1. 用戶(hù)搜索“蘋(píng)果”可能是想要水果的蘋(píng)果,也可能是蘋(píng)果手機(jī);
  2. (用戶(hù)搜索“華為”,召回結(jié)果按銷(xiāo)量排序,可能銷(xiāo)量最高的“華為手表”、“華為配件”排在前面,實(shí)際的搜索意圖”華為手機(jī)“卻排在后面。

類(lèi)目預(yù)測(cè)就是根據(jù)類(lèi)目下的文本信息和行為數(shù)據(jù),計(jì)算query與類(lèi)目的相關(guān)度,從而達(dá)到預(yù)測(cè)query的查詢(xún)意圖的目的,計(jì)算哪些類(lèi)目與query最相關(guān),用類(lèi)目相關(guān)度影響搜索結(jié)果的排序。

也就是說(shuō),當(dāng)通過(guò)行為數(shù)據(jù)分析,發(fā)現(xiàn)搜索”華為”的用戶(hù),大部分的搜索意圖都為“手機(jī)”,那么召回排序上優(yōu)先“手機(jī)類(lèi)目”。

4. 排序算法

電商排序常見(jiàn)問(wèn)題:

  1. 數(shù)據(jù)缺乏時(shí)效性:難以平衡優(yōu)質(zhì)商品和新發(fā)布商品之間的權(quán)衡關(guān)系;
  2. 商家刷排名:部分商家找到排序漏洞,通過(guò)關(guān)鍵詞堆砌,獲得靠前位置,用戶(hù)體驗(yàn)不好;
  3. 人力資源緊張:需要專(zhuān)業(yè)算法工程師2-3名,很難找到合適的人才。

5. 人工干預(yù)bad case

舉例說(shuō)明:

  1. “iPhone11”剛上市時(shí),用戶(hù)搜索“蘋(píng)果/iphone”,最新款產(chǎn)品肯定要排在前面,在沒(méi)有常規(guī)排序算法的時(shí)候,就需要類(lèi)目預(yù)測(cè)人工干預(yù);
  2. “噴泡”是一款籃球鞋的別稱(chēng),并非主流叫法,全稱(chēng)是“Air Jordan AirFoamposite系列”,這時(shí)就需要通過(guò)平時(shí)運(yùn)營(yíng)積累的專(zhuān)業(yè)詞匯可視化同步到開(kāi)放搜索做查詢(xún)語(yǔ)義理解功能的補(bǔ)丁,通過(guò)靈活干預(yù)得以解決;
  3. 跨境電商有時(shí)Query涉及“日文、韓文、泰文”等外語(yǔ),當(dāng)我們的分詞詞典不能很好的分詞優(yōu)化時(shí),也可以通過(guò)分詞干預(yù)功能解決;
  4. 用戶(hù)搜索Query“香奈兒氣墊”,默認(rèn)的實(shí)體識(shí)別,將“香奈兒”歸類(lèi)為“普通詞”;“氣墊”歸類(lèi)為“材質(zhì)”,需要人工干預(yù)實(shí)體識(shí)別,把“香奈兒”干預(yù)為品牌。

6. 搜索引導(dǎo)功能

1)搜索前引導(dǎo)

  1. 搜索框底紋:根據(jù)用戶(hù)近期行為數(shù)據(jù),引導(dǎo)用戶(hù)意圖;
  2. 搜索熱搜榜:實(shí)時(shí)熱度,引導(dǎo)隨便逛逛的用戶(hù),想知道大家都搜了些什么;
  3. 搜索熱詞:結(jié)合興趣,給用戶(hù)推薦優(yōu)質(zhì)查詢(xún)?cè)~。

2)搜索中引導(dǎo)

下拉提示:智能推薦候選query,提高用戶(hù)輸入效率,幫助用戶(hù)盡快找到想要的內(nèi)容。

五、電商搜索未來(lái)趨勢(shì)

  1. 搜索是一個(gè)需要持續(xù)輸出優(yōu)化的技術(shù),中腰部電商未來(lái)一定會(huì)選擇輕運(yùn)作模式,借助像阿里云、華為云這樣的更專(zhuān)業(yè)的技術(shù)服務(wù)商的搜索技術(shù),把更多資源投入到業(yè)務(wù)創(chuàng)新及研發(fā)上。
  2. 行業(yè)模板的突破,據(jù)小編所知阿里云的開(kāi)放搜索技術(shù)已經(jīng)形成電商行業(yè)搜索的專(zhuān)屬模板,這也是基于淘寶天貓多年的行業(yè)經(jīng)驗(yàn)積累而成,無(wú)需開(kāi)發(fā),數(shù)據(jù)接入即可,產(chǎn)品經(jīng)理和運(yùn)營(yíng)人員都可以參與搜索效果的優(yōu)化中來(lái)。
  3. AI與搜索技術(shù)深入融合,AI智能語(yǔ)音搜索、圖片識(shí)別搜索目前主要在頭部電商上應(yīng)用,隨時(shí)技術(shù)的發(fā)展我相信,這些都會(huì)作為主流服務(wù)應(yīng)用在更多電商企業(yè)中,改變更多消費(fèi)者的消費(fèi)方式

以上內(nèi)容就是我今天我和大家分享的,希望對(duì)你有所幫助,感興趣可以關(guān)注【搜索與推薦技術(shù)】公眾號(hào)~

 

作者:KKai,B端產(chǎn)品運(yùn)營(yíng)

本文由 @KKai 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來(lái)自 Pexels,基于 CC0 協(xié)議

本文由 @KKai 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于CC0協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 作者可以加個(gè)微信嗎?文章寫(xiě)的很好,想要學(xué)習(xí)交流一下

    回復(fù)
  2. 第四大點(diǎn)-第6點(diǎn)-第2小問(wèn),能展開(kāi)講講嗎

    來(lái)自廣東 回復(fù)
  3. 第6點(diǎn)中的第2小問(wèn),能展開(kāi)講講嗎

    來(lái)自廣東 回復(fù)
    1. 下拉提示可以解決客戶(hù)快速輸入問(wèn)題,還可以根據(jù)用戶(hù)行為數(shù)據(jù),分析每一用戶(hù)的搜索意圖,潛移默化的提升了購(gòu)買(mǎi)轉(zhuǎn)化率

      來(lái)自浙江 回復(fù)
  4. 大佬你搜了什么亂七八糟的東西

    來(lái)自浙江 回復(fù)
  5. 感謝,非常干貨

    來(lái)自福建 回復(fù)
  6. 感謝分享

    回復(fù)
  7. 推薦近期【云棲大會(huì)】阿里達(dá)摩院的老師分享的自然語(yǔ)言處理技術(shù)視頻:https://yunqi.aliyun.com/2020/session54?liveId=44650

    來(lái)自浙江 回復(fù)