淺談淘寶類目屬性體系:商品搜索背后的邏輯架構(gòu)
淘寶目前在線商品數(shù)超過 10 億,如何精準(zhǔn)的幫助用戶找到他想要的商品呢?經(jīng)過多年的探索,淘寶通過建立一套完整的類目屬性體系,終于較好的解決了這一問題,今天就跟大家一起來談?wù)勌詫毜念惸繉傩泽w系。
一點點歷史和架構(gòu)
2003 年淘寶剛上線時,商品量很少,沒有分類。 后來,商品量上百,開始有了對商品進(jìn)行單級分類,有點類似于現(xiàn)在的一級行業(yè)類目。
等到商品上萬的時候,商品的單級分類已經(jīng)不能滿足需求,開始有了多級分類,就是一顆類目樹了。從 06 年開始引入了屬性,商家按照屬性模板填寫屬性,用戶可以按照屬性篩選商品。
到了 08 年,開始將前后臺類目分開,用戶根據(jù)前臺類目篩選商品,商家將商品掛到后臺類目上,前后臺類目樹之間建立好映射。
今天的淘寶類目屬性體系主要由后臺類目樹、前臺類目樹、掛載在后來葉子類目上的商品屬性模板以及管理前后臺類目之間映射關(guān)系的類目管理平臺組成,整體架構(gòu)如下:
從圖中可以看出,淘寶類目屬性體系是一個非?;A(chǔ)的數(shù)據(jù)服務(wù),在商品發(fā)布頁上商家選擇后臺類目上傳商品信息,詳情頁上以面包屑的方式給用戶顯示商品所屬的前臺類目,在搜索結(jié)果頁上讓用戶根據(jù)前臺類目篩選商品。運營同學(xué)可以通過一個管理后臺來管理前后臺類目之間的映射關(guān)系以及后臺類目的屬性模板。
后臺類目
后臺類目面向商家,主要用于商品的分類和屬性管理。商家上傳商品時見到的就是后臺類目,如下圖:
后臺類目有如下特點:
- 后臺類目樹中最重要的是葉子類目,也就是類目樹上不能再往下分的類目,任何商品都必須掛載到后臺葉子類目上。
- 葉子類目掛載屬性模版,商家發(fā)布商品時選擇好類目之后會根據(jù)屬性模版,補(bǔ)充必填的商品屬性信息,方可成功上傳商品。
- 后臺類目相對穩(wěn)定,不能隨便刪除,葉子類目不能重復(fù)。
前臺類目
前臺分類面向用戶,方便用戶篩選查找商品,大部分時候用戶見到的類目都是前臺類目。下圖就是淘寶搜索結(jié)果頁上的淘寶前臺類目樹:
前臺類目有如下特點:
- 用戶購買時看到的類目是前臺類目。
- 前臺類目通過跟后臺映射間接和商品關(guān)聯(lián)。
- 前臺類目由后臺葉子類目+屬性組成,一個前臺類目可以包含多個后臺類目,一個后臺類目也可以映射給多個前臺類目。
- 前臺類目不直接掛載屬性模版,前臺類目對應(yīng)的屬性來自后臺葉子類目的公共屬性。
- 前臺類目很靈活,可重疊,可刪除。
為什么要將前后臺類目分開呢?
介紹完淘寶的類目屬性體系,或許你會問為啥要將前臺類目和后臺類目分開呢?直接用一套類目體系不就行了嗎?這里我就給大家解釋一下原因,到了 08 年,淘寶商品日益增多,類目層級也越來越深,買家越來越難找到想要的商品。淘寶的小二們就開始不斷調(diào)整類目屬性,把類目樹變淺,讓商品更容易被買家找到。只有一套類目體系的情況下,小二每次調(diào)整,賣家也必須跟著調(diào)整。如果只是改一次,賣家也能勉強(qiáng)接受,但這是周期性的。比如,在夏天服裝這個類目下可能是連衣裙、襯衫等夏裝,到了冬天就會變成打底褲、羽絨服等冬裝了,而且賣家也都知道這些調(diào)整時合理的,但是一年到頭這么調(diào)整,意味著他一年到頭都在編輯類目,可能還得專門養(yǎng)個把人在那里,一天到晚改類目,無形中賣家的運營成本也就提高了。
08 年的時候,有個淘寶的產(chǎn)品經(jīng)理從線下零售巨頭沃爾瑪?shù)玫絾l(fā),他發(fā)現(xiàn)沃爾瑪倉庫里面的類目分區(qū)和貨架區(qū)的類目分區(qū)是分離的,倉庫里面的類目分區(qū)比較穩(wěn)定,很少變化,而貨架區(qū)的類目分區(qū)會根據(jù)活動和季節(jié)經(jīng)常調(diào)整。類似的,淘寶也可以把原來的一套類目體系分為后臺分類和前臺分類,后臺分類面向商家,用來掛載商品和屬性模板,比較穩(wěn)定很少變化;前臺分類面向用戶,主要方便用戶查找商品,很靈活,可以經(jīng)常調(diào)整。后臺類目和前臺類目之間通過映射聯(lián)系起來,一個后臺類目可以映射到多個前臺類目,一個前臺類目也可以包含多個后臺類目。
從技術(shù)的角度來看的話,前臺類目就是在后臺類目的基礎(chǔ)上建立了一個虛擬類目。
類目屬性體系在搜索上的應(yīng)用
先來看看類目屬性體系是怎么幫助提升搜索的精準(zhǔn)度的,下圖是說明了用戶 query 到商品搜索結(jié)果的全過程:
用戶輸入 query:iPhone,淘寶類目屬性體系預(yù)測到跟這個 query 最相關(guān)的前臺類目是手機(jī),然后前臺類目通過映射找到后臺類目手機(jī),最終在這個類目下找到了“iPhone 5s 土豪金”這個商品。
有了類目屬性體系,用戶搜索 iPhone,淘寶就不會給出手機(jī)套這樣的配件了,因為它只會到手機(jī)類目下去找商品。
有了類目屬性體系,用戶可以直接在搜索結(jié)果頁按照類目和屬性篩選商品,更加高效的找到想要的商品。而淘寶搜索可以通過記錄用戶搜索 query 之后的類目屬性篩選行為,精準(zhǔn)預(yù)測每一個 query 的類目和屬性意圖,當(dāng)用戶再次搜索的時候,可以根據(jù) query 的類目屬性意圖,在 query 文本相關(guān)性的基礎(chǔ)上計算出商品的類目和屬性相關(guān)性,把包含 query,且跟用戶的類目和屬性意圖最相關(guān)的商品優(yōu)先展示給用戶。這也是百度這樣的通用搜索引擎所做不到的,因為它沒有類目屬性體系。
有了類目屬性體系,還可以做好搜索算法的垂直化優(yōu)化。也就是在每一個細(xì)分類目下,可以采用不同的商家權(quán)重和品牌權(quán)重,甚至可以有不同的排序公式。比如用戶選擇手機(jī)時,更多考慮各項參數(shù)和評測文章,這個時候相應(yīng)的排序權(quán)重因子可以加強(qiáng),而選擇服裝的時候,一張漂亮的主圖就無比重要了,排序因子里面主圖質(zhì)量的權(quán)重就需要提升了。 有了類目屬性體系,還可以做基于類目和屬性的個性化搜索。搜索引擎通過用戶的類目屬性篩選日志,可以挖掘出用戶的一些特征,比如性別,意向價格區(qū)間,偏好品牌,偏好品類等,從而可以對這個用戶做個性化的展示。
類目屬性體系無處不在
除了電商,其實在各個需要幫助快速查找信息領(lǐng)域都可以見到類目屬性體系的身影。比如:教育行業(yè)里面的課程分類,醫(yī)療行業(yè)的疾病和醫(yī)院分類。當(dāng)我們把用戶查找的信息看做一個個實體的時候,對實體分類以幫助快速定位查找就是一個非常通用的方法。從這個角度來講,Google 的 Knowledge Graph 可以看做是將電商網(wǎng)站里面的商品類目屬性體系推廣到了整個世界中的萬事萬物,它試圖使用一套統(tǒng)一的類目屬性網(wǎng)來囊括所有的實體,或許這就是通用搜索引擎的類目屬性體系吧。
本文為作者葛燦輝(@葛燦輝-搜索數(shù)據(jù)挖掘)投稿發(fā)布,轉(zhuǎn)載請注明出處并附帶本文鏈接
想問下 query后記錄用戶類目屬性篩選行為是通過什么方案記錄的呢 數(shù)據(jù)埋點嗎?
淘寶商品會有標(biāo)簽體系么?標(biāo)簽類目直接的關(guān)系是怎樣的?