推送系統(tǒng)從0到1(七):推送用戶畫像建立
通過前六篇文章的介紹,大家應(yīng)該對推送系統(tǒng)的整體運(yùn)作流程有清晰的了解。本篇開始將會從數(shù)據(jù)和運(yùn)營層面對推送進(jìn)行更深入的介紹,力求把推送的效果最大化,也和大家一起把推送系統(tǒng)研究到極致。
想要通過推送達(dá)成運(yùn)營目的,首要的是要用戶點(diǎn)開推送消息,進(jìn)到目標(biāo)頁面才有機(jī)會實現(xiàn)運(yùn)營目的。所以推送點(diǎn)擊率,成為許多運(yùn)營者觀察的數(shù)據(jù)指標(biāo)之一。
用戶對推送內(nèi)容是否感興趣,很大程度影響著點(diǎn)擊率的高低。近年來,各種信息平臺/電商網(wǎng)站通過精準(zhǔn)推薦、消息聚合和消息分發(fā),聲稱基于大數(shù)據(jù)算法實現(xiàn)個性化的推薦,從而達(dá)到內(nèi)容點(diǎn)開率大幅提升。
精準(zhǔn)+大數(shù)據(jù)算法似乎成為當(dāng)下的潮流,但是對于很多產(chǎn)品經(jīng)理來說,機(jī)器學(xué)習(xí)、大數(shù)據(jù)算法聽起來就難以實現(xiàn)。
其實個性化推薦并沒有想象的那么困難,本篇將會給大家介紹個性化精準(zhǔn)推送的第一步:建立用戶畫像,當(dāng)然我們主要從推送出發(fā),在推薦算法上不會有太深入的挖掘。
為什么建立用戶畫像
其實要做精準(zhǔn)推送同樣可以使用多種推薦算法,例如:基于用戶協(xié)同推薦、基于內(nèi)容協(xié)同的推薦等其他的推薦方式,但是以上方式多是基于相似進(jìn)行推薦,運(yùn)用范圍多為單一的功能,難以實現(xiàn)全網(wǎng)功能之間的聯(lián)動。而構(gòu)建用戶畫像,不僅可以滿足根據(jù)分析用戶進(jìn)行推薦,更可以運(yùn)用在全網(wǎng)所有功能上。
建立用戶畫像確實是一個一勞多得的事情,不僅可以運(yùn)用于精準(zhǔn)推送、精準(zhǔn)推薦、精準(zhǔn)營銷,更可以作為網(wǎng)站的用戶屬性分析,用戶行為分析,商業(yè)化轉(zhuǎn)化分析等。同時網(wǎng)站共用一套用戶畫像,可以對用戶有統(tǒng)一的認(rèn)知,更可以在各個運(yùn)用渠道對數(shù)據(jù)進(jìn)行補(bǔ)充和矯正。
大致的理念如下圖:
從圖上可以看出,用戶畫像的運(yùn)用途徑非常廣,但那些都是應(yīng)用層面的事情,我們在此主要分析從用戶畫像構(gòu)建到實現(xiàn)精準(zhǔn)推送的過程。下面開始為大家介紹如何構(gòu)建網(wǎng)站的用戶畫像庫。
用戶畫像構(gòu)建思路
在部分構(gòu)建用戶畫像介紹文章中分為四個層級,第四層為預(yù)測模型,但在精準(zhǔn)推送中較少運(yùn)用到預(yù)測的需求,而且預(yù)測算法會是更高階的算法,需要大量的數(shù)據(jù)演算,本次不做討論,所以暫且分為三層進(jìn)行構(gòu)建。
從圖中可以看到,用戶畫像的第一層主要是原始數(shù)據(jù)庫,此數(shù)據(jù)庫主要囊括后續(xù)分析所需要的所有原始數(shù)據(jù)。也是通過大量數(shù)據(jù)的分析和處理,后面能提煉成用戶的畫像得以運(yùn)用。
故在這一層的關(guān)鍵詞是:大量、數(shù)據(jù)。而第二層級是根據(jù)第一層的原始數(shù)據(jù)通過算法計算、提煉、規(guī)劃成可以組成用戶畫像的一系列通用標(biāo)簽,而這類標(biāo)簽的存在形式類似于矩陣或者多個類別的集合。
在業(yè)務(wù)需要時,該類標(biāo)簽從數(shù)量和維度都可以增加以滿足業(yè)務(wù)需求。所以第二層的關(guān)鍵詞是:通用、標(biāo)簽。
而對于第三層,我們可以通過對標(biāo)簽的聚合、提煉、建模等方式構(gòu)成用戶的多個“面”,并運(yùn)用于多個場景。例如:說小明在聽音樂時的畫像是搖滾、年輕、流行、活潑;而在學(xué)習(xí)時的畫像是認(rèn)真、專心、投入、經(jīng)濟(jì)學(xué)等。
通過用戶不同的角度實際運(yùn)用于各類業(yè)務(wù)需求,實現(xiàn)精準(zhǔn)化。所以在第三層的關(guān)鍵詞是:聚合、運(yùn)用。
建立原始數(shù)據(jù)庫
從第一層的原始數(shù)據(jù)庫搭建開始介紹,這一層我們需要獲得盡量多的原始數(shù)據(jù),因后面的所有的應(yīng)用場景都依托于原始數(shù)據(jù)的計算、分析、建模,所以在原始數(shù)據(jù)庫搭建時需要考慮更全面,當(dāng)然原始數(shù)據(jù)與數(shù)據(jù)存儲、采集難度和成本都密切相關(guān)。
以下圖為主要數(shù)據(jù)維度,大家根據(jù)實際情況進(jìn)行抉擇。
一般來說,例如:電商類網(wǎng)站。對用戶的分析更為深入仔細(xì),會需要分析出用戶的購買力,所以可能會在用戶信息部分下功夫。雖然在用戶信息泛濫的今天,依然不提倡大家通過非正常渠道獲取用戶信息,即便這些數(shù)據(jù)的商業(yè)價值很高。
而第二類數(shù)據(jù)即用戶行為數(shù)據(jù)是必選項,用戶行為數(shù)據(jù)可以更好的分析用戶需求,更容易獲取用戶的興趣內(nèi)容。所以大部分的推薦算法,都會基于用戶行為作為原始數(shù)據(jù)源。而用戶環(huán)境信息及其他的數(shù)據(jù),可以作為數(shù)據(jù)分析的重要參考資料,這個可視實際情況進(jìn)行采集和存儲。
下面仔細(xì)介紹如何采集用戶行為數(shù)據(jù),采集的目的多用于推算出用戶的喜好度以及分析用戶的轉(zhuǎn)化行為。通過用戶行為推算出用戶的標(biāo)簽,實質(zhì)是利用用戶感興趣的內(nèi)容賦予標(biāo)簽化的過程。
主要思路如下圖:
這個方法的核心思路就是把用戶在網(wǎng)站內(nèi)的每一個操作和操作的對象、操作時間,均記錄下來,形成一個用戶行為表,這樣用戶行為的原始數(shù)據(jù)就構(gòu)建完成了。
具體操作如下:
把用戶瀏覽/收聽/觀看的每一個內(nèi)容、瀏覽時間、與該內(nèi)容的交互(點(diǎn)擊、滑動)、在該內(nèi)容的關(guān)鍵指標(biāo)(收藏、分享、商業(yè)化行為等)均記錄下來,那么每個用戶都會有一個用戶行為記錄表,而記錄的維度可以是數(shù)值,可以是“是or否”,也可以是時間,要視具體的需求而定。
如下圖:是我在實際設(shè)計過程中定義的用戶行為數(shù)據(jù)存儲格式,主要反映用戶在什么時間看了什么,并做了什么事情。
根據(jù)這個表格形成原始數(shù)據(jù),當(dāng)然我前面也說到了,這只是原始數(shù)據(jù)中行為數(shù)據(jù)的部分,在設(shè)計時可以根據(jù)實際情況拓展數(shù)據(jù)表。
通過記錄用戶行為的這個原始數(shù)據(jù),我們可以獲得這些信息:用戶的訪問習(xí)慣(頻率、時間、時長)、用戶感興趣的內(nèi)容、用戶對內(nèi)容的感興趣程度。
其實光是這些,我們已經(jīng)大致能推算出用戶基本喜好度了。但是這個方法有個缺陷,既用戶未產(chǎn)生足夠多的行為時,我們無法獲取其行為信息,自然也無法進(jìn)行后續(xù)分析。此時就可以運(yùn)用前面介紹到的通過用戶的信息、用戶環(huán)境等其他數(shù)據(jù)作為基礎(chǔ),通過用戶協(xié)同算法,找到與該用戶相似的同類用戶喜好的內(nèi)容。
建立用戶標(biāo)簽庫
根據(jù)上面獲得的用戶行為原始數(shù)據(jù),我們得到了一張龐大的行為記錄表。但是想要把這個表格的內(nèi)容運(yùn)用起來,我們需要把用戶行為更為具象化,也就是需要把用戶畫像構(gòu)建起來。
構(gòu)成用戶畫像可以是一段話描述,可以是各種屬性的合集,也是直觀解釋的標(biāo)簽。根據(jù)上面的介紹,用戶畫像可以運(yùn)用在用戶的分析、商業(yè)化模式的分析、精準(zhǔn)和個性化推薦系統(tǒng)中。而本篇主要介紹精準(zhǔn)推送,故只選取可以具象化展示畫像的用戶標(biāo)簽。
其實用戶標(biāo)簽并不等同于用戶畫像,只是用戶標(biāo)簽是用戶畫像直觀的呈現(xiàn),并且是比較好且常用的運(yùn)用方式。
構(gòu)建用戶標(biāo)簽庫其實比較簡單,因為我們在上述采集用戶行為過程中,已經(jīng)把用戶喜好的內(nèi)容采集下來了,所以基礎(chǔ)標(biāo)簽并可以直接運(yùn)用內(nèi)容的標(biāo)簽。也就是通過用戶喜歡的內(nèi)容給用戶貼標(biāo)簽。
(1)內(nèi)容標(biāo)簽化
首先要做的事情就是把內(nèi)容標(biāo)簽化,根據(jù)內(nèi)容定性的制定一系列標(biāo)簽,這些標(biāo)簽可以是描述性標(biāo)簽,也可以是具象的標(biāo)簽,更可以是數(shù)字或者數(shù)值范圍。這些內(nèi)容的標(biāo)簽需要具有通用性,即適用于你所采集的用戶瀏覽的所有內(nèi)容。
例如:是電商類網(wǎng)站,則這一些列標(biāo)簽可以是商品類型、商品價格范圍、商品產(chǎn)地、商品品牌、商品特點(diǎn)等等。如果是房產(chǎn)類網(wǎng)站,則可以是房子的區(qū)域、價格、面積、格局、形態(tài)等等。
在完成這一步操作之后,此時用戶行為表中的內(nèi)容均可以標(biāo)簽化了,相當(dāng)于用戶行為表記錄的是用戶對一組標(biāo)簽的感興趣程度。
在對內(nèi)容標(biāo)簽化的時候,需要注意,標(biāo)簽的值需要有統(tǒng)一的范圍,不然在后期將無法進(jìn)行使用和比較。例如說:上圖表格中,“區(qū)域”這個標(biāo)簽的值范圍只能是某個行政區(qū),而每個房源信息都有這個區(qū)域值的標(biāo)簽,切勿出現(xiàn)“區(qū)域”這個標(biāo)簽值是范圍外的內(nèi)容,如:小區(qū)名等情況。
以上圖為例,房源ID-1001的標(biāo)簽為:福田區(qū)、6萬單價、2房、40-50坪、……
(2)用戶標(biāo)簽化
第二步要做的就是把內(nèi)容的標(biāo)簽賦予用戶,這個過程就是需要研究用戶對內(nèi)容的喜好程度,用戶喜歡的內(nèi)容即當(dāng)作用戶喜好的標(biāo)簽。
在用戶行為記錄表中,我們所記下用戶的行為在此時就發(fā)揮出重要的作用了。用戶的瀏覽(時長/頻率)、點(diǎn)擊、分享/收藏/關(guān)注、其他商業(yè)化或關(guān)鍵信息均不同程度的代表的用戶對這個內(nèi)容的喜好程度。
此時我們可以用過給這些行為賦予權(quán)重分值,通過分值的計算得出用戶喜好的一組標(biāo)簽。按照行為的重要程度賦予分值沒有規(guī)定的值推薦給大家,大家可以通過不斷的嘗試和調(diào)整,找到最適合自己算法的權(quán)重值。同時內(nèi)容是具有時效性或者與時間的關(guān)系比較重要,也是可以把時間作為權(quán)重參數(shù)之一。以下圖是舉例說明為行為賦值的過程。
完成對關(guān)鍵行為賦予權(quán)重分值后,即可開始計算,首先我們把用戶瀏覽(收聽、觀看)的內(nèi)容全部按照上面內(nèi)容標(biāo)簽化的方式打散成標(biāo)簽,并且把用戶行為表中的關(guān)鍵行為轉(zhuǎn)化成對應(yīng)分值。
這樣可以得到下表:
把標(biāo)簽與分值關(guān)聯(lián)進(jìn)行求和計算,即每個標(biāo)簽的值都可以得到一個分值之和,例如說:商品A的標(biāo)簽“商品產(chǎn)地”的值有“福建、廣東、、云南、浙江、河北”等,通過分值計算,找到分值最高的值作為該用戶此標(biāo)簽的值。
如:計算出來“福建”的分值最高,即該用戶喜歡“商品產(chǎn)地是福建”的商品。
通過以上計算可以實現(xiàn)每個系列標(biāo)簽獲得分值最高的值,此時根據(jù)自身的需求,可以取最高的值作為標(biāo)簽值,當(dāng)然也可以從分值從高到低排序,取前幾個成為標(biāo)簽數(shù)組。通過上面計算,那么一個用戶將獲得一組/多組標(biāo)簽及對應(yīng)的值。
如下圖:
建立用戶畫像庫
我們通過上述方式獲得了用戶的一組組標(biāo)簽,但是對用戶的剖析并不夠立體。用戶畫像的是個立體標(biāo)簽庫的集合,此時就需要我們把標(biāo)簽組構(gòu)成像矩陣、集合一樣立體。再把用戶通過各類維度進(jìn)行組合和排布,形成用戶畫像。
這是一個用戶的畫像在數(shù)據(jù)表中的形態(tài),然而網(wǎng)站千萬用戶均有自己的畫像庫,所以在構(gòu)建用戶畫像的時候,需要考慮數(shù)據(jù)存儲的問題。這個大量的數(shù)據(jù)計算將會持續(xù)對數(shù)據(jù)的存和使用造成壓力,所以在構(gòu)建時一定要與研發(fā)工程師討論。
用戶畫像的橫向和縱向都具有拓展性,隨著基礎(chǔ)數(shù)據(jù)的獲取越來越多,可以拓展的維度也越來越多。同時通過標(biāo)簽的組合、聚合和拓展,可以形成二級標(biāo)簽、三級標(biāo)簽等高階標(biāo)簽,并運(yùn)用于不同場景。
下面將為大家舉例介紹標(biāo)簽多變的玩法。
應(yīng)用層的用戶標(biāo)簽
來到應(yīng)用層,我們就可以充分的利用標(biāo)簽發(fā)揮各種用途。首先我們可以通過標(biāo)簽篩選出用戶,特定的幾個標(biāo)簽即可圈定特定范圍的用戶。
例如說:我可以在用戶池中篩選出“年輕、單身、用蘋果手機(jī)、喜歡xxx”的用戶,可以對這類用戶進(jìn)行有針對性的推薦和營銷。同時除了圈定用戶,我們還可以對標(biāo)簽進(jìn)行組合。如:標(biāo)簽A=標(biāo)簽a+標(biāo)簽b-標(biāo)簽c。
以上面基礎(chǔ)用戶畫像圖中信息舉例:首購用戶=年齡22~35歲+購房格局為2房+購房單價低于X萬-有小孩+….等等,當(dāng)然只是舉例說明,通過標(biāo)簽之間的組合疊加或排除,可以形成更高階的標(biāo)簽并運(yùn)用于各種應(yīng)用層。
例如:電商網(wǎng)站經(jīng)常會通過各種信息來判斷用戶的購買力、喜歡的商品,購物習(xí)慣和購物頻次。這些都是可以根據(jù)基礎(chǔ)標(biāo)簽的聚合計算出來的,不同的組合方式讓標(biāo)簽更豐富,更貼近實際運(yùn)用場景,但是也不會干擾原始標(biāo)簽庫和用戶原始數(shù)據(jù)的存儲和使用。
總結(jié)
本篇主要為大家介紹了精準(zhǔn)推送的第一步,構(gòu)建用戶畫像:
- 構(gòu)建用戶畫像可以用于精準(zhǔn)推薦、精準(zhǔn)推送、精準(zhǔn)營銷、數(shù)據(jù)分析等;
- 把用戶畫像構(gòu)建分成三層,分別是原始數(shù)據(jù)庫、畫像標(biāo)簽庫、畫像應(yīng)用層;
- 原始數(shù)據(jù)的獲取可以是用戶信息、用戶行為、用戶環(huán)境等相關(guān)信息;
- 通過分析用戶行為,可以針對用戶對內(nèi)容的喜好度,使用內(nèi)容給用戶標(biāo)簽化;
- 用戶畫像是可以在橫向和縱向進(jìn)行拓展的龐大標(biāo)簽組;
- 在應(yīng)用層可以通過標(biāo)簽的組合、聚合、拓展形成各類高級標(biāo)簽并靈活使用。
在下一篇將會給大家介紹通過一些相似度算法,計算用戶最感興趣的內(nèi)容,從而實現(xiàn)精準(zhǔn)的個性化推送,盡請期待!
相關(guān)閱讀
推送系統(tǒng)從0到1(一):是系統(tǒng)不是工具
推送系統(tǒng)從0到1(四):消息如何到達(dá)用戶設(shè)備
推送系統(tǒng)從0到1(六):推送的著陸頁設(shè)計
本文由 @番茄那只羊 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Pexels,基于CC0協(xié)議
學(xué)習(xí)了,非常棒!
這個是針對于C端的,還是如果加上B端的就更好了
您好,有點(diǎn)沒看懂,在“用戶標(biāo)簽化”舉例的表里: 標(biāo)簽系列一指的是一系列行為指標(biāo)的集合么?包含“瀏覽時長,關(guān)注,收藏,點(diǎn)贊。?!比缓笠驗樘崆岸x了集合每個操作對應(yīng)的數(shù)值所以進(jìn)行了求和。那對應(yīng)的ABCD又指的是什么呢,?(是指對標(biāo)簽的定義么,比如“非常喜歡”“一般”“不感興趣”)?? 期待回答
標(biāo)簽系列一指的是一個標(biāo)簽類別,比如以人為例,那標(biāo)簽系列一就是家鄉(xiāng),那ABCD就是不同的省這樣,然后瀏覽時長啥的是用戶行為,用來加總反應(yīng)用戶的偏好,就一個標(biāo)簽下江西省的行為加總是5,浙江省的是7,那么標(biāo)簽一得出的偏好就是浙江省。
哇塞,大寫的優(yōu)秀~ ??
怎么不支持打賞 ??
打賞功能今天突然不見了~
強(qiáng)烈推薦!全文最全推送系統(tǒng)知識型分享~ ??
感謝支持~~~ ??
期待更新
感謝支持哦~ ??
感謝作者分享,這篇很實用。請問有沒有深入講解用戶畫像的書籍推薦?
用戶畫像和推薦算法:可以看《推薦系統(tǒng)實踐》;我的下一篇文章也會提到這本書。
蟹蟹
這文章寫的好呀
感謝支持哦~ ??
想問下這是什么書啊,能否推薦下,去細(xì)讀下 ??
1.推送系列文章:是我自己通過實戰(zhàn)總結(jié)出來的經(jīng)驗,個人觀點(diǎn)僅供參考
2.用戶畫像和推薦算法:可以看《推薦系統(tǒng)實踐》;我的下一篇文章也會提到這本書。 ??