MarTech?-CDP實(shí)戰(zhàn)手冊:CDP交付階段-標(biāo)簽規(guī)劃(十)
MarTech?-CDP實(shí)戰(zhàn)手冊是作者在平臺分享的一個(gè)系列文章,之前作者和我們分享了交付階段的相關(guān)內(nèi)容,這篇文章,一起來解析一下標(biāo)簽部分怎么做。
標(biāo)簽規(guī)劃
標(biāo)簽規(guī)劃需要先了解標(biāo)簽的分類,根據(jù)標(biāo)簽的分類進(jìn)行梳理,分類包含事實(shí)標(biāo)簽、規(guī)則標(biāo)簽、預(yù)測標(biāo)簽。
1)事實(shí)標(biāo)簽
屬性標(biāo)簽是相對比較穩(wěn)定的標(biāo)簽,主要以客戶的性別、年齡、地區(qū)等,在梳理屬性標(biāo)簽時(shí)需要考慮相同屬性多源流入,如果有數(shù)據(jù)中臺則需要數(shù)據(jù)中臺進(jìn)行融合,輸出唯一屬性,若無數(shù)據(jù)中臺則需在CDP中進(jìn)行屬性的來源的優(yōu)先級調(diào)配,保證屬性標(biāo)簽數(shù)據(jù)質(zhì)量。
2)規(guī)則標(biāo)簽
沒有直接對應(yīng)數(shù)據(jù),需要通過規(guī)則進(jìn)行定義,規(guī)則包含屬性、行為、標(biāo)簽的交并排進(jìn)行配置產(chǎn)出,規(guī)則標(biāo)簽初期往往不會特別多,因?yàn)閷儆陟`活可配置的標(biāo)簽,事實(shí)標(biāo)簽足夠全面,基本上可以覆蓋所有規(guī)則標(biāo)簽。規(guī)則標(biāo)簽構(gòu)建類型有商業(yè)價(jià)值標(biāo)簽、用戶偏好標(biāo)簽、生命周期標(biāo)簽、營銷時(shí)機(jī)標(biāo)簽。
3)預(yù)測標(biāo)簽
參考已有事實(shí)數(shù)據(jù),來預(yù)測用戶的行為或偏好。比如用戶a的歷史購物行為與群體A相似,使用協(xié)同過濾算法,預(yù)測用戶a也會喜歡某件物品。
4)標(biāo)簽規(guī)劃流程
業(yè)務(wù)場景梳理-標(biāo)簽規(guī)劃-行為建模-口徑確認(rèn)-數(shù)據(jù)加工-標(biāo)簽驗(yàn)證-規(guī)范運(yùn)營。
5)業(yè)務(wù)場景梳理
業(yè)務(wù)場景確認(rèn):一般根據(jù)業(yè)務(wù)部門或生命周期進(jìn)行梳理,規(guī)劃業(yè)務(wù)場景,并通過業(yè)務(wù)場景進(jìn)行流程梳理,根據(jù)每個(gè)節(jié)點(diǎn)進(jìn)行標(biāo)簽規(guī)劃。
① 生命周期確定業(yè)務(wù)場景:
② 增長階段確定業(yè)務(wù)場景:
③ 業(yè)務(wù)需求確認(rèn)業(yè)務(wù)場景:
1. 標(biāo)簽規(guī)范
因格式問題無法直接展示表格,需要表格模板可留言溝通。
標(biāo)簽規(guī)劃表:
標(biāo)簽命名規(guī)范:
標(biāo)簽舉例
2. 行為模型
行為模型需要進(jìn)行行為數(shù)據(jù)源梳理,如果有第三方接入的話則直接對接第三方即可,業(yè)務(wù)內(nèi)部部分行為也需要進(jìn)行梳理,構(gòu)建統(tǒng)一的行為模型,幫助CDP進(jìn)行實(shí)時(shí)、離線的行為接入。
構(gòu)建并梳理建立用戶行為模型,先基于業(yè)務(wù)場景,構(gòu)建業(yè)務(wù)模型,通過統(tǒng)一的建模,統(tǒng)一業(yè)務(wù)口,根據(jù)數(shù)據(jù)實(shí)際情況,建立數(shù)據(jù)模型,并基于對齊的數(shù)據(jù)口徑上開發(fā)。
行為數(shù)據(jù)模型在車企行業(yè)通常包括“用戶行為主題”,“訂單主題”,“用戶權(quán)益主題”,通過多個(gè)業(yè)務(wù)主題可以比較容易的描述常見的用戶行為。
字段介紹:模型名稱:模型寬表名稱/ 行為名稱;單一行為名稱/ 模型;模型字段:可包括維度度量型字段;數(shù)據(jù)口徑:關(guān)聯(lián)哪些維度,事實(shí)表的哪些字段,進(jìn)行建模。
3. 口徑確認(rèn)
口徑確認(rèn)其實(shí)分為兩步,在原有系統(tǒng)中肯定涉及到部分標(biāo)簽,需要將之前標(biāo)簽與新標(biāo)簽進(jìn)行映射,名稱未改則不需要確認(rèn),如果有偏差或者修改或者通過標(biāo)簽調(diào)研發(fā)現(xiàn)多個(gè)業(yè)務(wù)標(biāo)簽命名或規(guī)則不一致,則需要進(jìn)行各個(gè)業(yè)務(wù)線口凈統(tǒng)一。
4. 數(shù)據(jù)加工
數(shù)據(jù)加工要考慮兩點(diǎn),其一為數(shù)據(jù)加工清晰化流程,其二則為數(shù)據(jù)加工過程中的安全性。
數(shù)據(jù)加工流程圖:數(shù)據(jù)源-數(shù)據(jù)中臺(數(shù)倉)-CDP應(yīng)用數(shù)據(jù)構(gòu)建,從ODS進(jìn)行數(shù)據(jù)清洗后,進(jìn)入到DWD層,再流入DWS層,其中DIM層可與DWD和DWS聯(lián)動應(yīng)用,在進(jìn)入DM層進(jìn)行整合,最終流入CDP進(jìn)行ADS構(gòu)建從而提供給上層進(jìn)行應(yīng)用。
數(shù)據(jù)安全:數(shù)據(jù)安全屬于在數(shù)據(jù)中臺的范圍內(nèi)要考慮的,但在標(biāo)簽規(guī)劃時(shí)涉及到比較多的敏感數(shù)據(jù),因此需要在這個(gè)階段考慮到數(shù)據(jù)安全性的問題,給相應(yīng)的數(shù)據(jù)中臺提出安全性需求,確保數(shù)據(jù)傳輸?shù)牡陌踩€(wěn)定。每個(gè)公司的安全范圍可顆粒度不同,而且數(shù)據(jù)安全是個(gè)大項(xiàng)這里不做額外拓展。
需要遵循以下原則:
5. 標(biāo)簽驗(yàn)證
數(shù)據(jù)源質(zhì)量驗(yàn)證,對ODS、DM層進(jìn)行數(shù)據(jù)質(zhì)量評估,真實(shí)性 > 60% 被認(rèn)為較為可信。
八維評估數(shù)據(jù)源各數(shù)據(jù)項(xiàng)的質(zhì)量:
- 完整性:空值檢查;
- 規(guī)范性:引證數(shù)據(jù);
- 及時(shí)性:延時(shí)時(shí)長;
- 唯一性:重復(fù)性檢查;
- 一致性:數(shù)據(jù)比對;
- 關(guān)聯(lián)性:業(yè)務(wù)檢查;
- 有效性:字段是否符合格式;
- 真實(shí)性:與實(shí)際值比較。
標(biāo)簽表計(jì)算準(zhǔn)確度:繼承DM層的各數(shù)據(jù)項(xiàng)完整性、真實(shí)性,且要求基于此數(shù)據(jù)項(xiàng)的標(biāo)簽計(jì)算準(zhǔn)確度達(dá)到99.9%.
- 與DM層進(jìn)行比較,確保數(shù)據(jù)一致。
- 邏輯錯(cuò)誤驗(yàn)證:如年齡是否超出正常駕齡范圍等。
- 取值單一性驗(yàn)證:確保一個(gè)主體在一個(gè)標(biāo)簽上只有一個(gè)值,如同一個(gè)客戶在性別標(biāo)簽上,同一時(shí)間點(diǎn)不能既有“男”取值、又有“女”取值。
- MECE原則驗(yàn)證:確保通過規(guī)則切片后,各標(biāo)簽值對應(yīng)的用戶量累加是全部用戶,不能少也不能多。
- 模型算法合理性驗(yàn)證:模型算法的設(shè)計(jì)邏輯符合業(yè)務(wù)邏輯,測試集與訓(xùn)練集樣本分配合理。
業(yè)務(wù)準(zhǔn)確度:在業(yè)務(wù)過程中驗(yàn)證,通過設(shè)計(jì)業(yè)務(wù)策略或AB測試,從業(yè)務(wù)角度評估標(biāo)簽值的準(zhǔn)確度。
- 業(yè)務(wù)反饋驗(yàn)證:銷售顧問或其他業(yè)務(wù)人員可在標(biāo)簽使用過程中給予反饋,并提交開發(fā)進(jìn)行數(shù)據(jù)源數(shù)據(jù)項(xiàng)的修正。
- 通過設(shè)計(jì)問卷調(diào)研等相關(guān)活動收集數(shù)據(jù),增加數(shù)據(jù)源可信度。
- 模型算法準(zhǔn)確率驗(yàn)證:用AUC指標(biāo)來衡量模型的準(zhǔn)確率,一般AUC>0.8是比較好的表現(xiàn)。
- 通過使用相關(guān)標(biāo)簽圈定客群做POC驗(yàn)證,設(shè)置AB測試,根據(jù)觸達(dá)客群后的轉(zhuǎn)化效果對比對照組的表現(xiàn)來評估;若顯著低于對照組,則需要排查標(biāo)簽準(zhǔn)確度。
6. 規(guī)范運(yùn)營
除了在標(biāo)簽設(shè)計(jì)需要規(guī)范化設(shè)計(jì)外,在標(biāo)簽實(shí)施過程也需要有標(biāo)準(zhǔn)化的流程進(jìn)行把控,保證標(biāo)簽有序的開發(fā)實(shí)施。
與此同時(shí)需要進(jìn)行標(biāo)簽的權(quán)限和審核流程的規(guī)劃,標(biāo)簽權(quán)限體系需要細(xì)化和內(nèi)置到系統(tǒng)中,總得來說,有兩類權(quán)限可以會直接影響到業(yè)務(wù)流程和數(shù)據(jù)安全。
業(yè)務(wù)權(quán)限:通過將權(quán)限授權(quán)給固定角色,進(jìn)而對于功能權(quán)限進(jìn)行精細(xì)化管控;以下為舉例的角色打來,根據(jù)實(shí)際企業(yè)和業(yè)務(wù)會有更細(xì)分的范圍。
數(shù)據(jù)權(quán)限:通過將標(biāo)簽可擁有,可查看的權(quán)限,授權(quán)給標(biāo)簽的創(chuàng)建和使用者。
7. 經(jīng)驗(yàn)總結(jié)
標(biāo)簽規(guī)劃:
切記大而全:標(biāo)簽隨著業(yè)務(wù)走,大而全的標(biāo)簽會使標(biāo)簽開發(fā)成本、運(yùn)營成本、運(yùn)維成本增加,標(biāo)簽設(shè)計(jì)時(shí)應(yīng)該場景化,開發(fā)采取少兒精、小步快跑的規(guī)劃思路,優(yōu)先實(shí)時(shí)數(shù)據(jù)質(zhì)量高、業(yè)務(wù)需求強(qiáng)的標(biāo)簽。
標(biāo)簽質(zhì)量:
ID打不通,會導(dǎo)致多端多平臺無法實(shí)現(xiàn)標(biāo)簽一體化,往往會出現(xiàn)業(yè)務(wù)系統(tǒng)上標(biāo)簽A,SCRM中也出現(xiàn)類似標(biāo)簽A的標(biāo)簽,導(dǎo)致標(biāo)簽定義一致但為打通,因此應(yīng)該從數(shù)據(jù)治理曾進(jìn)行oneid體系的構(gòu)建,打通全域數(shù)據(jù),并將標(biāo)簽統(tǒng)一化管理。
標(biāo)簽無法驗(yàn)證,如果前期未考慮標(biāo)簽的驗(yàn)證流程,會導(dǎo)致標(biāo)簽構(gòu)建完成后無法對標(biāo)簽進(jìn)行驗(yàn)證草草上線可能對運(yùn)營造成偏差,因此在抱歉構(gòu)建時(shí)就需要考慮標(biāo)簽數(shù)據(jù)驗(yàn)證及業(yè)務(wù)驗(yàn)證的雙重驗(yàn)證,對不同類型的標(biāo)簽進(jìn)行標(biāo)準(zhǔn)化逐層驗(yàn)證。
數(shù)據(jù)質(zhì)量太差,數(shù)據(jù)質(zhì)量差會導(dǎo)致標(biāo)簽不完善甚至無法落地使用,對于這點(diǎn)在規(guī)劃階段是要進(jìn)行數(shù)據(jù)勘察,確定哪些高優(yōu)標(biāo)簽的數(shù)據(jù)出現(xiàn)缺失,優(yōu)先對于該數(shù)據(jù)員進(jìn)行數(shù)據(jù)治理和數(shù)據(jù)補(bǔ)全,確保標(biāo)簽可實(shí)施可落地。
本文由 @光波 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
感謝作者 請教一下個(gè)體標(biāo)簽結(jié)果對外輸出 會有什么邊界和注意事項(xiàng)么?
請問一下樓主,數(shù)據(jù)中臺的數(shù)據(jù)進(jìn)入到CDP平臺后,是在CDP平臺還會二次過濾嗎,過濾出自己想要的數(shù)據(jù),并打上相應(yīng)的標(biāo)簽, 還是所有的數(shù)據(jù)處理都在數(shù)據(jù)中臺過濾處理,有什么需求,就給數(shù)據(jù)中臺的數(shù)倉提了,他們開發(fā)完了,提供給上層的CDP平臺