【指標管理系列】指標設計與加工
編輯導語:指標建設對于企業(yè)的業(yè)務發(fā)展十分關鍵,是衡量業(yè)務效果的主要依據(jù),本篇文章作者結合自身經(jīng)驗分享了指標的設計與加工過程,詳細地講述了其基礎概念和設計加工方法,以及設計加工過程中的注意點,一起來學習一下吧,希望對你有幫助。
一、指標建設的必要性
1. 什么是指標
指標是可客觀描述某個事物某個特征的可量化的數(shù)字度量,如用戶最近30天購買次數(shù),某商品最近30天銷售額等。
指標常從多個維度來描述,如某地區(qū)的新增用戶數(shù)、線上線下的新增用戶數(shù),維度讓指標更加具象與豐滿。
2. 建設背景
大數(shù)據(jù)時代數(shù)字化轉型背景下,企業(yè)所需要的往往不單單是數(shù)據(jù),而是數(shù)據(jù)背后映射的業(yè)務洞察,相比較數(shù)據(jù)我們更加關心的是其體現(xiàn)的業(yè)務價值以及覆蓋的業(yè)務場景。
龐大的數(shù)據(jù)只有和業(yè)務相結合轉化為信息,經(jīng)過處理呈現(xiàn)才能真正體現(xiàn)他們的價值。
指標作為數(shù)據(jù)計算的結果,是直接反映衡量業(yè)務效果的依據(jù),應用在企業(yè)的方方面面,如數(shù)據(jù)報表、分析平臺及日常取數(shù)等。
1)數(shù)據(jù)報表
它最直接的指標結果查看的載體,作為業(yè)務部門的人,可能每月或者每周甚至每天都要輸出業(yè)務報表,不管是傳統(tǒng)的紙質文檔,線上的excel還是后來的報表工具,最終目的都是一樣,我們希望通過報表實現(xiàn)數(shù)據(jù)驅動業(yè)務精益增長的目的。
2)分析平臺
作為數(shù)據(jù)計算結果多樣化展示的平臺,不管是可視化大屏、還是其他一些BI系統(tǒng),都通過數(shù)據(jù)計算結果的呈現(xiàn)更好地輔助業(yè)務了解行業(yè)現(xiàn)狀。
3)日常取數(shù)
有數(shù)據(jù)在哪里,便要去哪里拿,取數(shù)的過程,往往是基于不同的業(yè)務場景,滿足不同的業(yè)務需求,對數(shù)據(jù)進行加工計算獲取,當然在這過程中,數(shù)據(jù)計算結果往往需要保證較高的準確性和一致性。
3. 建設過程中遇到的問題
數(shù)據(jù)指標作為數(shù)據(jù)計算的結果,是企業(yè)數(shù)據(jù)價值的直觀體現(xiàn),在業(yè)務擴張、指標計算需求的暴增背景下,隨之而來的指標管理問題也越來越多:
- 指標管理不統(tǒng)一:管理機制不統(tǒng)一、分散管理、重復建設、成本高、費時費力;
- 指標口徑不一致:同名不同義、同義不同名、計算邏輯復雜多變、開發(fā)技術門檻高,過程不可視;
- 指標流程不規(guī)范:沒有統(tǒng)一的流程控制,開發(fā)和使用人員分離,溝通成本高、周期長,結果可信度不高。
4. 解決方案
要解決以上問題,幫助企業(yè)建立指標體系,我們需要從以下三個方面入手:
1)指標平臺
建立統(tǒng)一的指標管理平臺,集中管理數(shù)據(jù)指標,沉淀指標資產(chǎn)
2)指標體系
有一套標準規(guī)范的指標搭建方法論,搭建企業(yè)級數(shù)據(jù)指標體系
3)流程管理
搭載統(tǒng)一的流程控制機制,全面把控數(shù)據(jù)指標的生命周期
如果是平臺、流程是基礎,那指標內(nèi)容的搭建便是關鍵。指標體系的搭建作為整個指標管理的核心,為指標管理提供最堅實的基礎支撐。
二、指標建設五步法
總結以下五個步驟,從0到1搭建指標體系:
1. 明確目標
搭建指標體系的第一步就是明確搭建目標,大部分企業(yè)由于目標不清晰造成指標管理混亂,通過指標體系的搭建,我們要實現(xiàn)“一個指標、一個口徑、一次加工、多次使用”,做到統(tǒng)一指標口徑,減少重復工作,結果統(tǒng)一輸出。
1)統(tǒng)一關鍵指標
創(chuàng)建公司級統(tǒng)一的關鍵指標,幫助企業(yè)通過統(tǒng)一的指標框架來助力業(yè)務業(yè)務擴張。
2)減少重復工作
為每一個成員提供統(tǒng)一的平臺來協(xié)同,了解企業(yè)整體數(shù)據(jù)業(yè)務情況,減少數(shù)據(jù)團隊重復性工作和時間花費
3)結果統(tǒng)一輸出
針對指標結果,提供一套能將指標和上層應用結合起來的輸出方式,發(fā)揮數(shù)據(jù)指標最大的價值
2. 需求分析
明確目標之后,我們開始著手去構建指標體系,在設計指標之前,我們首先要進行需求分析。
同一個企業(yè),不同的業(yè)務線、不同的部門,甚至是同一部門的不同人員,提出來的指標計算需求都會有所不同。所以在需求分析的階段,我們要做到基于不同行業(yè)的業(yè)務情況,分析數(shù)據(jù)指標需求,合理劃分主題,更好地為后續(xù)指標設計提供業(yè)務支撐。
1)需求調(diào)研
(1)主導人
數(shù)據(jù)分析師,數(shù)倉架構師;
(2)調(diào)研方式
列好提綱,面對面訪談;
(3)調(diào)研內(nèi)容
- 指標應用場景調(diào)研:指標應用在哪些業(yè)務場景中,應用方式有哪些(BI使用、業(yè)務人員自行取數(shù)、數(shù)據(jù)門戶展現(xiàn)等)
- 指標來源調(diào)研:指標加工的源數(shù)據(jù)來源于哪些系統(tǒng),數(shù)據(jù)是否都采集上來,分為哪些業(yè)務域、業(yè)務過程。
- 指標現(xiàn)有情況調(diào)研:現(xiàn)在有哪些指標,缺少多少,能滿足百分之多少的業(yè)務場景。指標建設現(xiàn)在遇到的問題是什么。之前的指標加工是否規(guī)范,是否需要調(diào)整。
- 指標需求調(diào)研:了解客戶需要完成的指標加工范圍。
(4)產(chǎn)出
訪談匯總結果與需求收集表。
2)需求分析
(1)目標
梳理需要加工的指標,指標業(yè)務口徑,指標更新頻率;
(2)主導人
數(shù)據(jù)分析師;
(3)產(chǎn)出
指標需求表;
數(shù)據(jù)分析師基于業(yè)務部門、科技部門的業(yè)務場景和需求,挖掘和提煉具體的指標、業(yè)務定義、優(yōu)先級、實現(xiàn)難易程度、大概的實現(xiàn)方式。
并根據(jù)指標數(shù)量、難易程度、數(shù)據(jù)依賴關系,劃分初步的階段性計劃,一期完成哪些指標、給哪些業(yè)務場景用,二期完成哪些指標,給哪些業(yè)務場景用。
3. 指標設計
1)指標拆解
(1)主導人
數(shù)據(jù)分析師;
根據(jù)上述的業(yè)務需求分析,按照從上往下的方式對指標進行分級拆解,看需要的指標需要由哪些指標加工出來,各個指標的關系,,明確各指標之間的關系,可層層溯源,一般分為3層:
- 一級指標:公司戰(zhàn)略層面的指標,全公司認可的衡量公司業(yè)務目標的核心指標,如某大業(yè)務線產(chǎn)品收入、累計用戶數(shù)、新增用戶數(shù)、付費用戶數(shù)等,面向管理層。
- 二級指標:業(yè)務策略層面的指標,如產(chǎn)品收入拆解到各個產(chǎn)品線,累計用戶數(shù)拆解到各個渠道,面向不同業(yè)務線。
- 三級指標:業(yè)務執(zhí)行層面的指標,對二級指標進行路徑拆解,如產(chǎn)品收入需要拆解到付費用戶數(shù)、客單價上面。付費用戶數(shù)又可以拆解為新增付費用戶數(shù)、復購用戶數(shù),根據(jù)這些指標可以不斷優(yōu)化運營或銷售策略,面向業(yè)務部門。
2)指標建模
(1)主導人
數(shù)倉架構師;
根據(jù)對業(yè)務需求的理解、數(shù)據(jù)情況的探查,劃分對應的業(yè)務域、業(yè)務過程、維度、度量、統(tǒng)計周期等,搭建指標建設的框架。
(2)數(shù)據(jù)來源
數(shù)據(jù)指標遵循ODS-DWD-DWS-ADS的數(shù)倉設計架構,主要基于DWS輕度匯總表來加工;
數(shù)據(jù)架構師根據(jù)指標需求,看企業(yè)數(shù)倉設計的完善性,是否需要增加底層的明細表或匯總表,將基礎表梳理加工好之后,開始指標的加工。
(3)指標定義
我們先了解下指標的的組成:
指標= 統(tǒng)計周期+維度+過濾條件+度量
- 維度:描述性數(shù)據(jù),指標統(tǒng)計的環(huán)境,如地區(qū)、個人賬戶、產(chǎn)品名稱、產(chǎn)品類型、銷售渠道;
- 度量:數(shù)字性數(shù)據(jù),銷售金額、貸款金額、銷售數(shù)量、如賬戶余額、國債余額、基金余額;
- 統(tǒng)計周期:計算指標的時間范圍,如近30天、當年、當月、近7天、上月、上周、去年;
- 過濾條件:計算指標的條件限制,如正常狀態(tài)、有效狀態(tài)、全國范圍內(nèi),西湖區(qū)的、工作日的。
統(tǒng)計周期、維度、度量是組成的必要條件,過濾條件根據(jù)業(yè)務場景而定。
(4)維度與度量
在指標加工前,需要先定義數(shù)據(jù)模型,數(shù)據(jù)模型中定義“維度”與“度量”,因為這兩個是組成模型的基礎必要條件。
數(shù)據(jù)模型按照數(shù)倉的業(yè)務主題來創(chuàng)建,如存款業(yè)務、貸款業(yè)務,可遵循星型模型或雪花模型,建立事實表與維表的關聯(lián)關系,其可以是多張表的關聯(lián)關系,也可以是單張表。表確定好之后,選擇“維度”與“度量”,作為后續(xù)指標加工的基礎。
我們以一個銀行“存款業(yè)務模型”的模型來看,其是圍繞賬戶存款余額明細數(shù)據(jù)建立的存款業(yè)務主題數(shù)據(jù)模型。
數(shù)據(jù)模型建好之后,選取維度與度量,作為后續(xù)指標加工的基礎。
4.1 維度
選取數(shù)據(jù)模型中,作為環(huán)境描述的字段作為統(tǒng)計的維度。
4.2 度量
選取數(shù)據(jù)模型中,后續(xù)要加計算的數(shù)值型字段作為度量。
(5)統(tǒng)計周期
統(tǒng)計周期也是指標必不可少的條件,描述一個指標應該指定其時間周期,比如累計交易次數(shù)、最近30天交易次數(shù)、最近90天交易次數(shù)等。一般系統(tǒng)會內(nèi)置常用的統(tǒng)計周期,也會支持用戶自定義統(tǒng)計周期,統(tǒng)計周期需要特別注意的便是日期格式了,比如yyyyMMdd,還是yyyy-MM-dd。
根據(jù)以上內(nèi)容,已準備好數(shù)據(jù)模型,和指標的三要素:維度、度量、統(tǒng)計周期。
3)指標分類
袋鼠云指標管理產(chǎn)品按照指標加工類型,分為原子指標、派生指標、復合指標、SQL指標。
- 原子指標:某一業(yè)務行為事件的度量,統(tǒng)計數(shù)據(jù)來源,如交易筆數(shù)、交易金額、交易用戶數(shù)、賬戶余額。
- 派生指標:基于原子指標進行維度、統(tǒng)計周期的派生。派生指標=統(tǒng)計周期+派生維度+過濾條件+原子指標,如近7天賬戶消費金額,去年賬戶余額總和、昨天產(chǎn)品銷售金額等。
- 復合指標:多個指標的加減乘除運算,如平均交易額、資產(chǎn)負債率等。
- SQL指標:通過自定義SQL生成的指標,適應復雜的指標配置邏輯,滿足開發(fā)人員不同的指標開發(fā)場景。
4)指標內(nèi)容
(1)主導人
數(shù)據(jù)分析師、數(shù)倉架構師;
基于指標需求、指標建模、指標分類確定指標的具體內(nèi)容,作為指標開發(fā)的指導。
- 指標名稱:指標中文名稱;
- 指標編碼:指標英文名稱,也是存表的字段;
- 指標目錄:指標所屬類目的分類;
- 指標分類:屬于原子、派生、復合、SQL指標的哪種;
- 業(yè)務口徑:指標的業(yè)務口徑,如最近30天付費用戶數(shù)指最近30天發(fā)生過一筆及以上購買交易的用戶數(shù)量之和;
- 技術口徑:由哪個指標、哪些維度加工而來;
- 指標責任人:該指標的負責人,可作為該指標的維護人與告警接收人;
- 更新頻率:日更新、周更新、月更新等;
- 描述信息:對指標的額外描述信息。
5)指標評審
(1)主導人
數(shù)據(jù)分析師、數(shù)倉架構師;
指標模型設計完成、指標內(nèi)容設計完成后,數(shù)據(jù)分析師與數(shù)倉架構師召開指標評審會議,面向數(shù)據(jù)開發(fā)、業(yè)務人員進行評審。
- 說明每個指標的定義、業(yè)務口徑、技術口徑、更新周期等
- 說明各個數(shù)據(jù)指標的類型,以及派生指標由數(shù)倉的哪些數(shù)據(jù)模型加工,其派生維度是什么,統(tǒng)計周期是什么。復合指標的派生維度,由哪些指標加工而成。
評審后進行補充完善,之后進入指標開發(fā)階段。
4. 指標開發(fā)
1)指標加工
我們來看下各類指標如何加工。
(1)原子指標
原子指標來源于數(shù)據(jù)模型,是從上述“數(shù)據(jù)模型”中直接讀到的度量,是數(shù)據(jù)模型表中的一個字段,如上述的“存款業(yè)務模型”中,可以把“存款利率”、“存款匯率”、“賬戶余額”、“固定余額”、“分成比例”等度量作原子指標。
選好度量后,同時需要選取描述該度量的維度,這些維度用于描述度量。如將“賬戶編號”、“機構編號”、“客戶經(jīng)理編號”、“客戶編號”、“賬戶狀態(tài)”等作為維度,則可以表示各個賬戶的存款賬戶余額、各個客戶的存款賬戶余額、各個分行/支行的存款賬戶余額,各個客戶經(jīng)理管理賬戶的存款賬戶余額等。
所以原子指標是數(shù)據(jù)模型中維度和度量的組合映射,非一個有真實含義的指標,因為它表示的“客戶”的“賬戶余額”,還沒有加上統(tǒng)計周期與計算邏輯,比如客戶當日賬戶余額、客戶最近一年平均賬戶余額等。但原子指標是后續(xù)派生、復合指標加工的基礎,不可缺少。
(2)派生指標
派生指標是基于原子指標進行維度與統(tǒng)計周期的派生,并設置計算邏輯。
如“當日存款賬戶余額”,可基于原子指標“賬戶余額”來進行派生,維度選取“賬戶編號”、“機構編號”、“客戶經(jīng)理編號”、“客戶編號”,計算邏輯選取“求和”,統(tǒng)計周期選取“當日”,表示各個賬戶的當日存款賬戶余額、各個客戶的當日存款賬戶余額、各個分行/支行的當日存款賬戶余額,各個客戶經(jīng)理管理賬戶的當日存款賬戶余額等。
派生指標中內(nèi)置的計算邏輯有:求和、均值、計數(shù)、去重計數(shù)、最大值、最小值等,也可以自定義函數(shù)。
內(nèi)置的統(tǒng)計周期有:當日、當月、當年、去年、最近7天、最近30天、歷史截止當前,也支持自定義。
(3)復合指標
復合指標是基于原子指標或派生指標進行的加減乘除運算。
如“當日基金賬戶利潤”復合指標,可基于復合指標“當日基金賬戶利潤率”、派生指標“當日基金賬戶余額”加工而來。
在“當日基金賬戶利潤率”>1時,
當日基金賬戶利潤=當日基金賬戶利潤率 * 當日基金賬戶余額
在“當日基金賬戶利潤率”=1時,
當日基金賬戶利潤=(當日基金賬戶利潤率+ 0.05)* 當日基金賬戶余額
復合指標的維度,需為加工公式中用到指標的公共維度,可以計算這些維度的該復合指標。如“當日基金賬戶利潤率”指標的維度有“機構編號”,“當日基金賬戶余額”指標的維度有“賬戶編號”、“客戶編號”、“機構編號”、“客戶經(jīng)理編號”,則基于這2個指標加工的復合指標“當日基金賬戶利率”只能有其公共維度“機構編號”,可查看各個機構的當日基金賬戶利率。
高級設置:公式中用的來源指標可設置指標數(shù)據(jù)的過濾條件,加工后的復合指標可取聚合函數(shù),根據(jù)實際情況使用即可。
以上便是復合指標的加工。
(4)SQL指標
當存在以上通過內(nèi)置函數(shù)、內(nèi)置運算符加工不出來的邏輯較為復雜的指標時,可采用自定義SQL指標實現(xiàn)。只要遵循正確的語法結構,便可以靈活加工。
指標加工完后,后續(xù)可在指標血緣關系中查看指標間的上下游關系。
2)指標落庫
指標邏輯配置成功后,每個指標可配置其更新周期,調(diào)度策略配置完成后,進行指標發(fā)布。發(fā)布后便按照設定周期周期性加工。同時,也支持手動立即更新。
指標更新后,會將每個指標和其維度存儲在Hive表中,每個指標和其維度存儲一張單獨的表。
3)指標運維
指標上線后,運維同學便需要進行指標的日常運維,觀察指標運行情況,及時處理報錯情況,保證指標的正常加工和線上業(yè)務可用。
5. 指標應用
指標常應用在數(shù)據(jù)門戶、BI數(shù)據(jù)分析、可視化大屏展示,業(yè)務人員數(shù)據(jù)分析中。那產(chǎn)生的指標怎么與上層應用對接呢?
1)指標API
通過API服務將指標平臺加工好的指標,提供給上層的展示、分析系統(tǒng)。
在創(chuàng)建API時定義需要查詢出去的指標,多個指標的公共維度作為該API的入?yún)?。通過API接口,查詢對接的指標結果。
外部系統(tǒng)調(diào)用API的url,用API-TOKEN認證便可以進行數(shù)據(jù)的查詢。
2)自助取數(shù)
在自助取數(shù)平臺中,可直接查詢指標平臺定義好的維度、指標,業(yè)務人員靈活拖拉拽,實現(xiàn)在線取數(shù)。并且取數(shù)邏輯可沉淀成固定的報表模板,報表可周期性自動生成數(shù)據(jù),業(yè)務人員屆時拿結果數(shù)據(jù)即可。
本文由 @木研 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉載。
題圖來自 Unsplash,基于 CC0 協(xié)議。
講得真好
那比如衍生指標bi是怎么調(diào)用的呢,是一個sql邏輯么 bi調(diào)用的時候即時查詢嗎
如果原子指標是度量的話,那用戶數(shù)是什么指標?conut(user_id)
也是原子指標
這個平臺沒有知乎更得快啊,知乎都看完了這里才發(fā),哈哈哈哈哈
因為這個平臺審核的慢,哈哈。知乎半天審核完,這里需要一天多。
大佬想加你個聯(lián)系方式