思考:數(shù)據(jù)分析與數(shù)據(jù)后臺(tái)設(shè)計(jì)
編輯導(dǎo)語(yǔ):數(shù)據(jù)分析是推進(jìn)業(yè)務(wù)項(xiàng)目正常進(jìn)行的必要步驟之一,其中,包含了監(jiān)控、觀察、分析等步驟。那么在這些步驟中,有哪些方面是需要注意的?相應(yīng)的,數(shù)據(jù)后臺(tái)設(shè)計(jì)又應(yīng)該如何操作?本篇文章里,作者就數(shù)據(jù)分析與數(shù)據(jù)后臺(tái)設(shè)計(jì)思路做了梳理和闡述,一起來(lái)看一下。
許多年以后,面對(duì)諸多的數(shù)字時(shí),我一定會(huì)想起老師教我假設(shè)檢驗(yàn)的那個(gè)遙遠(yuǎn)的夏天。
模仿《百年孤獨(dú)》回憶了一下大學(xué)學(xué)習(xí)試驗(yàn)統(tǒng)計(jì)設(shè)計(jì)課程,彼時(shí)的我對(duì)于統(tǒng)計(jì)學(xué)、試驗(yàn)設(shè)計(jì)等枯燥的課程滿不在意,草草學(xué)習(xí)混完學(xué)分,以致于在本科畢業(yè)做畢業(yè)設(shè)計(jì)時(shí)又不得不惡補(bǔ)做實(shí)驗(yàn)、監(jiān)控?cái)?shù)據(jù)、觀察分析,分析數(shù)據(jù)的知識(shí),撰寫(xiě)完論文感嘆總算脫離了苦海。
但是人生總是有很多“宿命”一般的輪回,當(dāng)我畢業(yè)以后以為脫離了苦海,不用再和枯燥的數(shù)字和統(tǒng)計(jì)學(xué)打交道,然而工作后的數(shù)字依然是我離不開(kāi)的東西。當(dāng)開(kāi)發(fā)人員每每質(zhì)疑我,讓我拿出數(shù)據(jù)以及分析結(jié)論來(lái)證明我的觀點(diǎn)以及需求可靠性時(shí),我就和《百年孤獨(dú)》里的奧雷利亞諾上校一樣陷入回憶懷疑過(guò)去的選擇。
記得做畢業(yè)設(shè)計(jì)實(shí)驗(yàn)時(shí),每次緊緊地盯著實(shí)驗(yàn)數(shù)據(jù),生怕數(shù)據(jù)波動(dòng)實(shí)驗(yàn)出現(xiàn)異常。實(shí)驗(yàn)結(jié)束后整理收集好的數(shù)據(jù),每過(guò)一段時(shí)間就要對(duì)著一長(zhǎng)串跨日的數(shù)據(jù)想有沒(méi)有問(wèn)題,最后靠著人工整理成的Excel“數(shù)據(jù)后臺(tái)”再進(jìn)行深入分析整理,我至今都還記得使用假設(shè)檢驗(yàn)流程,其中用正交試驗(yàn)方法論證了結(jié)論的顯著性。勉強(qiáng)完成了一篇看似科學(xué)的論文,就這么糊涂的畢業(yè)了。
而幾年后工作受挫的某一天,想起曾經(jīng)也這么“專業(yè)”地做過(guò)數(shù)據(jù)分析,為什么現(xiàn)在反倒面對(duì)數(shù)據(jù)只能望數(shù)生嘆了。
于是我想著通過(guò)我寫(xiě)畢業(yè)論文的這個(gè)小故事,分享一些關(guān)于數(shù)據(jù)分析以及設(shè)計(jì)數(shù)據(jù)后臺(tái)的思路,不談具體的方法,從思考方向上分享一些經(jīng)驗(yàn),幫助諸君找到解決問(wèn)題的思路與方向帶來(lái)啟發(fā)。
首先談?wù)剶?shù)據(jù)分析的方向。
我將數(shù)據(jù)分析按照?qǐng)?zhí)行順序分為監(jiān)控、觀察以及分析三個(gè)部分,可以理解為監(jiān)控?cái)?shù)據(jù)是觀察數(shù)據(jù)的基礎(chǔ),觀察數(shù)據(jù)是分析數(shù)據(jù)的來(lái)源,分析數(shù)據(jù)是一次數(shù)據(jù)分析行為的結(jié)果。那么就讓我們從監(jiān)控?cái)?shù)據(jù)開(kāi)始。
一、監(jiān)控
平時(shí)我們經(jīng)常說(shuō)看數(shù)據(jù),其實(shí)看數(shù)據(jù)就是監(jiān)控?cái)?shù)據(jù)了。監(jiān)控?cái)?shù)據(jù)還沒(méi)有到觀察或者分析數(shù)據(jù)過(guò)程,監(jiān)控的目的在于發(fā)現(xiàn)當(dāng)前的實(shí)驗(yàn)或者產(chǎn)品發(fā)展是否存在問(wèn)題或者觀察效果。監(jiān)控?cái)?shù)據(jù)最大的意義在于及時(shí)發(fā)現(xiàn)問(wèn)題以及及時(shí)調(diào)整,避免問(wèn)題的產(chǎn)生。
之所以說(shuō)監(jiān)控是數(shù)據(jù)分析最初的過(guò)程,是因?yàn)閿?shù)據(jù)分析的目的在于解決問(wèn)題,而當(dāng)前并沒(méi)有明確的問(wèn)題目標(biāo)需要解決的時(shí)候,監(jiān)控便是最經(jīng)常進(jìn)行的一個(gè)數(shù)據(jù)管理環(huán)節(jié),此時(shí)監(jiān)控更加偏重于解決隱患。
以上的概念比較枯燥與抽象,不妨看看以下兩個(gè)例子來(lái)感受一下監(jiān)控的意義。
游戲是目前我們經(jīng)常接觸的產(chǎn)品了,作為游戲的開(kāi)發(fā)者而言,監(jiān)控同時(shí)在線人數(shù),可以幫助開(kāi)發(fā)者及時(shí)了解游戲的運(yùn)行情況以及評(píng)估當(dāng)前服務(wù)器等資源的壓力情況。
監(jiān)控同時(shí)在線人數(shù),需要細(xì)粒度的時(shí)間,快速響應(yīng)的數(shù)據(jù)計(jì)算以便幫助分析者高效且直觀地了解游戲同時(shí)在線玩家的人數(shù),并做好應(yīng)對(duì)措施。
SLB(負(fù)載均衡)是網(wǎng)絡(luò)服務(wù)中常見(jiàn)的功能,對(duì)于運(yùn)維或者服務(wù)端開(kāi)發(fā)工程師而言,監(jiān)控SLB是保證自身服務(wù)正常的必須步驟。
與上一例中游戲同時(shí)在線人數(shù)監(jiān)控一樣,SLB的監(jiān)控需要極細(xì)的時(shí)間力度,且非??焖俚臄?shù)據(jù)計(jì)算,以便運(yùn)維及服務(wù)端工程師及時(shí)的了解當(dāng)前情況,避免服務(wù)產(chǎn)生異常。
監(jiān)控?cái)?shù)據(jù)是整個(gè)數(shù)據(jù)分析環(huán)節(jié)的基礎(chǔ),所有的想法均來(lái)源于每一次監(jiān)控獲取的信息。對(duì)于監(jiān)控?cái)?shù)據(jù),需要達(dá)到以下幾個(gè)要求方能保證監(jiān)控的質(zhì)量與效率:
- 數(shù)據(jù)計(jì)算要高時(shí)效性;
- 數(shù)據(jù)時(shí)間粒度??;
- 數(shù)據(jù)指標(biāo)精簡(jiǎn),核心;
- 以可視化圖表體現(xiàn)。
前兩點(diǎn)在舉例過(guò)程中已有說(shuō)明,細(xì)粒度的時(shí)間與快速的計(jì)算相應(yīng)可以及時(shí)及客觀的響應(yīng)。由于監(jiān)控是一個(gè)高頻的行為,我們不可能針對(duì)實(shí)驗(yàn)或者產(chǎn)品運(yùn)行中的每個(gè)關(guān)注指標(biāo)都進(jìn)行監(jiān)控,所以監(jiān)控?cái)?shù)據(jù)時(shí),根據(jù)目的必須挑選最為核心、重要的指標(biāo)監(jiān)控。
為了保證監(jiān)控的效率,像我畢業(yè)設(shè)計(jì)時(shí)一樣依靠人工記錄數(shù)據(jù)的方式十分低效,因?yàn)閱渭兊臄?shù)字很難直觀地反應(yīng)出數(shù)據(jù)的變化,因此好的可視化圖表可以非常有效地幫助分析者發(fā)現(xiàn)問(wèn)題或者評(píng)估效果。
監(jiān)控?cái)?shù)據(jù)作為數(shù)據(jù)分析的基礎(chǔ),是一個(gè)看起來(lái)技術(shù)含量不高但頻繁的行為,這個(gè)看似枯燥的行為需要對(duì)目標(biāo)、數(shù)據(jù)極其敏感與了解,方能真正地發(fā)現(xiàn)問(wèn)題以及客觀的評(píng)估效果。
監(jiān)控的關(guān)鍵在于讓我們知道,存在問(wèn)題嗎?
二、觀察
接著聊聊觀察數(shù)據(jù)。
監(jiān)控?cái)?shù)據(jù)更多在于發(fā)現(xiàn)問(wèn)題與評(píng)估效果,由于監(jiān)控?cái)?shù)據(jù)更多聚焦于某一天的某個(gè)時(shí)段,時(shí)間周期很短,在大多數(shù)實(shí)驗(yàn)以及產(chǎn)品運(yùn)行過(guò)程中,監(jiān)控的數(shù)據(jù)偏少且時(shí)間短,無(wú)法作為有效且合理的參考,此時(shí)我們需要更多的數(shù)據(jù)指標(biāo)、更長(zhǎng)周期的數(shù)據(jù)來(lái)對(duì)比、評(píng)估,這個(gè)觀察數(shù)據(jù)的行為建立在監(jiān)控的基礎(chǔ)上。
我們當(dāng)然可以不監(jiān)控直接觀察數(shù)據(jù),監(jiān)控的確并不是觀察的充分條件。但是少了監(jiān)控,我們會(huì)缺少更加實(shí)時(shí)、及時(shí)以及詳細(xì)的數(shù)據(jù)參考來(lái)支持判斷。因?yàn)橛^察數(shù)據(jù)的目的與作用在于通過(guò)多指標(biāo)、長(zhǎng)時(shí)間的數(shù)據(jù)對(duì)比、觀察數(shù)據(jù)起伏等變化來(lái)定位發(fā)現(xiàn)問(wèn)題或是分析是否存在問(wèn)題、是否按照預(yù)期發(fā)展,相對(duì)于監(jiān)控的數(shù)據(jù)更加宏觀的觀察數(shù)據(jù)更加消耗精力,但監(jiān)控依然是一個(gè)非常重要的行為。
以我親身經(jīng)歷的一個(gè)小故事為例子。
曾經(jīng)我所負(fù)責(zé)的游戲連續(xù)兩天用戶數(shù)都差不多,但是兩天的用戶時(shí)長(zhǎng)卻有顯著差別。由于這兩天并沒(méi)有關(guān)注實(shí)際情況,在過(guò)了將近十天后回顧分析時(shí)一時(shí)無(wú)法得出有效的觀點(diǎn)。
當(dāng)時(shí)的我與同伴排除了產(chǎn)品出現(xiàn)異常、產(chǎn)品兩天內(nèi)有更新導(dǎo)致功能不同等會(huì)造成兩天存在顯著變化的情況。當(dāng)時(shí)負(fù)責(zé)監(jiān)控用戶增長(zhǎng)的同伴提供了一個(gè)線索,在后一天中由于游戲政策問(wèn)題會(huì)有部分用戶出現(xiàn)實(shí)名認(rèn)證的過(guò)程,導(dǎo)致玩家進(jìn)入游戲后被實(shí)名認(rèn)證窗口卡在初始無(wú)法進(jìn)入游戲。
隨后我們查詢了這兩天的同時(shí)在線人數(shù)曲線,發(fā)現(xiàn)第二天曲線比前一天要明顯低很多,而且從實(shí)名認(rèn)證開(kāi)始就出現(xiàn)了顯著的下滑。因此我們得出了以下幾個(gè)觀點(diǎn)。
雖然用戶進(jìn)入了游戲,但是有部分用戶未實(shí)名認(rèn)證,導(dǎo)致他們無(wú)法進(jìn)行游戲,有部分人因?yàn)楦鞣N原因未及時(shí)實(shí)名認(rèn)證選擇了退出游戲,因此造成了同時(shí)在線人數(shù)的下滑。
兩天統(tǒng)計(jì)到的用戶數(shù)量差別不大,是因?yàn)橛脩舳歼M(jìn)入了游戲,但是后一天的部分用戶因?yàn)閷?shí)名認(rèn)證的原因很快就退出了游戲,造成這一天用戶的平均時(shí)長(zhǎng)下滑。
這是一個(gè)簡(jiǎn)單的例子,其實(shí)當(dāng)時(shí)的我們完全可以憑借因?yàn)閷?shí)名認(rèn)證導(dǎo)致用戶無(wú)法登錄進(jìn)而造成用戶退出無(wú)法游戲來(lái)解釋時(shí)長(zhǎng)的下滑,但是這個(gè)觀點(diǎn)本身就需要一些數(shù)據(jù)來(lái)支持。
此時(shí)我們監(jiān)控同時(shí)在線人數(shù)就能為這個(gè)觀點(diǎn)提供一定的支持。所以觀察數(shù)據(jù)是建立在監(jiān)控?cái)?shù)據(jù)的基礎(chǔ)之上。從觀察數(shù)據(jù)的過(guò)程中,我們得出了一些觀點(diǎn)從而找到執(zhí)行策略的思路以及依據(jù)就是這個(gè)過(guò)程最大的意義。
觀察數(shù)據(jù)需要較長(zhǎng)時(shí)間的數(shù)據(jù)、較多的數(shù)據(jù)指標(biāo)進(jìn)行綜合對(duì)比、評(píng)估方能針對(duì)一個(gè)問(wèn)題得出合理的觀點(diǎn)。
指標(biāo)數(shù)值的變化之所以能反應(yīng)問(wèn)題,是因?yàn)檫@個(gè)指標(biāo)是目標(biāo)問(wèn)題具有顯著性影響的因素。很多的問(wèn)題分析時(shí),是需要確認(rèn)多個(gè)因素的影響能力方能得出問(wèn)題結(jié)論,所以觀察數(shù)據(jù)時(shí)對(duì)于數(shù)據(jù)的要求也更高,觀察時(shí)數(shù)據(jù)當(dāng)滿足以下幾個(gè)要求時(shí)可為觀察過(guò)程提供足夠的支持:
- 數(shù)據(jù)粒度以日為主,時(shí)間區(qū)間長(zhǎng);
- 數(shù)據(jù)指標(biāo)多維度、多角度;
- 數(shù)據(jù)主要以表格體現(xiàn),圖片為輔。?
日粒度以及更大粒度的數(shù)據(jù)是為了觀察時(shí)有更豐富的數(shù)據(jù)便于對(duì)比,比如互聯(lián)網(wǎng)產(chǎn)品中日留存、周留存與月留存能反應(yīng)產(chǎn)品在不同時(shí)間維度下的留存能力。
數(shù)據(jù)指標(biāo)多維度多角度更多體現(xiàn)在需要足夠數(shù)量的核心指標(biāo)幫助觀察數(shù)據(jù)時(shí)進(jìn)行對(duì)比。由于前兩點(diǎn)的要求,此時(shí)可視化的圖相比監(jiān)控?cái)?shù)據(jù)過(guò)程重要性降低,此時(shí)數(shù)據(jù)表格可以更加便利的展示數(shù)據(jù),當(dāng)然表格+圖是更好的選擇。
同樣舉兩個(gè)例子。
上圖是友盟機(jī)型分析的示例圖,其中提供了新增用戶與啟動(dòng)次數(shù)兩個(gè)核心指標(biāo),用以分析不同機(jī)型的新用戶在游戲中的表現(xiàn),進(jìn)而分析不同機(jī)型用戶的質(zhì)量。這是一類以聚焦日粒度為主亦可跨日分析的多指標(biāo)數(shù)據(jù)。
上圖是友盟整體趨勢(shì)的示例圖,其中提供了多個(gè)體現(xiàn)用戶數(shù)量、留存率、時(shí)長(zhǎng)、啟動(dòng)次數(shù)等與用戶行為直接相關(guān)的指標(biāo)幫助分析者觀察數(shù)據(jù)。
與上一個(gè)例子不同點(diǎn)在于,雖然都是多指標(biāo)觀察,但是這個(gè)例子是聚焦于跨時(shí)間對(duì)比分析的數(shù)據(jù),因?yàn)榛钴S、新增用戶數(shù)作為一個(gè)數(shù)值容易受推廣、活動(dòng)、節(jié)假日等因素直接影響,此時(shí)不同日期的數(shù)值對(duì)比意義并不大,這時(shí)候加上留存、時(shí)長(zhǎng)等綜合型的指標(biāo),通過(guò)不同時(shí)間的綜合對(duì)比觀察,就可以更加便捷且客觀地得出觀點(diǎn)。
以上兩個(gè)例子分別代表了聚焦于某天內(nèi)多個(gè)影響因素以及聚焦于長(zhǎng)時(shí)間多個(gè)影響因素的觀察行為,對(duì)于不同的觀察數(shù)據(jù)行為,在數(shù)據(jù)的呈現(xiàn)以及表現(xiàn)上也有不同。
觀察的關(guān)鍵則在于讓我知道,問(wèn)題是什么。
三、分析
最后到了分析數(shù)據(jù)環(huán)節(jié)。
我并沒(méi)有講分析數(shù)據(jù)的方法或者工具的打算,本文的目的依然是分享一些我的數(shù)據(jù)分析思路以及根據(jù)思路而衍生的數(shù)據(jù)后臺(tái)設(shè)計(jì)經(jīng)驗(yàn),通過(guò)思路可以幫助大家思考找到解決問(wèn)題的方向與啟發(fā)。所以在分析數(shù)據(jù)這個(gè)環(huán)節(jié)依然談的還是從監(jiān)控到觀察最后到分析這個(gè)過(guò)程的一些看法。
當(dāng)我們觀察數(shù)據(jù)以后,此時(shí)腦海中已經(jīng)收獲了不少的信息,將這些信息進(jìn)行整合根據(jù)目標(biāo)進(jìn)行思考的過(guò)程我稱之為分析。
分析的目的與意義在于發(fā)現(xiàn)問(wèn)題或者是驗(yàn)證結(jié)論,這是兩件事。如果目標(biāo)是發(fā)現(xiàn)問(wèn)題,那么從眾多的數(shù)據(jù)指標(biāo)中、從多維度多角度的數(shù)據(jù)中發(fā)現(xiàn)問(wèn)題,是一個(gè)主動(dòng)且存在未知性的行為。而如果目標(biāo)是驗(yàn)證結(jié)論,那么問(wèn)題是清晰的,我們需要的是從數(shù)據(jù)中找到證據(jù),這是一個(gè)相對(duì)被動(dòng)且已知的行為。
當(dāng)問(wèn)題已知的情況下,不論是找到問(wèn)題的影響因素還是已知影響因素來(lái)確認(rèn)對(duì)問(wèn)題的影響,都已經(jīng)有了非常明確的目標(biāo),此時(shí)分析數(shù)據(jù)的意義就是找到支撐問(wèn)題解決方法的依據(jù)或是解決方法的思路。
因?yàn)榉治鰯?shù)據(jù)的目標(biāo)在于找到解決方法,所以分析數(shù)據(jù)時(shí)對(duì)于數(shù)據(jù)的要求比觀察數(shù)據(jù)更高,根據(jù)分析數(shù)據(jù)的行為,要求更為直接:
- 足夠的數(shù)據(jù)指標(biāo)作為基礎(chǔ)用于分析;
- 足量的數(shù)據(jù)(時(shí)間粒度、時(shí)間長(zhǎng)度)作為依據(jù);
- 使用一定的科學(xué)方法得出合理結(jié)論。
足夠的指標(biāo)以及足量的數(shù)據(jù)是為了保證在使用分析方法時(shí)有足夠的內(nèi)容得出客觀的結(jié)論,否則在缺少支持的情況得出的結(jié)論依然值得質(zhì)疑。
分析這個(gè)環(huán)節(jié)考驗(yàn)的是分析者對(duì)于數(shù)據(jù)的掌握程度、對(duì)于問(wèn)題的明確程度以及對(duì)于分析方法的了解程度。很多時(shí)候不必過(guò)于偏重于方法的賬號(hào),對(duì)于日常中的很多問(wèn)題,對(duì)問(wèn)題的理解到位加上對(duì)于數(shù)據(jù)的高度理解加上簡(jiǎn)單的方法也可以得出有效的結(jié)論。
分析方法建立在對(duì)于統(tǒng)計(jì)學(xué)、概率統(tǒng)計(jì)等數(shù)據(jù)科學(xué)的基礎(chǔ)上,不在結(jié)合問(wèn)題與目標(biāo)的基礎(chǔ)上盲目追求掌握方法,并不會(huì)對(duì)數(shù)據(jù)分析有太好的幫助。缺乏監(jiān)控和觀察的過(guò)程,直接拿到數(shù)據(jù)也未必能有合理的判斷,因?yàn)槿鄙匍L(zhǎng)時(shí)間觀察監(jiān)控?cái)?shù)據(jù)造成對(duì)數(shù)據(jù)的理解,很容易被先入為主的想法影響從發(fā)現(xiàn)問(wèn)題變成驗(yàn)證先入為主的想法。分析的過(guò)程已經(jīng)脫離了數(shù)據(jù)后臺(tái),此時(shí)需要靠扎實(shí)的態(tài)度與數(shù)據(jù)科學(xué)知識(shí)幫助自己。
結(jié)合分析這部分,我僅以我個(gè)人的經(jīng)驗(yàn)總結(jié)了幾條數(shù)據(jù)分析與數(shù)據(jù)后臺(tái)的想法:
- 通過(guò)多種監(jiān)控來(lái)觀察數(shù)據(jù),通過(guò)觀察數(shù)據(jù)得出分析思路,通過(guò)分析得出結(jié)論;
- 看數(shù)據(jù)的不同行為,提升效率的方式不同,需要后臺(tái)提供不同的功能來(lái)滿足;
- 后臺(tái)更多的是為監(jiān)控和觀察提高效率,分析依賴于數(shù)據(jù)分析者本身的主觀行為、能力。
最后還想分享的是,多學(xué)、多討論,數(shù)據(jù)分析這件事通過(guò)討論交流得來(lái)的知識(shí)與信息,往往比掌握一個(gè)看似高端而不常用的分析方法來(lái)的實(shí)在。
分析的關(guān)鍵在于讓我知道,該做什么。
第二大部分談?wù)剶?shù)據(jù)后臺(tái)的設(shè)計(jì)思路。
在了解了數(shù)據(jù)分析的過(guò)程以及各過(guò)程的目標(biāo)、關(guān)鍵至后,針對(duì)不同過(guò)程,數(shù)據(jù)后臺(tái)在功能的支持上也有針對(duì)性與特殊性。
在監(jiān)控?cái)?shù)據(jù)與觀察數(shù)據(jù)過(guò)程中,后臺(tái)可以通過(guò)圖、表格高效的展示數(shù)據(jù),幫助分析者在看數(shù)據(jù)時(shí)思考獲取信息,而分析數(shù)據(jù)則需要分析者脫離后臺(tái)的限制根據(jù)目標(biāo)問(wèn)題進(jìn)行分析,此時(shí)便已經(jīng)脫離后臺(tái)了??梢哉f(shuō)數(shù)據(jù)后臺(tái)奠定了分析數(shù)據(jù)的基石,因?yàn)樗兴伎挤治龆紒?lái)源于數(shù)據(jù)后臺(tái)的每一個(gè)指標(biāo)、每一張圖以及每一個(gè)表格,分析過(guò)程依賴于分析者而非后臺(tái)。
如今的數(shù)據(jù)類產(chǎn)品已經(jīng)發(fā)展成為監(jiān)控觀察以后臺(tái)為主,分析思考以工具為主的模式。數(shù)據(jù)后臺(tái)提供的是原材料,而像PowerBI、FineBI以及tableau這樣的商業(yè)智能工具成為了分析數(shù)據(jù)的利器。數(shù)據(jù)后臺(tái)更多在于滿足監(jiān)控與觀察,而對(duì)于分析過(guò)程而言便捷的提供數(shù)據(jù)獲取功能即可,之后的事情則需要交給具有強(qiáng)大分析功能的各類工具。
那么還是從監(jiān)控?cái)?shù)據(jù)開(kāi)始。
在前文舉例說(shuō)明監(jiān)控?cái)?shù)據(jù)的要求時(shí),游戲的同時(shí)在線人數(shù)與阿里云SLB監(jiān)控兩個(gè)例子突出了可視化圖、細(xì)時(shí)間粒度的特點(diǎn),但這只是針對(duì)了范圍很小的一些數(shù)據(jù)指標(biāo)。
以一個(gè)電商類產(chǎn)品為例,我需要實(shí)時(shí)了解交易金額、交易筆數(shù)、同時(shí)在線人數(shù)等指標(biāo)時(shí),就需要一個(gè)更為綜合的監(jiān)控界面幫助分析者快速了解情況,此時(shí)在后臺(tái)的設(shè)計(jì)上則不能簡(jiǎn)單的根據(jù)需求用可視化圖的方式羅列指標(biāo)展示,因?yàn)椴煌笜?biāo)在監(jiān)控對(duì)比時(shí)時(shí)間粒度上不一樣。比如同時(shí)在線人數(shù)可以精細(xì)到分鐘粒度,而交易金額則可以到小時(shí)粒度。
根據(jù)例子中這種情況,在后臺(tái)的設(shè)計(jì)上,監(jiān)控環(huán)節(jié)需要根據(jù)需求針對(duì)性的設(shè)計(jì),這里推薦的設(shè)計(jì)思路是使用個(gè)性化可定制的監(jiān)控面板。
監(jiān)控面板可以由后臺(tái)開(kāi)發(fā)者事先設(shè)計(jì)好可提供的指標(biāo)、圖表由分析者進(jìn)行選擇組合成自己需要的樣子,可以理解為當(dāng)一個(gè)Excle中放了非常多的數(shù)據(jù),你可以自己排版各種數(shù)據(jù)與圖表,然后在一個(gè)sheet中看自己關(guān)注的內(nèi)容。
這里以友盟的分析看板為例。
這類看板的特點(diǎn)是可以先定義好所需的各類指標(biāo)以及圖表,然后由分析者自己進(jìn)行組合,即可滿足分析個(gè)性化的監(jiān)控需求,同時(shí)還可以將不同時(shí)間粒度、不同類型指標(biāo)根據(jù)各自特點(diǎn)設(shè)計(jì)成不同的圖或者表,從而滿足不同角色的監(jiān)控?cái)?shù)據(jù)需求。
監(jiān)控類后臺(tái)的特點(diǎn)在于盡量將需要關(guān)注的內(nèi)容放在一個(gè)菜單頁(yè)面中,便于分析者快速獲取信息,不需要切換至不同的菜單。圖加表格的組合,可以充分發(fā)揮各自特點(diǎn),對(duì)于數(shù)值趨勢(shì)的變化通過(guò)趨勢(shì)圖或者柱狀圖體現(xiàn),輔以直接展示數(shù)值的表格,更加直觀的了解數(shù)據(jù)。
接下去的觀察數(shù)據(jù)環(huán)節(jié)在后臺(tái)設(shè)計(jì)的思路上則有許多需要關(guān)注的重點(diǎn)。
1)圖為主和圖表結(jié)合的后臺(tái)頁(yè)面設(shè)計(jì)思路
首先看幾個(gè)來(lái)自Talkingdata以及GameAnalytics的示例,兩個(gè)后臺(tái)均選擇了游戲版Demo。
首先對(duì)于游戲而言,開(kāi)發(fā)者、運(yùn)營(yíng)者首要關(guān)注的重點(diǎn)均為用戶、收入,具體的指標(biāo)即為用戶數(shù)量、留存、時(shí)長(zhǎng)、收入、ARPU、ARPPU等指標(biāo)。這都是典型的多指標(biāo)組合的觀察需求。
由于游戲類產(chǎn)品需要觀察的數(shù)據(jù)眾多,所以需要進(jìn)行分類,一般來(lái)說(shuō)會(huì)區(qū)分用戶類,包含但不限于活躍用戶數(shù)、新增用戶數(shù)、啟動(dòng)次數(shù)、用戶時(shí)長(zhǎng)、用戶留存等指標(biāo),而收入類指標(biāo)則包含但不限于內(nèi)購(gòu)收入、付費(fèi)人數(shù)、付費(fèi)次數(shù)、ARPU(每用戶人均付費(fèi)金額)、ARPPU(每付費(fèi)用戶人均付費(fèi)金額)、首付用戶數(shù)等指標(biāo),因?yàn)橹笜?biāo)分類清晰且內(nèi)容眾多,所以將其分類成不同的菜單有利于根據(jù)目標(biāo)問(wèn)題針對(duì)性的分析。
這種菜單的分類的原則就是各個(gè)指標(biāo)之間的關(guān)聯(lián)性。在示例的三個(gè)后臺(tái)中,均采用了圖為主的展示方式,在talkingdata后臺(tái)中則還有切換圖和表的模式,但是優(yōu)先展示的依然是圖。
這種后臺(tái)設(shè)計(jì)思路的原因在于觀察數(shù)據(jù)時(shí),每個(gè)指標(biāo)都分別配上可視化的圖可以更直接的表現(xiàn)數(shù)據(jù)的變化起伏、對(duì)比多和少。每個(gè)指標(biāo)都有獨(dú)立的圖展示,非常有效的為觀察數(shù)據(jù)提供了直觀的數(shù)據(jù)展示,這個(gè)比起表格有著非常直接的效率優(yōu)勢(shì)。
多圖的組合可以快速的收獲各個(gè)指標(biāo)的信息,以talkingdata示例圖為例,不論是跨日的趨勢(shì)分析、還是同日內(nèi)的各年齡層收入分析,都可以快速地看到趨勢(shì)、多少,不同類型指標(biāo)通過(guò)不同圖的組合,很容易突出各自關(guān)注的重點(diǎn)。收入使用趨勢(shì)圖,可以了解到近期收入的穩(wěn)定性,而各年齡層收入則是集中在一天,可以快速了解對(duì)比不同年齡的付費(fèi)能力,這都是圖的優(yōu)勢(shì)。
以圖為主的設(shè)計(jì)思路優(yōu)勢(shì)非常容易感受到,但是缺陷也非常明顯,當(dāng)分析者需要多指標(biāo)綜合對(duì)比觀察時(shí),這個(gè)設(shè)計(jì)思路下分散的指標(biāo)則難以將數(shù)據(jù)聚合起來(lái),此時(shí)觀察數(shù)據(jù)時(shí)就較為麻煩。這種情況下圖加表組合的后臺(tái)頁(yè)面思路便十分有效的解決了這個(gè)問(wèn)題。
針對(duì)這個(gè)設(shè)計(jì)思路,請(qǐng)看來(lái)自友盟與天幕的示例圖。
同樣與前一個(gè)例子一樣,兩個(gè)后臺(tái)數(shù)據(jù)針對(duì)指標(biāo)進(jìn)行了分類而分成了不同菜單,每個(gè)菜單中又是多個(gè)指標(biāo)排列的情況。
友盟與天幕的后臺(tái)都采用了上圖下表的設(shè)計(jì)思路,上圖的思路與前文以圖為主的設(shè)計(jì)思路類似,都是通過(guò)可視化圖直觀、高效展示數(shù)據(jù)的特點(diǎn)直接的為分析者提供數(shù)據(jù)。
前文也談到圖的缺點(diǎn)在于無(wú)法同時(shí)展示多個(gè)指標(biāo)在一個(gè)圖中,每張圖能獲取的指標(biāo)有限且多指標(biāo)同時(shí)放在一個(gè)頁(yè)面里圖太多且不好整合,此時(shí)友盟與天幕的示例中下方羅列了多個(gè)指標(biāo)的表格則有效地解決了這個(gè)問(wèn)題。
上面的圖可以切換展示下方不同的指標(biāo),且可根據(jù)指標(biāo)的特點(diǎn)設(shè)計(jì)為突出分析思路的趨勢(shì)圖、柱狀圖或是其他可視化圖,下方則可以將這個(gè)菜單中需要分析的指標(biāo)排列開(kāi),便于分析者更加全面的綜合對(duì)比分析。
為什么會(huì)有這兩種常見(jiàn)的設(shè)計(jì)?似乎二者用起來(lái)并沒(méi)有很大的區(qū)別。
從用戶界面的設(shè)計(jì)角度來(lái)說(shuō),以圖為主的思路更容易吸引眼球,圖加表的模式相對(duì)枯燥。從使用者體驗(yàn)來(lái)說(shuō),區(qū)別則很大。以圖為主的模式,將各個(gè)指標(biāo)用圖的方式展示,并分散開(kāi),和監(jiān)控?cái)?shù)據(jù)非常類似。每個(gè)指標(biāo)通過(guò)圖都可以快速的獲取到超過(guò)數(shù)值帶來(lái)的多或者少的信息。
以前文GameAnalytics示例圖為例,收入分析中通過(guò)圖不僅快速了解了當(dāng)前收入、付費(fèi)人數(shù)次數(shù)、ARPU等數(shù)值,還看到了這幾個(gè)指標(biāo)的發(fā)展趨勢(shì),用圖快速的提供了每個(gè)指標(biāo)數(shù)值加變化兩種信息。下圖天幕示例圖同樣展示了類似的收入指標(biāo),但是采用的是上圖下表的組合。
這里的圖只展示了一個(gè)指標(biāo),分析者需要通過(guò)表格方能快速獲取各個(gè)指標(biāo)數(shù)值信息。
這種設(shè)計(jì)思路下的對(duì)于分析者的思考而言,更多提供的是相比分散的圖更加綜合的多指標(biāo)對(duì)比信息。分析者可以快速地從表格選擇眾多指標(biāo),與不同時(shí)間的同指標(biāo)進(jìn)行對(duì)比,而分析某個(gè)指標(biāo)之時(shí)可以切換上方的圖來(lái)分析具體指標(biāo)。從單個(gè)指標(biāo)的分析效率上來(lái)說(shuō)弱于以圖為主的方式,但是想要更加全面的分析時(shí),表格的優(yōu)勢(shì)就非常明顯了。
二者最大的區(qū)別在于獲取數(shù)據(jù)信息時(shí),關(guān)注點(diǎn)集中于某個(gè)指標(biāo)的程度多還是少,一次想要獲取的指標(biāo)數(shù)量多與少,綜合對(duì)比的程度強(qiáng)與弱。
區(qū)別可以說(shuō)清楚,但是真正在設(shè)計(jì)做選擇時(shí),并沒(méi)有明確的邊界用以選擇。
對(duì)于以上區(qū)別,在實(shí)際設(shè)計(jì)中還是要根據(jù)使用者的習(xí)慣以及產(chǎn)品本身來(lái)選擇。比如說(shuō)像阿里云一樣的運(yùn)維工程師常用的數(shù)據(jù)后臺(tái),監(jiān)控需求是遠(yuǎn)大于觀察與分析數(shù)據(jù)需求的,此時(shí)除了監(jiān)控?cái)?shù)據(jù)的界面設(shè)計(jì)需要圖,日常觀察的一些數(shù)據(jù)也可以多以圖為主,在日常觀察過(guò)程中便于從變化中發(fā)現(xiàn)隱患。
像游戲或是常見(jiàn)的資訊、工具類軟件的數(shù)據(jù)后臺(tái),通常會(huì)是不同類型的指標(biāo)羅列綜合分析,此時(shí)輪流把每個(gè)指標(biāo)的圖看過(guò)去,反倒不如通過(guò)表格來(lái)展示。
觀察數(shù)據(jù)與監(jiān)控?cái)?shù)據(jù)最大的不同在于數(shù)據(jù)內(nèi)容更多,數(shù)據(jù)指標(biāo)數(shù)量更多,日常分析時(shí)對(duì)于數(shù)據(jù)內(nèi)容需求的多和少即是判斷后臺(tái)頁(yè)面設(shè)計(jì)的基礎(chǔ)準(zhǔn)備,多則以圖加表為主,少則以圖為主。
判斷標(biāo)準(zhǔn)不唯一,關(guān)鍵還是在于設(shè)計(jì)者需要充分考慮分析者對(duì)于數(shù)據(jù)信息量的獲取需求進(jìn)行判斷。
2)數(shù)據(jù)和表格
日常在表格中展示的數(shù)據(jù)一般有兩種,一種是以時(shí)間維度展示,另一種則是以某個(gè)分析對(duì)象為目標(biāo)展示,具體看一看以下的例子。
阿里云支出的示例圖中展示的是某個(gè)月各項(xiàng)服務(wù)的支出,talkingdata渠道分析展示的是某時(shí)間段內(nèi)各個(gè)渠道的新增用戶、收入、留存等指標(biāo)。在分析的目標(biāo)重要性優(yōu)于時(shí)間時(shí),此時(shí)數(shù)據(jù)的分析角度優(yōu)先時(shí)當(dāng)前的目標(biāo)其次才是時(shí)間。
就阿里云支出例子而言,此時(shí)關(guān)注當(dāng)月各項(xiàng)服務(wù)的支出,是優(yōu)于各項(xiàng)服務(wù)在各月的支出;talkingdata的這個(gè)例子中,關(guān)注渠道用戶質(zhì)量?jī)?yōu)于各個(gè)渠道每天的用戶數(shù)據(jù)。
這個(gè)以表格為主的設(shè)計(jì),是為了滿足非常具體的分析需求而產(chǎn)生的。在上一部分中談到了圖加表的設(shè)計(jì)思路,這時(shí)提供了非常綜合的數(shù)據(jù)信息,多出現(xiàn)在以時(shí)間優(yōu)先的數(shù)據(jù)中。而當(dāng)時(shí)間不再是第一關(guān)注重點(diǎn)時(shí),此時(shí)直接體現(xiàn)數(shù)據(jù)方面,圖則是輔助,表格成為了重點(diǎn)。
像上面兩個(gè)例子一樣,這種情況非常具體,出現(xiàn)在觀察數(shù)據(jù)的重點(diǎn)在于某個(gè)具體的問(wèn)題,表格中不再是聚焦時(shí)間加指標(biāo)的列表,而是關(guān)注分析目標(biāo)加指標(biāo)的列表,此時(shí)多以表格的方式直接展示數(shù)據(jù),就算有可視化的圖,也不再是常見(jiàn)的趨勢(shì)圖或者柱狀圖,而是餅狀圖或者直方圖,用來(lái)展示當(dāng)前分析目標(biāo)中各個(gè)因素的組成以及組成數(shù)值的多少,這樣偏重分析結(jié)果的圖反倒不重要。
這里體現(xiàn)了兩種不同的數(shù)據(jù)分析思路,前一點(diǎn)中談到的后臺(tái)設(shè)計(jì)思路多以基于時(shí)間維度來(lái)分析,而這一點(diǎn)中則是反過(guò)來(lái),基于具體的分析目標(biāo)之后才是時(shí)間維度,所以最后在數(shù)據(jù)的呈現(xiàn)上前者是時(shí)間序列的表格,后者時(shí)間成為了數(shù)據(jù)的一個(gè)屬性,表格是目標(biāo)的組成因素。
兩種分析思路決定了后臺(tái)不同的設(shè)計(jì)。反過(guò)來(lái)后臺(tái)不同的設(shè)計(jì)對(duì)于使用的分析者而言帶來(lái)的功能效果也不一樣,前者突出通過(guò)時(shí)間來(lái)對(duì)比分析,后者弱化時(shí)間,突出對(duì)比同一個(gè)目標(biāo)下的不同因素。
3)分析
分析數(shù)據(jù)的環(huán)節(jié)是數(shù)據(jù)分析整個(gè)過(guò)程中最重要的過(guò)程,這個(gè)過(guò)程脫離了后臺(tái)帶給分析者的內(nèi)容,依賴于分析者自身的思考。從后臺(tái)設(shè)計(jì)的來(lái)說(shuō),除了前文談到的思路之后,針對(duì)分析這個(gè)環(huán)節(jié)只需要考慮做好數(shù)據(jù)導(dǎo)出功能,可滿足分析者方便的自行組合整理數(shù)據(jù)即可。
洋洋灑灑數(shù)千字下來(lái),最后做幾句總結(jié)。
- 分析應(yīng)該脫離于后臺(tái)的束縛,以問(wèn)題為核心進(jìn)行思考;
- 如果是用數(shù)據(jù)驗(yàn)證猜想,在使用數(shù)據(jù)分析方法的同時(shí)注意數(shù)據(jù)足夠多、指標(biāo)足夠豐富;
- 如果是通過(guò)數(shù)據(jù)發(fā)現(xiàn)問(wèn)題,在對(duì)比、觀察的同時(shí)注意無(wú)特殊情況下的異常起伏;
- 如果是使用數(shù)據(jù)得出一些結(jié)論,小心先入為主的限制,盡量從數(shù)據(jù)的變化中總結(jié)行為,根據(jù)行為闡述結(jié)論,盡可能減少主觀的影響。
以上是筆者自己數(shù)據(jù)分析的一些經(jīng)驗(yàn)之談,比較抽象,但是筆者希望的是更帶給更多人啟發(fā)而不是問(wèn)題的答案。如果筆者的經(jīng)驗(yàn)之談能真的為你帶來(lái)有用的啟發(fā),不勝榮幸;如果這通篇毫無(wú)實(shí)操性可言,多是通識(shí)性的內(nèi)容讓你無(wú)所收獲,那么請(qǐng)你莫吝惜言語(yǔ),給予二三建議,筆者不勝感激。
本文由 @問(wèn)夢(mèng)孤獨(dú) 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自 Unsplash,基于 CC0 協(xié)議
謝謝,學(xué)習(xí)!
馬克