數(shù)據(jù)產(chǎn)品核心概念之元數(shù)據(jù)
編輯導(dǎo)語:在這個大數(shù)據(jù)時代,數(shù)據(jù)已經(jīng)公認是一項重要的資產(chǎn)。元數(shù)據(jù),是解釋數(shù)據(jù)的數(shù)據(jù),如今也越來越多的出現(xiàn)在大眾視野中。但是對于元數(shù)據(jù)的概念、元數(shù)據(jù)有什么用、元數(shù)據(jù)該如何管理,非業(yè)內(nèi)人士可能理解的不夠清晰。本文中,作者將從以上幾個方面來介紹一下關(guān)于元數(shù)據(jù)的那些知識。
之前講解數(shù)據(jù)相關(guān)的基本概念的文章,提到了元數(shù)據(jù)。這篇文章將會展開細講,主要分享我學(xué)習(xí)的過程、我的理解以及對全過程的總結(jié)。
一、為什么會接觸元數(shù)據(jù)
我所在的行業(yè),是教育信息化行業(yè)。
教育信息化1.0時代,國家提出要打造「三通兩平臺」,在國家政策引導(dǎo)下,教育局、學(xué)校采購了大量的教學(xué)、管理類軟硬件設(shè)備。
而教育信息化2.0時代,國家提出「三全兩高一大」的理念,繼續(xù)提高信息化系統(tǒng)的覆蓋率的同時,強調(diào)了提高數(shù)據(jù)治理能力,尤其重視數(shù)據(jù)方面的綜合治理和利用。
簡單來說,1.0時代解決了數(shù)據(jù)上網(wǎng)的問題,2.0時代優(yōu)化數(shù)據(jù)上網(wǎng),并重點解決怎么用好數(shù)據(jù)的問題。
基于政策背景,我司也制定了相關(guān)戰(zhàn)略,提出了打造大數(shù)據(jù)、數(shù)據(jù)治理類產(chǎn)品。而元數(shù)據(jù)管理是數(shù)據(jù)治理的基礎(chǔ),作為產(chǎn)品設(shè)計者,我就接觸到了元數(shù)據(jù)。
二、初識元數(shù)據(jù),我被概念繞暈
接觸新概念,當然先看定義。但是官方解釋,看起來像個套娃:「元數(shù)據(jù),是解釋數(shù)據(jù)的數(shù)據(jù)」。
接下來,我又接觸到了元元數(shù)據(jù)、元模型等概念:「元元數(shù)據(jù),是定義元數(shù)據(jù)結(jié)構(gòu)和語義的信息」、「由元元數(shù)據(jù)組成的模型稱之為元模型」。
當時我腦子演繹了自問自答的情景:
【問】元數(shù)據(jù)它也是一種數(shù)據(jù),那解釋元數(shù)據(jù)的數(shù)據(jù),叫做什么?
【答】叫元元數(shù)據(jù),
【問】那,是不是還有元元元數(shù)據(jù)?
【答】對!沒錯,講道理是的!
【問】那,是不是…
【答】對!沒錯!別給我沒完沒了的!打?。?/p>
看完這一圈概念,很容易聯(lián)想到”道生一, 一生二,二生三,三生萬物”,很有哲學(xué)的味道。總的來說,初接觸元數(shù)據(jù),非常抽象,有點懵。
三、元數(shù)據(jù)是什么?
借助例子理解一下:概念晦澀難懂,借助例子理解是一個不錯的方式。網(wǎng)上很多文章也列舉了不少元數(shù)據(jù)的例子,比如奶茶上飲料上的營養(yǎng)成分表。
只有結(jié)合左邊和上邊的說明,我們才能理解,每100g奶茶含能量166KJ。按照定義,「能量」、「每100g」 都是對數(shù)據(jù)166KJ的解釋說明,這二者就是166KJ的元數(shù)據(jù)。
看完這樣的例子,一下子就能對元數(shù)據(jù)有了直觀的認知。但是,我給小伙伴講完以后,小伙伴們反饋例子是一看就懂,但是換一個場景,還是有點懵,還是分不清哪里是元數(shù)據(jù),以及元數(shù)據(jù)要用來干嘛。
追根究底,是因為多數(shù)人沒有用元數(shù)據(jù)解決問題的體驗。
四、產(chǎn)品經(jīng)理常見的兩類元數(shù)
接下來,我以產(chǎn)品經(jīng)理舉例,介紹元數(shù)據(jù)的兩大運用場景。不同行業(yè),產(chǎn)品經(jīng)理所需的行業(yè)知識和技能不同,但是通常情況下,都會接觸兩類人:業(yè)務(wù)人員、研發(fā)人員。
1. 業(yè)務(wù)元數(shù)據(jù)如何理解
作為產(chǎn)品,你大概率聽過這些業(yè)務(wù)指標:PV、UV、DAU、MAU。
回想一下,初次接觸DAU這個英文縮寫的時候,你肯定也不懂,經(jīng)過百度查詢,你知道了DAU是指「每日活躍用戶數(shù)」。但是,因為業(yè)務(wù)不同,實際場景里,不同公司對于DAU「每日活躍用戶」的定義還有差異。
A公司的業(yè)務(wù)人員,將DAU定義為「每日用戶登錄次數(shù)」;B公司的業(yè)務(wù)人員,將DAU定義為「每天在平臺停留20分鐘以上用戶的數(shù)量」。
業(yè)務(wù)人員結(jié)合實際需要,對數(shù)據(jù)作了”定義”,用以溝通交流時進行“解釋”。這些定義和解釋,就是業(yè)務(wù)語義下的元數(shù)據(jù),即「業(yè)務(wù)元數(shù)據(jù)」。
2. 技術(shù)元數(shù)據(jù)如何理解
系統(tǒng)需要技術(shù)人員實現(xiàn),所有的數(shù)據(jù)都是經(jīng)過系統(tǒng)處理和存儲的。
A公司的研發(fā)人員理解了DAU的業(yè)務(wù)語義后,便要負責(zé)定義DAU在系統(tǒng)中計算、存儲的格式和約束,如下:
這段的含義是,DAU的數(shù)據(jù)類型是int。研發(fā)人員為什么要定義這個呢?
其實這樣是按照程序語言的規(guī)范,定義了一個計算機能懂的數(shù)據(jù)類型,這個信息將會經(jīng)過層層編譯,變成計算機能理解的形式。
下一次,當收到一個數(shù)據(jù)類型不為int的DAU數(shù)據(jù)時,計算機就能夠識別,進而按照研發(fā)小哥設(shè)定的邏輯進行相應(yīng)的處理,比如提示或報錯。
技術(shù)人員因為編碼需要,也對數(shù)據(jù)作了”定義”。技術(shù)語義下的元數(shù)據(jù),即「技術(shù)元數(shù)據(jù)」。
3. 元數(shù)據(jù)類型如何定義
大家會發(fā)現(xiàn),不同的標準、不同的組織對元數(shù)據(jù)有不同的分類,很多初學(xué)者經(jīng)常被搞暈:說的都不完全相同,到底有多少種元數(shù)據(jù),應(yīng)該掌握哪些元數(shù)據(jù)?
元數(shù)據(jù)的類型取決于在什么場景、面向什么人作解釋,元數(shù)據(jù)的類型,不是被事先定義出來的,而是根據(jù)使用場景進行的歸類,任何人都可以按需要定義新的元數(shù)據(jù)類型。
五、為什么要管理元數(shù)據(jù)
先看看一個極端的例子:一個程序員在網(wǎng)上聊天,有一天,別人問他,你是程序員嗎?
程序員本能反應(yīng),立刻就回了一個「true」。但是對方不懂編程,也不懂英語,一陣交涉,最終明白:原來很多程序語言里,true就等同于「是」。
奇葩說里馬東說:“被誤解是表達者的宿命”,當然被誤解絕對不是表達者的希望的結(jié)果,為了盡可能不被誤解,我們要用好元數(shù)據(jù)進行解釋。
人們要合作,要交流,要理解對方表達的意思,而元數(shù)據(jù)就是溝通和理解的橋梁。
六、元數(shù)據(jù)怎么管
知道了what,why,接下來就要弄清楚how,怎么管理元數(shù)據(jù)。
以往,做人事、貨物管理系統(tǒng),這些系統(tǒng)管理的對象都是現(xiàn)實生活中存在的,但是要做一個元數(shù)據(jù)管理系統(tǒng),元數(shù)據(jù)如此抽象,該怎么設(shè)計?
在建學(xué)生管理系統(tǒng)前,我們會定義學(xué)生實體的屬性,即”學(xué)生模型”,學(xué)生:姓名,性別,年齡…
同樣的道理,元數(shù)據(jù)也是根據(jù)實際場景定義屬性,元數(shù)據(jù)會有通用的屬性,比如名稱、類型。不同類型的元數(shù)據(jù)還會有自己特定的屬性,比如下圖中的儲蓄匯總表元數(shù)據(jù),有匯總金額和網(wǎng)點號兩個屬性。
元數(shù)據(jù)既然也是數(shù)據(jù),肯定是存儲在數(shù)據(jù)庫中的。元數(shù)據(jù)存儲庫是指存儲元數(shù)據(jù)的物理數(shù)據(jù)庫表,通常采用開放標準的關(guān)系型數(shù)據(jù)庫平臺實現(xiàn)元數(shù)據(jù)存儲庫。
至于為什么選用關(guān)系型數(shù)據(jù)庫,這里就不展開講了。
七、寫在最后
元數(shù)據(jù)早就存在了我們生活中,只是我們用「元數(shù)據(jù)」這個詞代指了這一類解釋其他事物的事物。
當你問別人,XXX是什么,是什么意思,后續(xù)別人給的回答和解釋,其實就是「無形的元數(shù)據(jù)」,當這些解釋落到紙面的時候,就成了「有形的元數(shù)據(jù)」。
學(xué)習(xí)元數(shù)據(jù)的初期,我看了很多文獻,被各種概念按在地上反復(fù)摩擦。通過不斷地理解和實踐,終于沖破了混沌,有了一定的理解。
復(fù)盤這段過程,有失有得。
我花費了很多時間研究概念,而忘了自己為什么要研究概念。其實,一直看元數(shù)據(jù)概念反而會迷失在其中,將數(shù)據(jù)平臺搭建起來,最終能把數(shù)據(jù)用起來,便能體會其中奧義。
為了鉆研概念,我搜集了非常多的資料,提升了資料搜尋能力,元數(shù)據(jù)是數(shù)據(jù)產(chǎn)品的核心概念,這也為我后續(xù)理解數(shù)據(jù)產(chǎn)品的其他概念打好了基礎(chǔ)。
實踐是檢驗真理的唯一途徑,也是探索、理解真理的唯一途徑。實在弄不懂一個概念,那就去實踐理解吧,你總會有頓悟的那一刻。
參考資料:
【1】艾中良,麥中凡,朱美正;元數(shù)據(jù)和元模型[A];2001全國軟件技術(shù)研討會[C];2001年
【2】數(shù)據(jù)治理之元數(shù)據(jù)管理實踐[OL]
【3】元數(shù)據(jù)新型存儲架構(gòu)的探索[OL]
【4】數(shù)據(jù)產(chǎn)品經(jīng)理實戰(zhàn)進階-8.3元數(shù)據(jù)管理
作者:lee;公眾號:樂說樂言
本文由 @lee 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自?Unsplash,基于 CC0 協(xié)議
咋感覺元數(shù)據(jù)就是數(shù)據(jù)表的說明捏?標明了每列數(shù)據(jù)的數(shù)據(jù)類型、意義、不同情況的處理方式等等?元元數(shù)據(jù)又在表說明上再提升了一層,用表在對已有的表進一步說明??
請問業(yè)務(wù)元數(shù)據(jù)和數(shù)據(jù)標準中的業(yè)務(wù)術(shù)語有沒有關(guān)系呢
看了這篇文章,總算是搞清楚啥是元數(shù)據(jù)了,不再糾結(jié)于晦澀的感念,真爽!
我還是沒理解元元數(shù)據(jù)和元模型的概念
沒理解的話,就不糾結(jié)啦,先搞其他的事~
寫的非常易懂!
感謝感謝~
如何理解元數(shù)據(jù)方案?
元數(shù)據(jù)管理方案?
最近也一直不太理解具體元數(shù)據(jù)是什么意思,今天看后深有啟發(fā)
歡迎交流~