數(shù)據(jù)產(chǎn)品核心概念之元數(shù)據(jù)

11 評論 11634 瀏覽 61 收藏 12 分鐘

編輯導(dǎo)語:在這個大數(shù)據(jù)時代,數(shù)據(jù)已經(jīng)公認是一項重要的資產(chǎn)。元數(shù)據(jù),是解釋數(shù)據(jù)的數(shù)據(jù),如今也越來越多的出現(xiàn)在大眾視野中。但是對于元數(shù)據(jù)的概念、元數(shù)據(jù)有什么用、元數(shù)據(jù)該如何管理,非業(yè)內(nèi)人士可能理解的不夠清晰。本文中,作者將從以上幾個方面來介紹一下關(guān)于元數(shù)據(jù)的那些知識。

之前講解數(shù)據(jù)相關(guān)的基本概念的文章,提到了元數(shù)據(jù)。這篇文章將會展開細講,主要分享我學(xué)習(xí)的過程、我的理解以及對全過程的總結(jié)。

一、為什么會接觸元數(shù)據(jù)

我所在的行業(yè),是教育信息化行業(yè)。

教育信息化1.0時代,國家提出要打造「三通兩平臺」,在國家政策引導(dǎo)下,教育局、學(xué)校采購了大量的教學(xué)、管理類軟硬件設(shè)備。

而教育信息化2.0時代,國家提出「三全兩高一大」的理念,繼續(xù)提高信息化系統(tǒng)的覆蓋率的同時,強調(diào)了提高數(shù)據(jù)治理能力,尤其重視數(shù)據(jù)方面的綜合治理和利用。

簡單來說,1.0時代解決了數(shù)據(jù)上網(wǎng)的問題,2.0時代優(yōu)化數(shù)據(jù)上網(wǎng),并重點解決怎么用好數(shù)據(jù)的問題。

基于政策背景,我司也制定了相關(guān)戰(zhàn)略,提出了打造大數(shù)據(jù)、數(shù)據(jù)治理類產(chǎn)品。而元數(shù)據(jù)管理是數(shù)據(jù)治理的基礎(chǔ),作為產(chǎn)品設(shè)計者,我就接觸到了元數(shù)據(jù)。

二、初識元數(shù)據(jù),我被概念繞暈

接觸新概念,當然先看定義。但是官方解釋,看起來像個套娃:「元數(shù)據(jù),是解釋數(shù)據(jù)的數(shù)據(jù)」。

接下來,我又接觸到了元元數(shù)據(jù)、元模型等概念:「元元數(shù)據(jù),是定義元數(shù)據(jù)結(jié)構(gòu)和語義的信息」、「由元元數(shù)據(jù)組成的模型稱之為元模型」。

當時我腦子演繹了自問自答的情景:

【問】元數(shù)據(jù)它也是一種數(shù)據(jù),那解釋元數(shù)據(jù)的數(shù)據(jù),叫做什么?

【答】叫元元數(shù)據(jù),

【問】那,是不是還有元元元數(shù)據(jù)?

【答】對!沒錯,講道理是的!

【問】那,是不是…

【答】對!沒錯!別給我沒完沒了的!打?。?/p>

看完這一圈概念,很容易聯(lián)想到”道生一, 一生二,二生三,三生萬物”,很有哲學(xué)的味道。總的來說,初接觸元數(shù)據(jù),非常抽象,有點懵。

三、元數(shù)據(jù)是什么?

借助例子理解一下:概念晦澀難懂,借助例子理解是一個不錯的方式。網(wǎng)上很多文章也列舉了不少元數(shù)據(jù)的例子,比如奶茶上飲料上的營養(yǎng)成分表。

數(shù)據(jù)產(chǎn)品核心概念之元數(shù)據(jù)

只有結(jié)合左邊和上邊的說明,我們才能理解,每100g奶茶含能量166KJ。按照定義,「能量」、「每100g」 都是對數(shù)據(jù)166KJ的解釋說明,這二者就是166KJ的元數(shù)據(jù)。

看完這樣的例子,一下子就能對元數(shù)據(jù)有了直觀的認知。但是,我給小伙伴講完以后,小伙伴們反饋例子是一看就懂,但是換一個場景,還是有點懵,還是分不清哪里是元數(shù)據(jù),以及元數(shù)據(jù)要用來干嘛。

追根究底,是因為多數(shù)人沒有用元數(shù)據(jù)解決問題的體驗。

四、產(chǎn)品經(jīng)理常見的兩類元數(shù)

接下來,我以產(chǎn)品經(jīng)理舉例,介紹元數(shù)據(jù)的兩大運用場景。不同行業(yè),產(chǎn)品經(jīng)理所需的行業(yè)知識和技能不同,但是通常情況下,都會接觸兩類人:業(yè)務(wù)人員、研發(fā)人員。

1. 業(yè)務(wù)元數(shù)據(jù)如何理解

作為產(chǎn)品,你大概率聽過這些業(yè)務(wù)指標:PV、UV、DAU、MAU。

回想一下,初次接觸DAU這個英文縮寫的時候,你肯定也不懂,經(jīng)過百度查詢,你知道了DAU是指「每日活躍用戶數(shù)」。但是,因為業(yè)務(wù)不同,實際場景里,不同公司對于DAU「每日活躍用戶」的定義還有差異。

A公司的業(yè)務(wù)人員,將DAU定義為「每日用戶登錄次數(shù)」;B公司的業(yè)務(wù)人員,將DAU定義為「每天在平臺停留20分鐘以上用戶的數(shù)量」。

數(shù)據(jù)產(chǎn)品核心概念之元數(shù)據(jù)

業(yè)務(wù)人員結(jié)合實際需要,對數(shù)據(jù)作了”定義”,用以溝通交流時進行“解釋”。這些定義和解釋,就是業(yè)務(wù)語義下的元數(shù)據(jù),即「業(yè)務(wù)元數(shù)據(jù)」。

2. 技術(shù)元數(shù)據(jù)如何理解

系統(tǒng)需要技術(shù)人員實現(xiàn),所有的數(shù)據(jù)都是經(jīng)過系統(tǒng)處理和存儲的。

A公司的研發(fā)人員理解了DAU的業(yè)務(wù)語義后,便要負責(zé)定義DAU在系統(tǒng)中計算、存儲的格式和約束,如下:

數(shù)據(jù)產(chǎn)品核心概念之元數(shù)據(jù)

這段的含義是,DAU的數(shù)據(jù)類型是int。研發(fā)人員為什么要定義這個呢?

其實這樣是按照程序語言的規(guī)范,定義了一個計算機能懂的數(shù)據(jù)類型,這個信息將會經(jīng)過層層編譯,變成計算機能理解的形式。

下一次,當收到一個數(shù)據(jù)類型不為int的DAU數(shù)據(jù)時,計算機就能夠識別,進而按照研發(fā)小哥設(shè)定的邏輯進行相應(yīng)的處理,比如提示或報錯。

技術(shù)人員因為編碼需要,也對數(shù)據(jù)作了”定義”。技術(shù)語義下的元數(shù)據(jù),即「技術(shù)元數(shù)據(jù)」。

3. 元數(shù)據(jù)類型如何定義

大家會發(fā)現(xiàn),不同的標準、不同的組織對元數(shù)據(jù)有不同的分類,很多初學(xué)者經(jīng)常被搞暈:說的都不完全相同,到底有多少種元數(shù)據(jù),應(yīng)該掌握哪些元數(shù)據(jù)?

元數(shù)據(jù)的類型取決于在什么場景、面向什么人作解釋,元數(shù)據(jù)的類型,不是被事先定義出來的,而是根據(jù)使用場景進行的歸類,任何人都可以按需要定義新的元數(shù)據(jù)類型。

五、為什么要管理元數(shù)據(jù)

先看看一個極端的例子:一個程序員在網(wǎng)上聊天,有一天,別人問他,你是程序員嗎?

程序員本能反應(yīng),立刻就回了一個「true」。但是對方不懂編程,也不懂英語,一陣交涉,最終明白:原來很多程序語言里,true就等同于「是」。

奇葩說里馬東說:“被誤解是表達者的宿命”,當然被誤解絕對不是表達者的希望的結(jié)果,為了盡可能不被誤解,我們要用好元數(shù)據(jù)進行解釋。

人們要合作,要交流,要理解對方表達的意思,而元數(shù)據(jù)就是溝通和理解的橋梁。

六、元數(shù)據(jù)怎么管

知道了what,why,接下來就要弄清楚how,怎么管理元數(shù)據(jù)。

以往,做人事、貨物管理系統(tǒng),這些系統(tǒng)管理的對象都是現(xiàn)實生活中存在的,但是要做一個元數(shù)據(jù)管理系統(tǒng),元數(shù)據(jù)如此抽象,該怎么設(shè)計?

在建學(xué)生管理系統(tǒng)前,我們會定義學(xué)生實體的屬性,即”學(xué)生模型”,學(xué)生:姓名,性別,年齡…

數(shù)據(jù)產(chǎn)品核心概念之元數(shù)據(jù)

同樣的道理,元數(shù)據(jù)也是根據(jù)實際場景定義屬性,元數(shù)據(jù)會有通用的屬性,比如名稱、類型。不同類型的元數(shù)據(jù)還會有自己特定的屬性,比如下圖中的儲蓄匯總表元數(shù)據(jù),有匯總金額和網(wǎng)點號兩個屬性。

數(shù)據(jù)產(chǎn)品核心概念之元數(shù)據(jù)

元數(shù)據(jù)既然也是數(shù)據(jù),肯定是存儲在數(shù)據(jù)庫中的。元數(shù)據(jù)存儲庫是指存儲元數(shù)據(jù)的物理數(shù)據(jù)庫表,通常采用開放標準的關(guān)系型數(shù)據(jù)庫平臺實現(xiàn)元數(shù)據(jù)存儲庫。

至于為什么選用關(guān)系型數(shù)據(jù)庫,這里就不展開講了。

七、寫在最后

元數(shù)據(jù)早就存在了我們生活中,只是我們用「元數(shù)據(jù)」這個詞代指了這一類解釋其他事物的事物。

當你問別人,XXX是什么,是什么意思,后續(xù)別人給的回答和解釋,其實就是「無形的元數(shù)據(jù)」,當這些解釋落到紙面的時候,就成了「有形的元數(shù)據(jù)」。

學(xué)習(xí)元數(shù)據(jù)的初期,我看了很多文獻,被各種概念按在地上反復(fù)摩擦。通過不斷地理解和實踐,終于沖破了混沌,有了一定的理解。

復(fù)盤這段過程,有失有得。

我花費了很多時間研究概念,而忘了自己為什么要研究概念。其實,一直看元數(shù)據(jù)概念反而會迷失在其中,將數(shù)據(jù)平臺搭建起來,最終能把數(shù)據(jù)用起來,便能體會其中奧義。

為了鉆研概念,我搜集了非常多的資料,提升了資料搜尋能力,元數(shù)據(jù)是數(shù)據(jù)產(chǎn)品的核心概念,這也為我后續(xù)理解數(shù)據(jù)產(chǎn)品的其他概念打好了基礎(chǔ)。

實踐是檢驗真理的唯一途徑,也是探索、理解真理的唯一途徑。實在弄不懂一個概念,那就去實踐理解吧,你總會有頓悟的那一刻。

參考資料:

【1】艾中良,麥中凡,朱美正;元數(shù)據(jù)和元模型[A];2001全國軟件技術(shù)研討會[C];2001年

【2】數(shù)據(jù)治理之元數(shù)據(jù)管理實踐[OL]

【3】元數(shù)據(jù)新型存儲架構(gòu)的探索[OL]

【4】數(shù)據(jù)產(chǎn)品經(jīng)理實戰(zhàn)進階-8.3元數(shù)據(jù)管理

【5】被誤解是表達者的宿命[OL] 2018-11-07?

 

作者:lee;公眾號:樂說樂言

本文由 @lee 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自?Unsplash,基于 CC0 協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 咋感覺元數(shù)據(jù)就是數(shù)據(jù)表的說明捏?標明了每列數(shù)據(jù)的數(shù)據(jù)類型、意義、不同情況的處理方式等等?元元數(shù)據(jù)又在表說明上再提升了一層,用表在對已有的表進一步說明??

    來自海南 回復(fù)
  2. 請問業(yè)務(wù)元數(shù)據(jù)和數(shù)據(jù)標準中的業(yè)務(wù)術(shù)語有沒有關(guān)系呢

    來自四川 回復(fù)
  3. 看了這篇文章,總算是搞清楚啥是元數(shù)據(jù)了,不再糾結(jié)于晦澀的感念,真爽!

    來自湖南 回復(fù)
  4. 我還是沒理解元元數(shù)據(jù)和元模型的概念

    來自湖北 回復(fù)
    1. 沒理解的話,就不糾結(jié)啦,先搞其他的事~

      來自廣東 回復(fù)
  5. 寫的非常易懂!

    回復(fù)
    1. 感謝感謝~

      來自廣東 回復(fù)
  6. 如何理解元數(shù)據(jù)方案?

    回復(fù)
    1. 元數(shù)據(jù)管理方案?

      回復(fù)
  7. 最近也一直不太理解具體元數(shù)據(jù)是什么意思,今天看后深有啟發(fā)

    來自海南 回復(fù)
    1. 歡迎交流~

      來自廣東 回復(fù)