知識(shí)圖譜的本體模型設(shè)計(jì)和ER模型設(shè)計(jì)的區(qū)別

Eric_Xie
3 評(píng)論 22553 瀏覽 48 收藏 9 分鐘
B端产品经理要负责对目标行业和市场进行深入的分析和调研,了解客户的需求、痛点、期望和行为,找到产品的价值主张 🔗

本體的概念最早起源于哲學(xué)領(lǐng)域, 指的是對(duì)客觀存在系統(tǒng)的解釋和說(shuō)明。這句話出現(xiàn)在了幾乎所有系統(tǒng)介紹知識(shí)圖譜和本體的材料里。在很長(zhǎng)一段時(shí)間里,以為這是一句廢話,現(xiàn)在對(duì)這句話有了更多的體驗(yàn)。

一、前言

知識(shí)圖譜的本體涉及很多具體概念,如:實(shí)體、關(guān)系、對(duì)象節(jié)點(diǎn)(資源)、數(shù)據(jù)節(jié)點(diǎn)(字面量)等。

所以向別人解釋什么是本體時(shí)需要耗費(fèi)非常多的精力,巴拉巴拉拋出一大堆概念,最后對(duì)方可能沒(méi)聽(tīng)懂,或者聽(tīng)懂了但是人家根本就不關(guān)注這些細(xì)節(jié)。所以針對(duì)不同的聽(tīng)眾可以有完全不同的說(shuō)法。

當(dāng)對(duì)方是市場(chǎng)人員或者客戶(hù),和對(duì)方提到”本體“兩個(gè)字,僅僅是為了說(shuō)明知識(shí)圖譜構(gòu)建工程需要做哪些事情。

比如:我們需要三周時(shí)間進(jìn)行業(yè)務(wù)梳理和本體構(gòu)建。

那么無(wú)論如何也繞不過(guò)什么是本體,要解釋為什么要耗費(fèi)這么長(zhǎng)時(shí)間去構(gòu)建本體。這種時(shí)候可以說(shuō)的非常粗略:“本體是一個(gè)數(shù)據(jù)模型,這個(gè)模型用以約束知識(shí)圖譜數(shù)據(jù)的組織方式”。

當(dāng)時(shí)對(duì)方是技術(shù)人員或者產(chǎn)品人員,可以說(shuō):“本體可以理解為關(guān)系型數(shù)據(jù)庫(kù)的ER模型”。

ER模型即“Entity-relationship model”,其實(shí)本體也是這兩個(gè)概念,實(shí)體和關(guān)系。本體把名詞概念稱(chēng)作一個(gè)實(shí)體,一個(gè)實(shí)體是一個(gè)節(jié)點(diǎn),各個(gè)概念之間的聯(lián)系稱(chēng)作關(guān)系,一條關(guān)系是兩個(gè)相關(guān)節(jié)點(diǎn)之間的連線。

本體就是定義哪些名詞概念成為實(shí)體節(jié)點(diǎn)和定義實(shí)體間關(guān)系的模型。如果對(duì)方是個(gè)Coder,也可以說(shuō)本體模型類(lèi)似類(lèi)圖,表達(dá)類(lèi)與類(lèi)之間的關(guān)系。

本體的一個(gè)實(shí)體就是一種類(lèi),本體的實(shí)例節(jié)點(diǎn)就是類(lèi)的實(shí)例對(duì)象。本體的關(guān)系就是表達(dá)類(lèi)之間的關(guān)系,當(dāng)然本體的關(guān)系類(lèi)型比類(lèi)圖的關(guān)系類(lèi)型要多的多。

所以本體設(shè)計(jì)和傳統(tǒng)的數(shù)據(jù)庫(kù)或者數(shù)倉(cāng)設(shè)計(jì)一樣,需要強(qiáng)依賴(lài)于業(yè)務(wù)流程和業(yè)務(wù)需求。剛剛接觸知識(shí)圖譜和本體的時(shí)候,我曾錯(cuò)誤的將本體設(shè)計(jì)和ER設(shè)計(jì)等同起來(lái),甚至為了簡(jiǎn)便直接將ER模型當(dāng)作本體模型使用。

本篇文章將會(huì)分享相關(guān)經(jīng)驗(yàn),通過(guò)舉個(gè)小例子來(lái)討論下本體設(shè)計(jì)和關(guān)系型數(shù)據(jù)庫(kù)ER圖的區(qū)別。

本體和知識(shí)圖譜的構(gòu)建流程可以查看本人在本站之前的文章進(jìn)行交流:

知識(shí)圖譜在風(fēng)控的應(yīng)用

二、場(chǎng)景舉例

拿私募基金業(yè)務(wù)為例,有如下簡(jiǎn)化版的數(shù)據(jù)結(jié)構(gòu)。

私募基金管理人和其相關(guān)的股東、聯(lián)系人、實(shí)際控制人、員工。根據(jù)相關(guān)規(guī)定:基金管理人的法律主體被限定為公司或合伙企業(yè),自然人被排除在外。

基金管理人通常都會(huì)設(shè)定為公司形式,尤其是有限責(zé)任公司形式。其中股東和實(shí)際控制人可以為自然人,也可以為法人。

員工和聯(lián)系人為自然人,一家私募基金管理人對(duì)應(yīng)一個(gè)聯(lián)系人和實(shí)際控制人,對(duì)應(yīng)多個(gè)股東和公司員工。一個(gè)法人或自然人可以同時(shí)為股東和實(shí)際控制人,一個(gè)自然人可以同時(shí)作為一家私募基金管理人的員工和聯(lián)系人。

三、本體設(shè)計(jì)

如果我們直接把ER模型轉(zhuǎn)化成本體模型,再直接依據(jù)該本體進(jìn)行數(shù)據(jù)映,可以得到相應(yīng)的圖譜如下。

該圖譜最大的問(wèn)題在于:同一個(gè)人或者同一家公司會(huì)有多個(gè)節(jié)點(diǎn),換句話說(shuō)沒(méi)有做節(jié)點(diǎn)融合。

如上圖所示:有兩個(gè)相同的自然人節(jié)點(diǎn)——”趙某“,兩個(gè)相同公司節(jié)點(diǎn)——“北京XX科技有限公司”。

這對(duì)于知識(shí)圖譜的大部分應(yīng)用場(chǎng)景來(lái)說(shuō)是不合理的,在同一個(gè)圖譜中,同一個(gè)實(shí)例不能屬于兩種類(lèi)型,不能成為兩個(gè)節(jié)點(diǎn)。

所以上述的知識(shí)圖譜應(yīng)該如下:

為什么同一個(gè)實(shí)例不能有不同的節(jié)點(diǎn)呢?從應(yīng)用的角度,在更加復(fù)雜從的關(guān)系中,很難發(fā)現(xiàn)關(guān)鍵節(jié)點(diǎn)和業(yè)務(wù)關(guān)注的關(guān)系結(jié)構(gòu)。

將上述關(guān)系以未作節(jié)點(diǎn)融合的圖譜進(jìn)行展示,仍舊很難發(fā)現(xiàn)多個(gè)節(jié)點(diǎn)之間存在的關(guān)系。

根據(jù)上述描述,如果采用進(jìn)行實(shí)體融合后的圖譜,則可以非常容易的發(fā)現(xiàn)該圖譜中存在穿刺投資、持股方和被持股方擁有相同的聯(lián)系人等結(jié)構(gòu)。

所以由以上的圖譜倒推得到一個(gè)更加合理的本體模型如下:

總結(jié)

”本體的概念最早起源于哲學(xué)領(lǐng)域, 指的是對(duì)客觀存在系統(tǒng)的解釋和說(shuō)明“——這句話出現(xiàn)在了幾乎所有系統(tǒng)介紹知識(shí)圖譜和本體的材料里。

在很長(zhǎng)一段時(shí)間里,本人也以為這是一句廢話?,F(xiàn)在對(duì)這句話有了更多的體驗(yàn):

什么是客觀世界,就是一個(gè)實(shí)例就只有一個(gè)。我作為一個(gè)自然人只有一個(gè),所以反應(yīng)在圖譜里也只能有一個(gè)節(jié)點(diǎn)。但是我是作為”人“存在,還是作為“男人”存在,還是作為“員工”存在,是依賴(lài)于特定范圍的業(yè)務(wù)需要。結(jié)合知識(shí)圖譜的發(fā)展史,

知識(shí)圖譜起源于語(yǔ)義網(wǎng)絡(luò)和網(wǎng)絡(luò)鏈接,本體的目標(biāo)史對(duì)數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行定義,使得圖譜支持?jǐn)?shù)據(jù)融合以及便于機(jī)器理解和展示。

本體模型的設(shè)計(jì)和其他數(shù)據(jù)模型的設(shè)計(jì)類(lèi)似,沒(méi)有一個(gè)絕對(duì)正確的設(shè)計(jì),只能說(shuō)哪個(gè)模型更加合理。

從以往經(jīng)驗(yàn)看來(lái):一個(gè)合理的本體模型大概要滿(mǎn)足以下幾點(diǎn)要求:

  • 有效地支撐業(yè)務(wù)的分析和決策。
  • 正確一致地展示數(shù)據(jù)信息。
  • 擁有廣泛的適用性,易于添加新的節(jié)點(diǎn)類(lèi)型和關(guān)系

 

作者:Eric ,數(shù)據(jù)產(chǎn)品經(jīng)理。金融大數(shù)據(jù)方向,知識(shí)圖譜工程化。

本文由 @Eric_Xie 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自 Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 自然人,還是企業(yè)法人都可以抽象為當(dāng)事人,一切關(guān)系都可以用協(xié)議表示

    來(lái)自北京 回復(fù)
  2. 前輩您好 我目前也在做知識(shí)圖譜產(chǎn)品 目前在百度實(shí)習(xí) 您方便加個(gè)微信嗎 看到您的文章很想多跟您交流 感謝 我的微信號(hào)是lixx9503 謝謝

    回復(fù)
    1. 建議你看看
      @南風(fēng)追憶 的關(guān)于圖譜的

      來(lái)自福建 回復(fù)