思考總結(jié):領(lǐng)域知識(shí)圖譜平臺(tái)構(gòu)建與業(yè)務(wù)應(yīng)用【指北】
編輯導(dǎo)語:如今,領(lǐng)域圖譜的應(yīng)用范圍非常廣泛,也有越來越多的企業(yè)、機(jī)構(gòu)希望通過搭建領(lǐng)域知識(shí)圖譜,開發(fā)上層業(yè)務(wù)圖應(yīng)用,實(shí)現(xiàn)智能分析決策。本篇文章詳細(xì)介紹了領(lǐng)域知識(shí)圖譜平臺(tái)的構(gòu)建和應(yīng)用,一起來看看。
一、圖譜平臺(tái)簡要介紹
領(lǐng)域圖譜的典型應(yīng)用場景有國防、金融、公安、工業(yè)等。從行業(yè)滲透情況上看,領(lǐng)域知識(shí)圖譜最早用于公安、國防等政府部門,隨后在金融行業(yè),如銀行、保險(xiǎn)、基金等得到更大規(guī)模的應(yīng)用,并逐漸拓展至能源、醫(yī)療、零售等行業(yè)。
知識(shí)圖譜可分為構(gòu)建和應(yīng)用兩大部分。
對(duì)于圖構(gòu)建,主要用戶是企業(yè)信息化部門、科技部門的技術(shù)人員,但在實(shí)際的圖構(gòu)建過程中需要與業(yè)務(wù)人員進(jìn)行需求梳理與溝通;
對(duì)于圖應(yīng)用,主要用戶是業(yè)務(wù)人員,與圖譜平臺(tái)在行業(yè)落地的應(yīng)用場景相對(duì)應(yīng),例如銀行主要是風(fēng)控、營銷、審計(jì)等業(yè)務(wù)的人員,公安是負(fù)責(zé)刑偵、經(jīng)偵、緝毒等工作的人員。
1. 圖譜平臺(tái)搭建背景
當(dāng)下市場環(huán)境,各領(lǐng)域、行業(yè)對(duì)于數(shù)據(jù)應(yīng)用需求日漸強(qiáng)烈,越來越多的企業(yè)、機(jī)構(gòu)計(jì)劃建立起數(shù)據(jù)之間的關(guān)聯(lián),希望通過搭建領(lǐng)域知識(shí)圖譜,開發(fā)上層業(yè)務(wù)圖應(yīng)用,實(shí)現(xiàn)智能分析決策。
在建設(shè)圖譜應(yīng)用的過程中,會(huì)發(fā)現(xiàn)數(shù)據(jù)來源廣、規(guī)模大、標(biāo)準(zhǔn)不統(tǒng)一等一系列數(shù)據(jù)問題,伴隨業(yè)務(wù)場景構(gòu)建復(fù)雜、變化快、建模難、復(fù)用性低等。此時(shí),圖譜平臺(tái)作為一種領(lǐng)域圖譜構(gòu)建及應(yīng)用工具,其便捷性與提效降本能力顯現(xiàn)出來。
2. 圖譜平臺(tái)定義
圖譜平臺(tái)是基于企業(yè)內(nèi)外部的海量多源異構(gòu)數(shù)據(jù),提供完整的圖譜構(gòu)建與應(yīng)用流程,實(shí)現(xiàn)數(shù)據(jù)抽取、數(shù)據(jù)融合、圖構(gòu)建、圖可視化研判、圖計(jì)算、圖分析、圖挖掘、圖模式匹配等,并提供各類圖應(yīng)用輸出方式以及圖業(yè)務(wù)場景,助力企業(yè)快速完成圖譜的一站式應(yīng)用,深度挖掘數(shù)據(jù)之間的關(guān)聯(lián)價(jià)值,賦能數(shù)字化轉(zhuǎn)型。
圖譜平臺(tái)不僅僅是一個(gè)技術(shù)平臺(tái)(工具),應(yīng)該有機(jī)集成各種圖譜技術(shù),匯集各種知識(shí),包括常識(shí)性知識(shí)與領(lǐng)域行業(yè)知識(shí);良好的人機(jī)交互體驗(yàn),使平臺(tái)具備一定的流暢性與實(shí)用性;并且具備知識(shí)服務(wù)能力及多行業(yè)遷移能力。
3. 圖譜平臺(tái)建設(shè)目標(biāo)
領(lǐng)域圖譜,面向某一行業(yè)或特定領(lǐng)域,用戶是業(yè)內(nèi)相關(guān)人員,用來輔助復(fù)雜的分析或研判,支持應(yīng)用與決策,對(duì)準(zhǔn)確率、性能要求較高。因此,圖譜平臺(tái)要有完備的工具、便捷的操作和深度的應(yīng)用性。
圖譜平臺(tái)的建設(shè)目標(biāo)首先是降低圖譜的構(gòu)建門檻,讓圖譜可以被普通客戶消費(fèi)的起;沉淀圖譜技術(shù)與行業(yè)應(yīng)用能力,快速構(gòu)建知識(shí)圖譜并支撐各行業(yè)應(yīng)用能力。
圖譜平臺(tái)的使命是促進(jìn)知識(shí)圖譜的行業(yè)落地,因此,集成各種圖譜工具模塊,積累各行業(yè)本體和知識(shí),積累各種應(yīng)用經(jīng)驗(yàn),提高圖譜構(gòu)建效率,降低圖譜應(yīng)用門檻。
領(lǐng)域圖譜平臺(tái)離開行業(yè)落地是沒有生命力的,平臺(tái)并非憑空設(shè)計(jì),而是在實(shí)戰(zhàn)中不斷抽象、不斷完善,在行業(yè)應(yīng)用中實(shí)現(xiàn)完美的技術(shù)與業(yè)務(wù)融合。
4. 圖譜平臺(tái)業(yè)務(wù)目標(biāo)
搭建圖譜平臺(tái),一方面,實(shí)現(xiàn)業(yè)務(wù)數(shù)據(jù)的一站式存儲(chǔ)、管理、查詢和挖掘,提高決策的準(zhǔn)確性及完整性;另一方面,實(shí)現(xiàn)業(yè)務(wù)應(yīng)用知識(shí)沉淀與前置,將圖譜理念輸入到業(yè)務(wù)策略中。
實(shí)現(xiàn)對(duì)多源異構(gòu)數(shù)據(jù)的融合、轉(zhuǎn)換、計(jì)算與存儲(chǔ),并基于知識(shí)圖譜平臺(tái)開發(fā)上層的業(yè)務(wù)應(yīng)用。從功能規(guī)劃和應(yīng)用設(shè)計(jì)上以金融風(fēng)控為例,圖譜平臺(tái)一般提供兩方面能力:
- 一方面,為機(jī)構(gòu)用戶提供企業(yè)統(tǒng)一視圖、智能關(guān)系查詢、負(fù)面輿情提醒等信息聚合類應(yīng)用,以滿足業(yè)務(wù)發(fā)展中貸前背景調(diào)查、貸中授信審批、貸后動(dòng)態(tài)監(jiān)控等多場景風(fēng)控需求。
- 另一方面,通過隱性集團(tuán)派系識(shí)別、授信集中度統(tǒng)計(jì)、黑名單關(guān)聯(lián)等應(yīng)用實(shí)現(xiàn)合規(guī)性風(fēng)險(xiǎn)的深度挖掘和集中展示,滿足穿透式監(jiān)管的需要。
圖譜平臺(tái)實(shí)現(xiàn)外部數(shù)據(jù)與業(yè)務(wù)數(shù)據(jù)的融合,推出更多應(yīng)用場景,包括企業(yè)信息查詢、關(guān)聯(lián)關(guān)系查詢、動(dòng)態(tài)輿情監(jiān)控、隱性集團(tuán)授信集中度分析、異常擔(dān)保關(guān)系識(shí)別、黑名單關(guān)聯(lián)分析、擔(dān)保圈鏈識(shí)別、隱性資金鏈路等,助力實(shí)現(xiàn)數(shù)據(jù)價(jià)值深度挖掘。
通過建設(shè)圖譜平臺(tái),實(shí)現(xiàn)自動(dòng)信息整合與業(yè)務(wù)知識(shí)挖掘。
一方面,節(jié)省了在信息搜尋、梳理關(guān)系工作上耗費(fèi)的人力及時(shí)間,實(shí)現(xiàn)業(yè)務(wù)工作的降本增效。
另一方面,加強(qiáng)數(shù)據(jù)洞察與數(shù)據(jù)價(jià)值變現(xiàn),為業(yè)務(wù)決策提供有力的工具支持與策略指引。
二、領(lǐng)域圖譜平臺(tái)應(yīng)用方法論
在圖譜平臺(tái)如何構(gòu)建一個(gè)業(yè)務(wù)場景圖應(yīng)用,以金融行業(yè)為例,進(jìn)行簡要方法介紹。我們將整個(gè)步驟拆解成9個(gè)關(guān)鍵步驟,包括:業(yè)務(wù)理解、本體設(shè)計(jì)、關(guān)鍵數(shù)據(jù)分析、數(shù)模映射、數(shù)據(jù)入圖、圖可視化、圖分析/挖掘、圖指標(biāo)/模型和圖輸出方式,接下來對(duì)該9個(gè)關(guān)鍵步驟進(jìn)行詳細(xì)拆解。
1. 業(yè)務(wù)理解
首先確定主要使用的業(yè)務(wù)部門和業(yè)務(wù)目標(biāo),以及展示要求、性能要求、更新要求等等。若業(yè)務(wù)部門沒有相關(guān)經(jīng)驗(yàn),則需要根據(jù)以往的經(jīng)驗(yàn)結(jié)合當(dāng)前客戶的業(yè)務(wù)目標(biāo)來引導(dǎo)對(duì)于圖應(yīng)用的具體想法和思路。
有了圖應(yīng)用的想法和思路便可分析現(xiàn)有數(shù)據(jù)情況,需要的數(shù)據(jù)內(nèi)容、數(shù)據(jù)接入形式、數(shù)據(jù)來源、數(shù)據(jù)體量、數(shù)據(jù)更新機(jī)制和要求。
數(shù)據(jù)是一切之本,有了數(shù)據(jù)便可構(gòu)思本體設(shè)計(jì),設(shè)想所需的數(shù)據(jù)屬性、關(guān)系等計(jì)算需求,如:確定實(shí)體及屬性、關(guān)系及屬性、事件及屬性,確定計(jì)算哪些隱形屬性和關(guān)系,設(shè)計(jì)計(jì)算規(guī)則和策略。
2. 本體設(shè)計(jì)
本體設(shè)計(jì)是圖應(yīng)用中的重中之重,一切的圖展示、圖計(jì)算、圖分析、圖挖掘、圖模式匹配的基礎(chǔ)在圖構(gòu)建,而圖構(gòu)建的核心是本體設(shè)計(jì)(本體設(shè)計(jì)的方法論本次不做過多贅述,后面單寫一篇)。
設(shè)計(jì)好本體,便可根據(jù)本體進(jìn)行相應(yīng)的實(shí)體抽取、關(guān)系抽取、事件抽取,實(shí)體抽取需確定實(shí)體的種類、實(shí)體的唯一標(biāo)識(shí)、實(shí)體的普通屬性等,關(guān)系抽取需確定關(guān)系的種類、關(guān)系的主體和客體、關(guān)系的屬性等,事件抽取需要確定事件的種類、事件的主體和客體、事件的屬性等;此處所進(jìn)行的本體均為后續(xù)的圖應(yīng)用做準(zhǔn)備,需全面、細(xì)致的考慮。
3. 關(guān)鍵數(shù)據(jù)分析
對(duì)于關(guān)鍵數(shù)據(jù)的分析直接決定圖應(yīng)用的質(zhì)量。因此,需要對(duì)數(shù)據(jù)的特征進(jìn)行嚴(yán)格的分析,如:是否唯一標(biāo)識(shí)、是否多值、是否空值、是否錯(cuò)誤數(shù)據(jù)、是否標(biāo)準(zhǔn)統(tǒng)一、是否特殊字符等等;
評(píng)估完成數(shù)據(jù)特征就需要根據(jù)圖應(yīng)用要求對(duì)數(shù)據(jù)進(jìn)行加工,數(shù)據(jù)加工即清洗、融合、解析、識(shí)別、轉(zhuǎn)化等,對(duì)入圖數(shù)據(jù)的質(zhì)量制定一個(gè)好的標(biāo)準(zhǔn)。
4. 數(shù)據(jù)映射
數(shù)據(jù)映射即將需要入圖的數(shù)據(jù)與本體進(jìn)行一一對(duì)應(yīng),涉及表的映射、屬性字段的映射、字段的治理規(guī)則等,根據(jù)映射關(guān)系和治理規(guī)則自動(dòng)或手動(dòng)從原始數(shù)據(jù)治理成圖譜需要的數(shù)據(jù)格式,做好入圖前的準(zhǔn)備。
5. 數(shù)據(jù)入圖
數(shù)據(jù)入圖就是將與本體映射完成的數(shù)據(jù)導(dǎo)入圖數(shù)據(jù)庫,此步驟需要對(duì)數(shù)據(jù)賦權(quán)、規(guī)定數(shù)據(jù)入圖的任務(wù)流、數(shù)據(jù)導(dǎo)入的方式、以及數(shù)據(jù)更新方式。
數(shù)據(jù)賦權(quán)即對(duì)數(shù)據(jù)源權(quán)限授權(quán)和管理;數(shù)據(jù)入圖任務(wù)流需要對(duì)ETL任務(wù)流進(jìn)行設(shè)計(jì)、對(duì)任務(wù)事件進(jìn)行管理,使數(shù)據(jù)按照既定策略進(jìn)行任務(wù)執(zhí)行;
數(shù)據(jù)導(dǎo)入方式,可對(duì)不同級(jí)別的數(shù)據(jù)進(jìn)行不同的導(dǎo)入方式,小批量數(shù)據(jù)可進(jìn)行頁面可視化導(dǎo)入,對(duì)于大批量數(shù)據(jù)進(jìn)行接口批量導(dǎo)入,此處用作測試驗(yàn)證和生產(chǎn)環(huán)境不同需求來定;
最后便是數(shù)據(jù)的更新方式,更新方式包含兩種即全量覆蓋更新和實(shí)時(shí)增量更新,導(dǎo)入方式與具體的業(yè)務(wù)強(qiáng)掛鉤,如實(shí)時(shí)反欺詐就需要實(shí)時(shí)增量更新,隱性集團(tuán)派系識(shí)別可使用全量覆蓋,此處的更新方式不固定,以實(shí)際情況作為判斷依據(jù)。
6. 圖可視化
圖可視化是圖應(yīng)用的重要組成部分,支撐圖展示、圖分析、圖研判,既然是圖可視化,就需要一些圖操作功能,例如:圖查詢、圖展開(圖查詢方式,單實(shí)體關(guān)系展開、單實(shí)體對(duì)多實(shí)體關(guān)系展開、批量實(shí)體關(guān)系展開、多實(shí)體對(duì)多實(shí)體關(guān)系展開)、實(shí)體類型外觀編輯、關(guān)系類型外觀編輯、屬性值高級(jí)篩選、屬性值高級(jí)過濾、圖查詢語句使用、圖圖示化分析工具欄、實(shí)時(shí)查詢計(jì)算、各種圖布局、時(shí)序分析、路徑分析、實(shí)體操作、地理空間分析、關(guān)系展開合并、2D&3D切換等等;
作為行業(yè)知識(shí)圖譜平臺(tái),支撐行業(yè)場景庫的圖可視化也非常必要,如:反欺詐團(tuán)伙展示、擔(dān)保圈、擔(dān)保鏈、企業(yè)集團(tuán)關(guān)聯(lián)關(guān)系、資金網(wǎng)絡(luò)關(guān)系、組合風(fēng)險(xiǎn)傳導(dǎo)。
7. 圖分析/圖挖掘
圖分析圖挖掘以圖拓?fù)浣Y(jié)構(gòu)為基礎(chǔ),再圖結(jié)合圖算法、業(yè)務(wù)場景策略、圖推理方式、圖計(jì)算引擎對(duì)圖特征及場景結(jié)果進(jìn)行計(jì)算。常用的圖算法類型有:中心性衡量、節(jié)點(diǎn)特征發(fā)現(xiàn)、社團(tuán)檢測、特殊結(jié)構(gòu)發(fā)現(xiàn)、路徑查找等,結(jié)合具體的業(yè)務(wù)場景需求,對(duì)圖場景數(shù)據(jù)集進(jìn)行計(jì)算;
業(yè)務(wù)場景挖掘需要結(jié)合業(yè)務(wù)識(shí)別經(jīng)驗(yàn)和業(yè)務(wù)識(shí)別規(guī)則,對(duì)圖場景進(jìn)行分析挖掘,并對(duì)分析結(jié)果、挖掘結(jié)果進(jìn)行展示,并且可在分析、挖掘結(jié)果的基礎(chǔ)上進(jìn)行二次拓展,對(duì)嚴(yán)格滿足業(yè)務(wù)規(guī)則結(jié)果的入庫,對(duì)疑似滿足業(yè)務(wù)規(guī)則的進(jìn)行結(jié)果人工研判。業(yè)務(wù)場景常用的也需要一些圖推理,如:描述邏輯推理、規(guī)則推理、以及分布式表示推理。
當(dāng)然所有的圖計(jì)算、圖分析、圖挖掘都要在分析挖掘引擎之上進(jìn)行,常用的計(jì)算引擎有兩類:實(shí)時(shí)計(jì)算引擎、批量計(jì)算引擎,此處不做過多贅述。大規(guī)模圖搜索、圖數(shù)據(jù)的代表節(jié)點(diǎn)評(píng)價(jià)、圖數(shù)據(jù)的社區(qū)劃分、圖數(shù)據(jù)的向量嵌入,基于圖的推薦、節(jié)點(diǎn)預(yù)測、關(guān)系預(yù)測等實(shí)際應(yīng)用對(duì)圖計(jì)算引擎性能提出了更高的要求。
8. 圖指標(biāo)/圖模型
對(duì)于圖的分析、挖掘離不開對(duì)應(yīng)的業(yè)務(wù)指標(biāo)和模型,例如事件規(guī)則庫、指標(biāo)庫、畫像特征庫、模型庫以及圖模式匹配庫;以金融風(fēng)控來說:
事件指標(biāo)庫有識(shí)別規(guī)則、風(fēng)險(xiǎn)事件、預(yù)警規(guī)則、資金事件、關(guān)聯(lián)規(guī)則,指標(biāo)庫有業(yè)務(wù)經(jīng)營指標(biāo)、關(guān)聯(lián)風(fēng)險(xiǎn)指標(biāo)、擔(dān)保風(fēng)險(xiǎn)指標(biāo)等;
畫像特征庫有社區(qū)畫像特征庫、擔(dān)保風(fēng)險(xiǎn)特征庫、關(guān)聯(lián)關(guān)系特征庫等;
模型庫有傳導(dǎo)路徑模型、預(yù)警模型、風(fēng)險(xiǎn)計(jì)量模型、風(fēng)險(xiǎn)事件傳染、圖譜特征分析、預(yù)警計(jì)算、風(fēng)險(xiǎn)傳導(dǎo)、中介度、風(fēng)險(xiǎn)擴(kuò)散度、風(fēng)險(xiǎn)匯聚度、網(wǎng)絡(luò)影響度、風(fēng)險(xiǎn)大小分布、風(fēng)險(xiǎn)密度分布等。
還有一定程度的圖模式匹配需求,如:資金流轉(zhuǎn)鏈路、資金回流、隱性資金流轉(zhuǎn)線索,以及擔(dān)保圈中的循環(huán)型擔(dān)保、融資型擔(dān)保、平臺(tái)型擔(dān)保、循環(huán)擔(dān)保等等,并且可支持自定義的圖模式匹配
9. 圖輸出方式
按照如上的圖應(yīng)用類型,圖譜平臺(tái)需要提供與之對(duì)應(yīng)的輸出方式,向業(yè)務(wù)賦能;常用的圖譜平臺(tái)賦能方式可以總結(jié)為以下4種類型:
- 業(yè)務(wù)系統(tǒng)嵌入,把圖分析、圖挖掘結(jié)果嵌入到業(yè)務(wù)系統(tǒng)當(dāng)中,當(dāng)查詢到某一業(yè)務(wù)節(jié)點(diǎn)時(shí),可打開對(duì)應(yīng)業(yè)務(wù)場景的圖譜展示。
- 接口傳參調(diào)用,當(dāng)業(yè)務(wù)系統(tǒng)有新增時(shí)通過接口傳入圖項(xiàng)目數(shù)據(jù)集當(dāng)中進(jìn)行實(shí)時(shí)計(jì)算或批量計(jì)算,計(jì)算完成后通過接口返回。
- 獨(dú)立平臺(tái)提供,圖譜平臺(tái)作為獨(dú)立的圖一體化平臺(tái),提供圖構(gòu)建、圖展示、圖分析、圖挖掘、圖推理等服務(wù)。
- 內(nèi)部數(shù)據(jù)源,將各種圖數(shù)據(jù)指標(biāo)、圖特征計(jì)算完成之后,推送至數(shù)倉、業(yè)務(wù)系統(tǒng)、決策引擎或其他業(yè)務(wù)系統(tǒng)等進(jìn)行調(diào)用。
三、數(shù)據(jù)處理能力
1. 入圖數(shù)據(jù)處理能力
圖譜平臺(tái)跟大數(shù)據(jù)平臺(tái)一樣,需要處理各種格式的數(shù)據(jù),對(duì)入圖數(shù)據(jù)進(jìn)行加工。對(duì)于結(jié)構(gòu)化數(shù)據(jù),圖譜平臺(tái)跟大數(shù)據(jù)平臺(tái)有重合功能,區(qū)別在于,圖譜平臺(tái)需要通過本體來建立數(shù)模映射關(guān)系,并將數(shù)據(jù)庫數(shù)據(jù)以本體為標(biāo)準(zhǔn)集成形成知識(shí)網(wǎng)絡(luò),數(shù)據(jù)庫則通過表結(jié)構(gòu)對(duì)數(shù)據(jù)進(jìn)行集成。
對(duì)非結(jié)構(gòu)化數(shù)據(jù),圖譜平臺(tái)與大數(shù)據(jù)平臺(tái)則有本質(zhì)的差異。大數(shù)據(jù)平臺(tái)一般將文本、圖像、視頻等非結(jié)構(gòu)化數(shù)據(jù)存入數(shù)據(jù)庫或加索引,通過關(guān)鍵詞檢索,一般有對(duì)文本的分類、聚類、打標(biāo)簽、命名實(shí)體識(shí)別,但不具備或者具有比較弱的圖譜構(gòu)建能力,最多基于圖數(shù)據(jù)庫做圖數(shù)據(jù)的導(dǎo)入。
圖譜平臺(tái)最好與大數(shù)據(jù)平臺(tái)進(jìn)行隔離,形成高內(nèi)聚低耦合的大數(shù)據(jù)平臺(tái)與圖譜平臺(tái),圖譜平臺(tái)只進(jìn)行入圖數(shù)據(jù)格式的處理及加工,大數(shù)據(jù)平臺(tái)對(duì)數(shù)據(jù)進(jìn)行治理、統(tǒng)一標(biāo)準(zhǔn),治理完成之后輸入圖譜平臺(tái)。
2. 非結(jié)構(gòu)化數(shù)據(jù)處理能力
據(jù)IDC調(diào)查報(bào)告:企業(yè)中80%的數(shù)據(jù)都是非結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)每年都按指數(shù)增長60%。據(jù)報(bào)道指出:平均只有1%-5%的數(shù)據(jù)是結(jié)構(gòu)化的數(shù)據(jù)。
面向非結(jié)構(gòu)化數(shù)據(jù),提供易用的可視化標(biāo)注模塊來滿足實(shí)體標(biāo)注、實(shí)體關(guān)系標(biāo)注、事件標(biāo)注、實(shí)體屬性標(biāo)注等多種標(biāo)注任務(wù),并盡可能地支持多人協(xié)同標(biāo)注、以篇為維度的標(biāo)注、以標(biāo)注實(shí)體/關(guān)系/屬性類型的標(biāo)注等多種標(biāo)注形式是圖譜平臺(tái)不可獲缺的能力。
對(duì)于非結(jié)構(gòu)化數(shù)據(jù)源,先進(jìn)行基于本體約束的結(jié)構(gòu)化抽取,形成三元組,然后再進(jìn)行結(jié)構(gòu)化映射。結(jié)構(gòu)化數(shù)據(jù)的映射,自身已結(jié)構(gòu)化,涉及到的抽取操作更多是工程和產(chǎn)品上的,需要考慮操作易用性、數(shù)據(jù)安全性和完備性。
非結(jié)構(gòu)化數(shù)據(jù)接入模塊所體現(xiàn)出來的是極具門檻性的,“非結(jié)構(gòu)化抽取能力”,即常說的“實(shí)體識(shí)別、實(shí)體關(guān)系抽取、事件要素、事件關(guān)系抽取”能力,包括抽取模型設(shè)計(jì)、抽取模型實(shí)施以及抽取模型評(píng)測等幾個(gè)方面。
非結(jié)構(gòu)化數(shù)據(jù),由于存在從非結(jié)構(gòu)化到結(jié)構(gòu)化的過程,是整個(gè)環(huán)節(jié)中最為關(guān)鍵的部分,這個(gè)部分是產(chǎn)生數(shù)據(jù)誤差、引入噪聲最有可能的一步,抽取規(guī)則選擇不當(dāng)或者抽取模型性能達(dá)不到要求,后續(xù)步驟便很難走通。
四、圖譜平臺(tái)應(yīng)用展望
1. 功能趨勢
起初,圖譜平臺(tái)偏向基礎(chǔ)圖構(gòu)建、圖展示和圖研判,隨著業(yè)務(wù)應(yīng)用的深入,業(yè)務(wù)人員發(fā)現(xiàn)圖展示和圖研判的路徑非常多,對(duì)于獲得正確結(jié)果的路徑很長,并且極有可能出錯(cuò)。
這對(duì)于圖譜平臺(tái)的應(yīng)用和大規(guī)模的推廣極其不利,因此,隨著應(yīng)用的深入,圖譜平臺(tái)逐漸向智能化、簡單話方向探索,將業(yè)務(wù)策略、業(yè)務(wù)規(guī)則直接融入平臺(tái),利用圖計(jì)算引擎,快速獲得結(jié)果,在圖挖掘、圖模式匹配等的基礎(chǔ)進(jìn)行判定和二次研判。
此后,相信圖譜平臺(tái)智能化、便捷化、自動(dòng)化的能力會(huì)越來越高。
2. 成本趨勢
當(dāng)前的圖譜構(gòu)建和應(yīng)用高度依賴于人工,雖然圖譜平臺(tái)具備部分自動(dòng)化構(gòu)建功能,但為了同時(shí)保證效率、準(zhǔn)確性以及可解釋性,主流的圖譜平臺(tái)構(gòu)建和應(yīng)用方式為人工和自動(dòng)化的結(jié)合。
未來,隨著圖譜平臺(tái)的自動(dòng)化程度越來越高,圖譜的構(gòu)建和應(yīng)用成本將大幅降低,依賴人工的程度也將降低,可大幅提高分析決策效率。
3. 行業(yè)趨勢
目前,各行業(yè)對(duì)知識(shí)圖譜平臺(tái)認(rèn)可度的提高,圖譜平臺(tái)正在領(lǐng)域內(nèi)拓展開來,目前公安、國防、金融、電商、團(tuán)購、教育等行業(yè)依托圖譜實(shí)現(xiàn)業(yè)務(wù)的智能分析與決策。
未來圖譜將在醫(yī)療、能源、電力等更多知識(shí)密集型行業(yè)落地,發(fā)揮巨大價(jià)值,建設(shè)或購買圖譜平臺(tái)成為各行業(yè)實(shí)現(xiàn)智能分析與決策的重要環(huán)節(jié),相信日后會(huì)有更多的行業(yè)應(yīng)用案例和產(chǎn)品應(yīng)用案例展露。
本文由 @阿拉燈神丁 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于CC0協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒評(píng)論,等你發(fā)揮!