全球?qū)@麛?shù)據(jù)怎么玩才有趣?之 共現(xiàn)圖譜(二)

王海濤
0 評論 1233 瀏覽 2 收藏 7 分鐘

?本文介紹了從全球?qū)@麛?shù)據(jù)中構(gòu)建共現(xiàn)圖譜并對網(wǎng)絡(luò)中心度進行測算方法,為產(chǎn)業(yè)研究提供了一種新的視角和工具,幫助用戶更有效地識別和分析技術(shù)領(lǐng)域的頂尖資源。

一、說職場故事

招才引智、科研合作、科技攻關(guān)都有以下需求:

  • 找到某個技術(shù)領(lǐng)域的頂尖人才團隊
  • 找到某個技術(shù)領(lǐng)域的頂尖科研機構(gòu)/企業(yè)

如何通過大數(shù)據(jù)挖掘的方式幫客戶實現(xiàn)這些需求呢?以下我們從全球?qū)@暯墙o出對應(yīng)答案。

二、共現(xiàn)圖譜構(gòu)建、中心度的測算

接下來我們主要講解如何從全球?qū)@姓业巾敿鈭F隊、頂尖科研機構(gòu)/企業(yè),在進入這個主題之前我們需要學(xué)習(xí)下共現(xiàn)圖譜知識。

從下圖我們可以看出,同一篇專利可能存在多個申請人、發(fā)明設(shè)計人、IPC分類號。

全球?qū)@麛?shù)據(jù)怎么玩才有趣?之 共現(xiàn)圖譜(二)

如果有100條專利,我們就可以根據(jù)這3個字段構(gòu)建共現(xiàn)關(guān)系。比如,以IPC為例,就可以構(gòu)建IPC共現(xiàn)圖譜:

全球?qū)@麛?shù)據(jù)怎么玩才有趣?之 共現(xiàn)圖譜(二)

在該圖中,節(jié)點的大小表示相應(yīng)分類號出現(xiàn)的頻次,節(jié)點越大,說明100篇專利與該分類號相關(guān)的標(biāo)準(zhǔn)必要專利越多;節(jié)點之間的連線表示兩個分類號同時出現(xiàn)在一個標(biāo)準(zhǔn)必要專利中,連線越粗,代表兩個節(jié)點同時出現(xiàn)的次數(shù)越多,關(guān)系越密切。

社區(qū)發(fā)現(xiàn)是一種將網(wǎng)絡(luò)分成若干個社區(qū)的方法,根據(jù)其網(wǎng)絡(luò)中節(jié)點之間的聯(lián)系和相似性將節(jié)點劃分為不同的社區(qū),處于同一社區(qū)的節(jié)點之間更加相似、聯(lián)系更加緊密。

在社會網(wǎng)絡(luò)分析方法中,常見的衡量節(jié)點重要性的指標(biāo)有點度中心度、中介中心度、接近中心度特征向量中心度,可以根據(jù)這些中心度計算綜合中心度從而確定某個節(jié)點在整個網(wǎng)絡(luò)的重要性,各個中心度的說明如下:

三、說應(yīng)用場景

有了共現(xiàn)圖的構(gòu)建方法及網(wǎng)絡(luò)中心度的測算方法,在產(chǎn)業(yè)研究領(lǐng)域主要應(yīng)用場景有:

  • 找到某技術(shù)領(lǐng)域的頂尖人才團隊
  • 找到某技術(shù)領(lǐng)域的頂尖科研機構(gòu)/企業(yè)
  • 找到某技術(shù)領(lǐng)域的核心技術(shù)

應(yīng)用場景一 :找到某個技術(shù)領(lǐng)域的頂尖人才團隊

比如推薦人工智能領(lǐng)域5個頂尖人才團隊

實施步驟 將人工智能和IPC體系做映射(或者根據(jù)關(guān)鍵詞制定搜索策略)形成專利數(shù)據(jù)集,在數(shù)據(jù)集基礎(chǔ)上構(gòu)建“專利發(fā)明人共現(xiàn)圖譜”,在共現(xiàn)圖譜中計算網(wǎng)狀人物中的綜合中心度,根據(jù)綜合中心度取TOP5作為團隊領(lǐng)頭人,再將領(lǐng)頭人到共現(xiàn)圖譜中找合作最緊密人物,最終形成以領(lǐng)頭人的領(lǐng)域團隊,流程如下圖所示:全球?qū)@麛?shù)據(jù)怎么玩才有趣?之 共現(xiàn)圖譜(二)

應(yīng)用場景二:找到某個技術(shù)領(lǐng)域的頂尖頂尖科研機構(gòu)/企業(yè)

比如推薦人工智能領(lǐng)域的頂尖的科研機構(gòu)團隊

方法同上,只不過這次換成“申請人”構(gòu)建共現(xiàn)圖譜,這里可以分為二類:一類為研究機構(gòu)、一類為企業(yè),流程如下:

全球?qū)@麛?shù)據(jù)怎么玩才有趣?之 共現(xiàn)圖譜(二)

應(yīng)用場景三:找某個技術(shù)領(lǐng)域的核心技術(shù)

比如人工智能領(lǐng)域的核心技術(shù)有哪些

方法同上,這次根據(jù)專利所屬“IPC分類號”構(gòu)建共現(xiàn)圖譜,流程如下:

全球?qū)@麛?shù)據(jù)怎么玩才有趣?之 共現(xiàn)圖譜(二)

需要特別指出的是,如果需要對核心IPC進一步凝練成技術(shù)短語的化,可以利用大模型語義理解和抽取能力做進一步工作。

四、寫在后面的話

本文主要介紹了共現(xiàn)圖譜的構(gòu)建方法、網(wǎng)絡(luò)中心度的測算方法,然后闡述了共現(xiàn)圖譜可以在產(chǎn)業(yè)研究領(lǐng)域的應(yīng)用場景。需要注意一下幾點:

  1. 范圍可以不限于全球?qū)@?/strong>雖然講述的是全球?qū)@治鐾诰?,但該分析研究方法可以拓展到“頂刊”“全球項目”?shù)據(jù)的挖掘中。
  2. 在實際應(yīng)用中可以保持靈活性:比如本文用的“綜合中心度”代表節(jié)點的重要性,實際可以根據(jù)情況選取任意一個中心度作為重要性指標(biāo)。

本文由 @王海濤 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!
专题
15213人已学习11篇文章
SWOT分析法是互联网人最常用的分析模型之一,将企业内外部条件各方面内容进行综合和概括,进而分析组织的优劣势,面临的机会和威胁的一种方法。本专题的文章分享了如何做SWOT分析。
专题
16937人已学习14篇文章
图标是用户页面不可缺少的元素,本专题的文章分享了图标设计指南。
专题
14414人已学习13篇文章
作为一名运营,需要持续对自己的经验进行总结并不断更新迭代。本专题的文章分享了运营方法论。
专题
13699人已学习12篇文章
作者B端的产品经理,要基于这个行业理解的大背景下去了解公司的业务全局。本专题的文章分享了B端产品经理如何了解业务全局。
专题
15326人已学习12篇文章
本专题的文章分享了互联网金融风控体系的设计指南。
专题
13389人已学习12篇文章
追热点蹭热点是互联网相关从业人员的一种潜意识,尤其是运营岗、市场岗。本专题的文章分享了如何做节日营销。