醫(yī)學(xué)數(shù)據(jù)科研——數(shù)據(jù)手動(dòng)錄入
編輯導(dǎo)語(yǔ):如今隨著科技的發(fā)展,醫(yī)院里的很多種方式都使用互聯(lián)網(wǎng)系統(tǒng)的方式進(jìn)行,比如病人病歷的記錄,以前用本子,現(xiàn)在用數(shù)據(jù)庫(kù),查找起來比較方便;本文作者分享了關(guān)于醫(yī)學(xué)數(shù)據(jù)科研中的數(shù)據(jù)手動(dòng)錄入,我們一起來了解一下。
一、背景
三甲醫(yī)院由于其具備頂尖的醫(yī)療資源,會(huì)吸引疑難雜癥的患者前去就診,該部分患者所患疾病多為稀缺疾病,專病科研數(shù)據(jù)庫(kù)由于疾病的稀缺性所以數(shù)據(jù)庫(kù)內(nèi)數(shù)據(jù)量較少。
在某疾病方向上,截止到2019年全國(guó)共有1516家三甲醫(yī)院,現(xiàn)階段約有600W份病例,每年仍將以30萬的速度增長(zhǎng)。
對(duì)于醫(yī)院而言,這些數(shù)據(jù)為本院的醫(yī)學(xué)科研提供了數(shù)據(jù)基礎(chǔ)。
醫(yī)學(xué)科研,一方面可以提升本院的治療水平,進(jìn)而提高本院患者治愈率;另一方面可以增加本院的醫(yī)學(xué)論文數(shù)量。通過醫(yī)學(xué)科研,可以提升醫(yī)院在該疾病領(lǐng)域的業(yè)界地位,提升競(jìng)爭(zhēng)力,吸引更多的患者前來治療,最終為本院創(chuàng)造更多營(yíng)收。
但是由于歷史原因,目前600W份的病歷數(shù)據(jù)依然是紙質(zhì)數(shù)據(jù)。
在數(shù)據(jù)搜索方面,紙質(zhì)形式存儲(chǔ)的數(shù)據(jù),需要人工翻閱紙質(zhì)病歷查找。當(dāng)數(shù)據(jù)量小的時(shí)候,數(shù)據(jù)量查找成本較高,但是人力尚可企及。當(dāng)數(shù)據(jù)量大的時(shí)候,數(shù)據(jù)查找?guī)缀醭蔀椴豢赡堋?/p>
電子化存儲(chǔ)的數(shù)據(jù),數(shù)據(jù)查找效率縮短至秒級(jí)。
在數(shù)據(jù)統(tǒng)計(jì)方面,紙質(zhì)形式存儲(chǔ)的數(shù)據(jù),一次只能被一個(gè)人查閱,并且容易損壞;電子化存儲(chǔ)的數(shù)據(jù)支持多人同時(shí)查看,并且不容易損壞。
電子數(shù)據(jù)為科研提供了便利。所以需要將紙質(zhì)的病歷數(shù)據(jù)轉(zhuǎn)化成電子的病歷數(shù)據(jù)。數(shù)據(jù)手動(dòng)錄入是將數(shù)據(jù)轉(zhuǎn)換成電子化的一個(gè)方法。
二、數(shù)據(jù)手動(dòng)錄入
指,由人工將讀取到的數(shù)據(jù),填入可視化的頁(yè)面中,并將數(shù)據(jù)保存至數(shù)據(jù)庫(kù),將數(shù)據(jù)轉(zhuǎn)換成電子數(shù)據(jù)的方法。
包括自定義表單生成器和錄入數(shù)據(jù)兩個(gè)部分:
1. 自定義表單生成器
由于每個(gè)科研的研究方向不同,科研所需要的數(shù)據(jù)不同,采集數(shù)據(jù)的電子表單也將不同。
如果每個(gè)電子表單都由開發(fā)人員手動(dòng)開發(fā),隨著研究課題的數(shù)量增加,隨之增加的是人工成本、時(shí)間成本,降低項(xiàng)目交付的效率,自定義表單生成器是解決該問題的一款工具。
自定義表單生成器,是一款用戶可以根據(jù)自己需要自定義電子表單的工具。將生成電子表單的工作由技術(shù)人員轉(zhuǎn)移至現(xiàn)場(chǎng)項(xiàng)目人員,甚至有可能將工具的使用方法教給客戶使用。大大減低了企業(yè)生產(chǎn)電子表單的成本。
以表單“手術(shù)情況”為例,演示表單配置的過程,包括三步——第一步:創(chuàng)建表單;第二步:配置表單變量;第三步:選擇控件并配置控件屬性。
第一步:創(chuàng)建表單
創(chuàng)建表單時(shí),需要根據(jù)表單所代表的業(yè)務(wù)含義設(shè)置“表單名稱”為“手術(shù)情況”。
“表單名稱”是表單的中文名稱,命名方式一般是表單的中文名稱,代表該表單的業(yè)務(wù)方向;具有可讀性,不具備唯一性,主要用于用戶在填寫或查看表單時(shí)快速了解該表單的內(nèi)容。
第二步:配置表單變量及變量控件屬性。
假設(shè)“手術(shù)情況”表單有4個(gè)字段,手術(shù)執(zhí)行時(shí)間、手術(shù)方式、麻醉方式、手術(shù)經(jīng)過。以手術(shù)執(zhí)行時(shí)間舉例說明,配置表單的過程。
配置字段的變量名稱:手術(shù)執(zhí)行時(shí)間;設(shè)置字段的變量ID:operate_data。
“變量名稱”是變量的中文名稱,具備可讀性,不具備唯一性,主要用于用戶在填寫數(shù)據(jù)時(shí)快速了解該變量的含義。命名方式一般是變量的中文名稱。
“變量ID”是變量的英文名稱,具備唯一性,可讀性較差。主要用于系統(tǒng)識(shí)別字段。命名方式一般是變量的英文名稱。
第三步:選擇控件并配置控件屬性
為變量“手術(shù)執(zhí)行時(shí)間”設(shè)置日期型控件。并配置控件的屬性,不同的控件需要配置不同的控件屬性。日期型控件關(guān)鍵屬性包括日期類型。
“控件類型”指的是該變量適合使用的控件展示。該控件用于用戶在前端頁(yè)面準(zhǔn)確且快速的錄入數(shù)據(jù)庫(kù)需要存儲(chǔ)的數(shù)據(jù)。
“日期類型”指的是日期的精確度。有三種日期類型,年月日、年月日時(shí)分、年月日時(shí)分秒。
通過上述的配置過程,可以抽象出來表單配置的三個(gè)步驟:
- 創(chuàng)建表單
- 創(chuàng)建變量
- 選擇控件
創(chuàng)建表單:
根據(jù)業(yè)務(wù)情況,設(shè)置表單名稱和表單ID。
創(chuàng)建變量:
為該表單創(chuàng)建變量,設(shè)置變量名稱和變量ID。
選擇控件:
為變量設(shè)置合適的控件,并填寫控件的相關(guān)屬性,不同類型的控件,需要配置不同的屬性。
通過上述步驟完成其余變量的配置,完成整張表單“手術(shù)情況”的配置,最終前端頁(yè)面效果如下圖:
2. 自定義表單發(fā)布上線
配置完畢表單以后,表單處于一種草稿狀態(tài)。而科研數(shù)據(jù)由于其科研的嚴(yán)謹(jǐn)性,科研數(shù)據(jù)無法經(jīng)常變化,需要建立在一種相對(duì)確定的數(shù)據(jù)結(jié)構(gòu)上。所以需要把配置完成的表單發(fā)布上線。
在系統(tǒng)首次部署時(shí),發(fā)布成功以后,所有數(shù)據(jù)直接使用該表單錄入數(shù)據(jù)。
系統(tǒng)在運(yùn)行過程中,隨著系統(tǒng)的使用,用戶對(duì)表單的需求存在發(fā)生變動(dòng)的可能性。此時(shí),需要對(duì)線上表單重新編輯,然后發(fā)布上線。
由于歷史數(shù)據(jù)擁有很高的研究?jī)r(jià)值,需要根據(jù)新的表單將歷史數(shù)據(jù)進(jìn)行清洗,以保證舊數(shù)據(jù)在新的表單結(jié)構(gòu)下可以被使用。
3. 創(chuàng)建患者并錄入數(shù)據(jù)
錄入數(shù)據(jù)指的是,用戶在前端頁(yè)面以電子表單的形式將紙質(zhì)數(shù)據(jù)錄入到系統(tǒng)中,形成電子化的過程。由兩個(gè)步驟組成,創(chuàng)建患者、錄入患者數(shù)據(jù)。
1)創(chuàng)建患者
指,在系統(tǒng)中增加一個(gè)新的患者。將新增患者的操作由用戶直接在頁(yè)面上完成,使得沒有編程能力的人也可以將數(shù)據(jù)插入到系統(tǒng)中,降低了用戶往數(shù)據(jù)庫(kù)中新增數(shù)據(jù)的操作成本。
對(duì)于創(chuàng)建患者所使用的字段,不同病種數(shù)據(jù)庫(kù),因?yàn)閿?shù)據(jù)質(zhì)量不一致和對(duì)數(shù)據(jù)安全要求不同,所以在創(chuàng)建患者時(shí)填寫的字段也不相同。所以需要配置創(chuàng)建患者所使用的變量。
對(duì)于患者唯一標(biāo)示,創(chuàng)建患者時(shí),系統(tǒng)會(huì)自動(dòng)生成患者唯一標(biāo)識(shí)。但是為了再次創(chuàng)建患者時(shí),能夠識(shí)別出來患者是否存在。所以需要根據(jù)創(chuàng)建患者時(shí)使用的字段生成患者ID。如果患者ID的生成規(guī)則發(fā)生變化,需要對(duì)歷史數(shù)據(jù)進(jìn)行清洗。
2)錄入數(shù)據(jù)
指,在系統(tǒng)中完善患者信息。用戶在前端頁(yè)面以電子表單的形式,完善患者信息。使得沒有編程能力的人也可以將數(shù)據(jù)插入到系統(tǒng)中,降低了用戶往數(shù)據(jù)庫(kù)中錄入數(shù)據(jù)的操作成本。
科研所需的數(shù)據(jù)質(zhì)量高,只有經(jīng)過審核,確認(rèn)數(shù)據(jù)達(dá)到使用要求,才可以被科研所使用。需要對(duì)表單數(shù)據(jù)設(shè)置狀態(tài)來表示數(shù)據(jù)是否可用,包括暫存、提交待審核、審核通過、審核駁回等。
手動(dòng)錄入的數(shù)據(jù)量較大,需要提高數(shù)據(jù)錄入的效率。例如在設(shè)計(jì)表單時(shí)將數(shù)據(jù)分組分類;通過鍵盤快捷鍵快速切換變量;快速切換到下一頁(yè)等快捷操作。
三、總結(jié)
紙質(zhì)數(shù)據(jù)通過手動(dòng)錄入的方式進(jìn)入數(shù)據(jù)庫(kù),由于人腦在處理數(shù)據(jù)上更靈活性,數(shù)據(jù)填充率相比于系統(tǒng)填寫會(huì)比較高。但是數(shù)據(jù)錄入的效率會(huì)低效。
可以通過以下方式保持高效率和高填充率:將病歷分成不同模塊,由專業(yè)的醫(yī)學(xué)人員對(duì)非專業(yè)的人員按病歷模塊進(jìn)行培訓(xùn),數(shù)據(jù)錄入的問題將轉(zhuǎn)換成如何管理數(shù)據(jù)錄入員的問題。
本文由 @申bobo 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自?Unsplash,基于 CC0 協(xié)議
- 目前還沒評(píng)論,等你發(fā)揮!