干貨篇:AI賦能醫(yī)藥工業(yè)發(fā)展案例
編輯導(dǎo)語:醫(yī)藥工業(yè)往往研發(fā)周期長、成功率低并且研發(fā)費用高,這也是一直是困擾制藥企業(yè)的魔咒。而AI技術(shù)日新月異的發(fā)展給很多行業(yè)帶來了變革,醫(yī)藥工業(yè)同樣也受益于AI帶來的技術(shù)紅利,解決行業(yè)痛點,提高開發(fā)效率。本篇文章中,作者就為我們介紹了AI賦能醫(yī)藥工業(yè)發(fā)展的案例。
剛剛過去的這個周末,我受到邀請進行了一次演講,演講題目是《AI賦能醫(yī)藥工業(yè)發(fā)展案例》。
這次演講中,我將我們之前所做過的2個案例給大家做了詳細的講解,出乎意料的是對醫(yī)藥方面感興趣的聽眾遠遠高于我的預(yù)期。
從產(chǎn)業(yè)互聯(lián)網(wǎng)的角度來考慮,未來是B端產(chǎn)品的市場,也是傳統(tǒng)企業(yè)轉(zhuǎn)型信息化的重要時刻。我們需要結(jié)合未來的發(fā)展對以后的產(chǎn)品布局進行深入的分析,做好頂層架構(gòu),才能擁抱以后的產(chǎn)品格局的變化。
我是醫(yī)藥行業(yè)的產(chǎn)品經(jīng)理,所以在這次演講中主要針對于醫(yī)藥工業(yè)方向進行了主要論述。其中包含醫(yī)藥工業(yè)語言的定義及符號OCR技術(shù),知識圖譜在醫(yī)藥工業(yè)以及藥物情報領(lǐng)域的應(yīng)用等。
對于醫(yī)藥工業(yè)還有很多工作可以去做,在我的演講中也進行了梳理,從早期藥物發(fā)現(xiàn)、上游工藝、下游工藝、生產(chǎn)質(zhì)控等多個方面,還有待于我們?nèi)ヌ剿鳌?/p>
我在這里給大家詳解一下我演講的主要內(nèi)容。
頭像和介紹就不細說了,目前為止沒有出現(xiàn)脫發(fā)的相關(guān)癥狀。
工業(yè)互聯(lián)網(wǎng)的核心在于數(shù)據(jù)采集、數(shù)據(jù)連接、數(shù)據(jù)計算與處理,俗稱端、管、云三大基石。其中“端”主要講的是設(shè)備互聯(lián),“管”主要講的是內(nèi)外互聯(lián),“云”主要強調(diào)的是云計算、邊緣計算等內(nèi)容。
對于藥物研發(fā),很多人會認為藥物研發(fā)高深莫測,其實這些的確離大眾比較遠。產(chǎn)業(yè)互聯(lián)網(wǎng)的興起就是脫離的大眾的認知,將技術(shù)帶入到產(chǎn)業(yè)之中。
本次的主題是醫(yī)藥工業(yè)研發(fā)案例,那自然會有很多醫(yī)藥行業(yè)的知識在其中。具體AI如何能夠?qū)︶t(yī)藥工業(yè)的環(huán)境進行加速,手下我們必須了解都能在哪些地方加速。下圖中詳細的描述了各個應(yīng)用場景中的一些內(nèi)容。
對于沒有醫(yī)藥背景的伙伴,可能理解上稍微困難一些,不過可以體會如何分解具體的工業(yè)環(huán)節(jié)。
首先,我們通過工業(yè)語言的案例進行講解。
工業(yè)語言與我們平時說話是一樣的,只是用在了工業(yè)中的一種交流方式。這種語言形式具有科學(xué)性、行業(yè)性、通用性三個基礎(chǔ)要素。
分子圖像識別案例,可以解釋為一種工業(yè)語言提取技術(shù)。通過AI技術(shù),可以將文獻中的分子式一次性提取出來并達到識別的效果。
這項技術(shù)具有諸多應(yīng)用場景:首先可以對分子結(jié)構(gòu)進行檢索操作,對于專利這類具有法律效力的文件,通過我們的技術(shù)可以一次性獲得該專利的所有保護化合物的保護邊界,極大的節(jié)省了專利分析師的人力成本,提高了效率。
本項目算法分為三個階段:分子位置發(fā)現(xiàn),使用目標(biāo)檢測Mask?RCNN相關(guān)技術(shù)完成;原子與鍵的識別,使用open?CV相關(guān)技術(shù)完成;原子與鍵的表示,使用統(tǒng)計關(guān)系學(xué)習(xí)概率圖方式進行。
其中,化學(xué)式的表示使用MOL文件格式。
馬爾科夫邏輯網(wǎng)絡(luò),在于通過概率的形式將推斷式進行了軟化。這種方法其實就是一種推斷,將推斷的節(jié)點增加,就變?yōu)橐粋€網(wǎng)絡(luò)的形式,也就是概率圖。
第二個案例是我們在工業(yè)知識圖譜方面的項目,工業(yè)知識圖譜最重要的是將與工業(yè)生產(chǎn)中的知識結(jié)構(gòu)化,構(gòu)成知識圖譜的節(jié)點進行推斷。
知識圖譜是當(dāng)前較為流行的AI技術(shù)體系,不過在工業(yè)中運用時,需要明確具體的使用場景,具體哪些環(huán)節(jié)可以用到該技術(shù)。
如下圖,在醫(yī)藥知識檢索、投資標(biāo)地、藥物重定向、臨床路徑評估等過程中,都可以利用知識圖譜的相關(guān)技術(shù)滿足這些需求。
圖譜的構(gòu)建過程大概分為如下圖闡述的幾個步驟:
通常來講,一個企業(yè)有三類數(shù)據(jù)源應(yīng)該參與圖譜的構(gòu)建過程。
- 企業(yè)內(nèi)部數(shù)據(jù):企業(yè)在生產(chǎn)過程中會闡述很多經(jīng)驗性的內(nèi)容數(shù)據(jù),這些數(shù)據(jù)與業(yè)務(wù)結(jié)合緊密,可以作為構(gòu)件圖譜的數(shù)據(jù)源。
- 外部公開數(shù)據(jù):這類數(shù)據(jù)可能是一些知識庫的形式在互聯(lián)網(wǎng)中廣泛存在,比如與行業(yè)相關(guān)的行業(yè)資料,開源數(shù)據(jù)庫等。
- 外部付費數(shù)據(jù):如果企業(yè)有資金可以購買一部分付費數(shù)據(jù),那么這部分數(shù)據(jù)具有非常規(guī)則的數(shù)據(jù)結(jié)構(gòu),可以納入圖譜中進行構(gòu)建。
藥物知識圖譜可以篩選當(dāng)前上市藥物中,哪些藥物對新冠病毒有療效。諸如此類應(yīng)用場景,對整個醫(yī)藥工業(yè)以及全民健康具有深遠的意義,謝謝大家??!
#專欄作家#
白白,公眾號:白白說話(xiaob-talk)。人人都是產(chǎn)品經(jīng)理專欄作家,醫(yī)藥行業(yè)資深產(chǎn)品專家,負責(zé)人工智能行業(yè)類產(chǎn)品綜合架構(gòu)與技術(shù)開發(fā)。在行業(yè)云產(chǎn)品架構(gòu),藥物設(shè)計AI輔助、醫(yī)療知識圖譜等領(lǐng)域有深入研究。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Pexels,基于 CC0 協(xié)議
- 目前還沒評論,等你發(fā)揮!