電網(wǎng)行業(yè),如何應(yīng)用自然語言理解技術(shù)?
本文分享了智能電網(wǎng)的發(fā)展現(xiàn)狀與未來趨勢,并且具體講解了自然語言理解技術(shù)在電網(wǎng)行業(yè)中的應(yīng)用。
電力網(wǎng)(電網(wǎng))是高效快捷的能源輸送通道和優(yōu)化配置平臺,是能源電力可持續(xù)發(fā)展的關(guān)鍵環(huán)節(jié)。在現(xiàn)代能源供應(yīng)體系中,電網(wǎng)發(fā)揮著重要的樞紐作用,關(guān)系國家能源安全。2010年以來,國家電網(wǎng)的規(guī)模增長近一倍,保障了經(jīng)濟(jì)社會發(fā)展對能源電力的需求。
隨著人工智能技術(shù)的快速發(fā)展,機(jī)器智能的優(yōu)勢正逐漸深入各行各業(yè)。本文將聚焦中國市場,談?wù)勛匀徽Z言理解技術(shù)在電網(wǎng)行業(yè)當(dāng)中的應(yīng)用現(xiàn)狀與發(fā)展前景。
自然語言處理(NLP)技術(shù)旨在研究通過計(jì)算機(jī)設(shè)備理解,處理,應(yīng)用人類的語言文本信息內(nèi)容,是人工智能研究領(lǐng)域中最為典型也最具挑戰(zhàn)的一個部分。
目前,國家電網(wǎng)正在試圖將NLP技術(shù)運(yùn)用到電網(wǎng)相關(guān)的服務(wù)工作當(dāng)中,通過技術(shù)的力量,加速電網(wǎng)行業(yè)的發(fā)展。
智能電網(wǎng)泛指借助人工智能技術(shù)實(shí)現(xiàn)的智能化電網(wǎng)。它基于集成的高速雙向通信網(wǎng)絡(luò),通過先進(jìn)的控制方法和先進(jìn)決策支持系統(tǒng)技術(shù)的應(yīng)用,以可實(shí)現(xiàn)更可靠,更安全,更高效,為目的的電網(wǎng)服務(wù)。從而保障了廣大用戶額電能質(zhì)量,推動電力市場的發(fā)展。
通過文本閱讀理解,文本相似度計(jì)算,知識圖譜等技術(shù),在項(xiàng)目招標(biāo),檢測預(yù)警,維護(hù)修理,以及渠道客戶等電網(wǎng)業(yè)務(wù)的應(yīng)用場景當(dāng)中落地。提升電網(wǎng)業(yè)務(wù)的工作效率,造福廣大人民群眾。
01 市場規(guī)模與發(fā)展趨勢
2005年以來,智能電網(wǎng)的關(guān)注度不斷提升,這是現(xiàn)代電力系統(tǒng)日益復(fù)雜的體現(xiàn)。智能電網(wǎng)的概念是科研技術(shù)、解決方案,以及政策和監(jiān)管機(jī)制的合集。未來幾年,新能源裝機(jī)和發(fā)電量占比的提升將是一個必然的趨勢,電網(wǎng)將圍繞著清潔能源,進(jìn)行系統(tǒng)化的投資升級。另一方面,中東部地區(qū)興起的大量間歇性分布式電源并網(wǎng)也需要智能配電網(wǎng)絡(luò)的支撐。
我國智能電網(wǎng)市場的需求方主要是國家電網(wǎng),南方電網(wǎng),以及地方供電局和一些地方電力公司。目前,市場上有能力提供較為全面的智能電網(wǎng)解決方案的供應(yīng)商還十分有限,但是,我們也看到絕大多數(shù)企業(yè)都已經(jīng)開始在某個或多個細(xì)分領(lǐng)域逐步展開智能化的戰(zhàn)略部署。
數(shù)據(jù)來源:國家電網(wǎng) 前瞻產(chǎn)業(yè)研究院
02 相關(guān)技術(shù)介紹
文本信息抽取
文本信息抽取主要是結(jié)合機(jī)器閱讀理解,通過訓(xùn)練Word2vec模型,將文本數(shù)據(jù)中有效的信息識別出來,實(shí)現(xiàn)自動從文本數(shù)據(jù)中識別并提取關(guān)鍵信息內(nèi)容的功能。
文本信息抽取的技術(shù)可以應(yīng)用于電網(wǎng)招標(biāo)文檔數(shù)據(jù)的結(jié)構(gòu)化存儲,便于招標(biāo)文檔的聚類和整理。同時也適用于電網(wǎng)企業(yè)說明文檔的檢測警報等任務(wù)。
文檔相似度分析
文檔相似度分析是依賴文字內(nèi)容語義相似度計(jì)算的技術(shù)實(shí)現(xiàn)的一種典型NLP任務(wù),一般用于信息檢索和知識問答的模糊匹配。
這項(xiàng)技術(shù)正嘗試被運(yùn)用于電網(wǎng)維修行業(yè),維修人員可以通過提問,或關(guān)鍵字/詞搜索的方式對信息量龐大的電網(wǎng)維修說明文檔進(jìn)行快速的檢索,系統(tǒng)可以找到精準(zhǔn)的相關(guān)內(nèi)容,并生成說明內(nèi)容返回給為維修人員。
知識圖譜
知識圖譜是指包含不同實(shí)體之間的信息和語義關(guān)聯(lián)的知識庫,能夠有效的將系統(tǒng)當(dāng)中的知識類信息進(jìn)行整理與關(guān)聯(lián),從而實(shí)現(xiàn)信息數(shù)據(jù)的相互聯(lián)結(jié)與溝通。
針對包含專業(yè)技術(shù)和知識類文本數(shù)據(jù)組建圖數(shù)據(jù)庫,從而實(shí)現(xiàn)復(fù)雜的檢索功能和智能輔助決策的功能。
通過圖數(shù)據(jù)庫提升文本信息的檢索質(zhì)量,可有效的運(yùn)用于電網(wǎng)管理監(jiān)控,電網(wǎng)知識類智能問答客服等場景。
情感識別
感情識別技術(shù)指的是通過對工作業(yè)務(wù)當(dāng)中對話內(nèi)容信息的聚類和理解,識別用戶在對話內(nèi)容中所表達(dá)的情感信息的技術(shù)。
感情識別技術(shù)主要依靠長期短期記憶(LSTM)算法,對相關(guān)業(yè)務(wù)對話語料的上下文信息進(jìn)行深層理解,結(jié)合對話當(dāng)中的語境信息,判斷對話內(nèi)容中所表達(dá)的情緒正負(fù)極,進(jìn)而理解對話內(nèi)容的話題與意圖。
03 應(yīng)用分布與產(chǎn)品案例
電網(wǎng)檢測警報
(江蘇電網(wǎng)與河海大學(xué))傳統(tǒng)的電網(wǎng)檢測警報無法對在短時間內(nèi)對發(fā)生的警報事件做出準(zhǔn)確的判斷。鑒于目前監(jiān)測報警信息效率低的現(xiàn)狀,人工智能技術(shù)為電網(wǎng)業(yè)務(wù)提供了有效的解決方案。
首先,通過NLP技術(shù)對報警信息文本的特征進(jìn)行分析和整理,并做好預(yù)處理工作。
之后,基于Word2vec模型對監(jiān)視警報信息進(jìn)行矢量化。
最后,針對報警信息的特點(diǎn),建立了基于LSTM和CNN組合的監(jiān)控報警事件識別模型。該模型可以通過與多種識別模型的比較,以驗(yàn)證本文方法的可行性和有效性。
智能電網(wǎng)檢修問答系統(tǒng)
(南方電網(wǎng)與薄言科技)通過機(jī)器閱讀理解技術(shù)將電網(wǎng)安規(guī)的文檔進(jìn)行讀取和分析,然后為文檔中的段落創(chuàng)建索引。
當(dāng)電網(wǎng)維修人員向系統(tǒng)提問后,系統(tǒng)會先在索引里搜索相關(guān)段落,再從找到的段落中讀出問題答案系統(tǒng)依賴bert 模型預(yù)測出來文章當(dāng)中哪一段能回答這個問題的概率最高。(學(xué)術(shù)的閱讀理解數(shù)據(jù)集上,人能做到86.8, 最好的模型做到88.6了)。
搜索返回的是段落,系統(tǒng)將段落內(nèi)容轉(zhuǎn)精煉成回答短語,也就是說,系統(tǒng)會先理解文本內(nèi)容,之后再抽取原文的一部分內(nèi)容作為答案輸出,返回給維修人員。
電網(wǎng)維修人員可以通過自然語言交互的方式快速查閱電網(wǎng)維修文檔,從而有效提升電網(wǎng)維修任務(wù)的工作效率。
智能電網(wǎng)招標(biāo)資料查重系統(tǒng)
(國網(wǎng)江蘇省電力公司電力科學(xué)研究院)電網(wǎng)公司在項(xiàng)目招標(biāo)采購過程中, 一般要對招標(biāo)資料進(jìn)行查重工作,在歷史項(xiàng)目資料庫中查找是否存在類似項(xiàng)目,以防止項(xiàng)目重復(fù)招標(biāo)的情況發(fā)生,避免資金浪費(fèi)。
使用潛在語義索引的方法, 對文檔中的語義進(jìn)行分析。使用NLP領(lǐng)域的中文分詞、詞向量轉(zhuǎn)換、詞權(quán)重計(jì)算、主題建模等技術(shù)構(gòu)建一套文檔相似度分析系統(tǒng)。該系統(tǒng)可在海量歷史項(xiàng)目資料庫中快速找出與目標(biāo)文檔相似的項(xiàng)目,并計(jì)算出文檔相似度百分比,輔助招標(biāo)采購專職工作人員判斷招標(biāo)資料是否合規(guī)。系統(tǒng)的研究與應(yīng)用,對規(guī)范電網(wǎng)公司項(xiàng)目招標(biāo)采購管理具有重要的實(shí)用價值。
局限性與發(fā)展趨勢
NLP技術(shù)在電網(wǎng)行業(yè)當(dāng)中的應(yīng)用才剛剛起步,大多數(shù)案例還處于實(shí)驗(yàn)和探索階段。當(dāng)前,真正在實(shí)際場景中落地的項(xiàng)目非常有限,相關(guān)的進(jìn)展主要來自科研高校以及科技公司的POC項(xiàng)目當(dāng)中。這些項(xiàng)目當(dāng)中的數(shù)據(jù)多為實(shí)驗(yàn)數(shù)據(jù),缺乏一定的客觀性和普適性。從目前的發(fā)展現(xiàn)狀來看,電網(wǎng)行業(yè)中數(shù)據(jù)的獲取和整理將會是一個較大的挑戰(zhàn)。
電網(wǎng)領(lǐng)域的內(nèi)容具有一定的專業(yè)性,且需要進(jìn)行大量有效的人工標(biāo)注才能訓(xùn)練出一個有效的模型。
此外,電網(wǎng)公司是比較傳統(tǒng)的能源類企業(yè),其工作方式以及工作系統(tǒng)已經(jīng)形成體系。因此,相對于其他行業(yè)來說,電網(wǎng)業(yè)務(wù)智能化的成本更大,門檻更高。短期之內(nèi),NLP技術(shù)在電網(wǎng)行業(yè)中的應(yīng)用依然是以協(xié)助人類工作為目的,而這同樣需要相關(guān)從業(yè)人員接受并掌握新的工作形式與模式。
事實(shí)上,中國國家電網(wǎng)和南方電網(wǎng)等行業(yè)領(lǐng)頭者已經(jīng)在積極的與多家科技公司和院校實(shí)驗(yàn)室進(jìn)行合作,共同探索人工智能技術(shù)在電網(wǎng)電力領(lǐng)域的應(yīng)用,旨在推動電網(wǎng)電力智能化的戰(zhàn)略方針,更好的服務(wù)于百姓。未來,將會有更多電網(wǎng)業(yè)務(wù)相關(guān)的數(shù)據(jù)被挖掘和記錄,NLP技術(shù)的主要應(yīng)用場景將不再僅僅是輔助業(yè)務(wù)的智能客服中心。屆時,智能技術(shù)將會進(jìn)一步的深入到電網(wǎng)相關(guān)業(yè)務(wù)具體的管理檢測和維護(hù)當(dāng)中。
本文由 @單師傅?原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 Unsplash ,基于 CC0 協(xié)議
電科院還是算了吧~