8000字干貨說清楚AI產(chǎn)品經(jīng)理必修的“神經(jīng)網(wǎng)絡”
神經(jīng)網(wǎng)絡就像是一個強大的虛擬大腦,它可以解決許多類型的問題。這篇文章里,作者就總結(jié)了神經(jīng)網(wǎng)絡的概念、技術基本實現(xiàn)原理、應用場景與產(chǎn)品案例等方面的內(nèi)容,一起來看看,或許會對AI產(chǎn)品經(jīng)理們有所幫助。
各位看官:
上一篇文章我們提到了AI中的監(jiān)督學習,監(jiān)督學習屬于機器學習中的一種范式,計算機通過提供已知輸入和對應輸出的訓練數(shù)據(jù),學習輸入與輸出之間的映射關系,以便在面對新的未知輸入時能夠做出準確的預測。如果想了解監(jiān)督學習的更多內(nèi)容,可以翻閱我之前寫的一篇《產(chǎn)品經(jīng)理的獨門技能—AI監(jiān)督學習(6000字干貨)》
在AI人工智能的機器學習中,不僅有監(jiān)督學習,還有神經(jīng)網(wǎng)絡。神經(jīng)網(wǎng)絡是一種起源于 20 世紀 50 年代的監(jiān)督式機器學習模型,它就像一個強大的虛擬大腦,能夠?qū)W習、處理信息,解決各種問題,今天我們就來討論一下神經(jīng)網(wǎng)絡。
本篇會先介紹一下神經(jīng)網(wǎng)絡的基本概念,神經(jīng)網(wǎng)絡是如何傳遞信息的。然后,從神經(jīng)網(wǎng)絡的3大優(yōu)勢出發(fā),強大的學習能力、廣泛的通用性,高效地端到端學習,展開說說為啥神經(jīng)網(wǎng)絡這么火。
說完神經(jīng)網(wǎng)絡的概念和優(yōu)勢之后,我會進一步說明神經(jīng)網(wǎng)絡的技術基本實現(xiàn)原理。從神經(jīng)元,層次結(jié)構,權重,激活函數(shù)這四點入門,來揭開神經(jīng)網(wǎng)絡的“蓋頭”,看其廬山真面目。
接下來,基于神經(jīng)網(wǎng)絡,順帶引出它的高級版本:深度學習,淺聊一下他們之間的關系。后期會有專門的篇章來介紹深度學習,就不在此處展開,本篇重點還是圍繞神經(jīng)網(wǎng)絡。
在第五節(jié),會介紹神經(jīng)網(wǎng)絡在金融、醫(yī)療、電商三大應用場景之下,提供智能風控,智能診斷,個性化推薦等解決方案。
最后,帶著大家簡單體驗一款在神經(jīng)網(wǎng)絡技術上實現(xiàn)落地的產(chǎn)品,網(wǎng)易有道翻譯。它通過自主研發(fā)的神經(jīng)網(wǎng)絡技術,實現(xiàn)了更準確、更自然的翻譯效果,為用戶提供了全新的語言交流體驗。
網(wǎng)易有道翻譯從翻譯這個非常細分垂直,但是又如此普及大眾的使用場景出發(fā),我們不僅看到了神經(jīng)網(wǎng)絡翻譯技術的應用,更見證了它在實際場景中的亮點。我們正身處AI變革的時代,神經(jīng)網(wǎng)絡不再是遙不可及的未來科技,它已經(jīng)深入到我們生活的方方面面,成為推動整體行業(yè)進步的強大引擎。
(附圖:本篇文章結(jié)構導圖,方便大家在閱讀前總攬全局,有大致的畫面框架)
一、神經(jīng)網(wǎng)絡這玩意,其實沒有那么難理解
神經(jīng)網(wǎng)絡這個詞,聽起來很玄乎又高深,我剛開始知道的時候,也是感覺自己知曉了什么神秘魔法似的,AI里面還有神經(jīng)網(wǎng)絡這么厲害的學問啊,但當我深入了解之后,發(fā)現(xiàn)其真相也沒有我想象的那么深奧難懂。
神經(jīng)網(wǎng)絡靈感來源于人腦的神經(jīng)系統(tǒng),是一種模仿人腦神經(jīng)系統(tǒng)結(jié)構和功能的計算模型,模擬了人腦神經(jīng)元之間的連接和信息傳遞,通過訓練數(shù)據(jù)來學習復雜的模式和關系。
神經(jīng)網(wǎng)絡有很多層,它們通過層層的神經(jīng)元連接構建模型,連接傳遞信息,用于解決各種復雜的問題,如圖像識別、語音識別、自然語言處理等。
那么,神經(jīng)網(wǎng)絡是如何傳遞信息的呢?
在神經(jīng)網(wǎng)絡之中,每個神經(jīng)元都有輸入和輸出,它接收一些輸入,通過權重和激活函數(shù)的作用,產(chǎn)生一個輸出。這個輸出可以作為其他神經(jīng)元的輸入,從而形成神經(jīng)元之間的連接。
這些連接的權重決定了信息在網(wǎng)絡中傳播的強度,而激活函數(shù)則決定了神經(jīng)元是否應該被激活并傳遞信息。通過調(diào)整神經(jīng)元之間連接的權重,神經(jīng)網(wǎng)絡可以學習并適應輸入數(shù)據(jù)的模式,在大量數(shù)據(jù)中找到規(guī)律,從而在學習后提供更為準確和有效的輸出。
神經(jīng)網(wǎng)絡分為不同層次,包括輸入層、隱藏層和輸出層。輸入層接收原始數(shù)據(jù),輸出層產(chǎn)生模型的預測或結(jié)果,而隱藏層則在這兩者之間進行信息處理和學習。
關于神經(jīng)元,權重,激活函數(shù)和神經(jīng)網(wǎng)絡的層次結(jié)構,我會在第三節(jié)單獨展開說說,畢竟這部分是神經(jīng)網(wǎng)絡可以如此厲害的“秘密武器”。
二、神經(jīng)網(wǎng)絡這么“火”,因為有以下優(yōu)勢
神經(jīng)網(wǎng)絡像是學霸,像是全能高手,簡直就是一名六邊形戰(zhàn)士,其實,神經(jīng)網(wǎng)絡這么牛也是有原因的。我將從神經(jīng)網(wǎng)絡的優(yōu)勢出發(fā),講述其強大的學習能力、廣泛的通用性、端到端學習的高效性,用盡可能通俗易懂的語言呈現(xiàn)神經(jīng)網(wǎng)絡的亮點優(yōu)勢。
1. 強大的學習能力
神經(jīng)網(wǎng)絡的學習能力很強,神經(jīng)網(wǎng)絡在處理大規(guī)模、高維度數(shù)據(jù)時表現(xiàn)出色,它能夠從海量數(shù)據(jù)中學習復雜的模式和特征,大數(shù)據(jù)就是它愛吃的一道主菜。
AlphaGo就是一個典型例子,AlphaGo通過大量棋局數(shù)據(jù)進行訓練,利用神經(jīng)網(wǎng)絡學會了高級的圍棋策略。在2016年,AlphaGo以4比1戰(zhàn)勝了世界冠軍李世石,展示了神經(jīng)網(wǎng)絡在復雜智力游戲中的非凡學習能力。
2. 廣泛的通用性
神經(jīng)網(wǎng)絡不受限于特定領域,具有廣泛的通用性,在各領域都能發(fā)揮其本領。無論是圖像識別、語音處理還是自然語言處理,神經(jīng)網(wǎng)絡都能夠處理各種類型的數(shù)據(jù)。這種通用性使得神經(jīng)網(wǎng)絡成為解決多領域問題的通用工具。有一說一,這在哪里都“吃得開”的優(yōu)勢,著實令人佩服。
例如,在圖像識別領域,基于卷積神經(jīng)網(wǎng)絡(CNN)的圖像分類模型,能夠在海量圖像中準確識別出不同物體。這項技術在人臉識別、醫(yī)學影像分析等方面都帶來了巨大便利。
3. 端到端學習的高效性
當我們用傳統(tǒng)方法解決問題時,通常需要多個步驟,比如先處理原始數(shù)據(jù)、提取特征,然后再應用模型進行預測,最后根據(jù)預測輸出結(jié)果。
神經(jīng)網(wǎng)絡支持端到端學習,這是一種更簡化的方法,它讓神經(jīng)網(wǎng)絡直接從原始數(shù)據(jù)到最終輸出進行學習,省略了中間許多繁瑣的步驟,無需人為干預。
這種高效性不僅簡化了問題的處理流程,也減輕了人工干預的負擔,使得神經(jīng)網(wǎng)絡在處理實際問題時更為高效。
相信大家對語音識別已經(jīng)不陌生了,神經(jīng)網(wǎng)絡的端到端學習為語音識別模型的發(fā)展帶來了重大突破。通過神經(jīng)網(wǎng)絡,系統(tǒng)能夠直接從聲波信號中學習到語音的表示,避免了過程中復雜的特征工程,比如語音信號的預處理、特征提取、聲學建模、語言模型等。
端到端學習通過使用神經(jīng)網(wǎng)絡,將整個語音識別過程作為一個端到端的模型進行訓練,將輸入的聲音波形映射到相應的文本輸出,直接完成語音到文本的轉(zhuǎn)換。這不僅降低了對專業(yè)知識和人工干預的需求,而且提高了語音識別系統(tǒng)的性能和適應性。
從以上三大優(yōu)勢可以發(fā)現(xiàn),神經(jīng)網(wǎng)絡有強大的學習能力,又不挑食,什么領域都能搞定,還能自動化解決問題,又聰明又省心,試問誰不愛呢?也難怪神經(jīng)網(wǎng)絡這么受人歡迎了。
三、掀起神經(jīng)網(wǎng)絡的“蓋頭”,看看技術實現(xiàn)原理
既然神經(jīng)網(wǎng)絡這么厲害,那我們就不得不去揭秘一下其背后的技術原理啦。照慣例,我們淺淺涉入一下基本原理即可,太深入的話,大腦CPU會燒壞的吧,哈哈。
神經(jīng)網(wǎng)絡聽起來高大上,其實它的實現(xiàn)原理并不復雜。我們可以從神經(jīng)元、層次結(jié)構、權重和激活函數(shù)等方面來看。這部分呼應了第一節(jié)的概念說明,之所以單拎一節(jié)展開詳解,是為了能重點說清楚其工作原理,有基礎的同學可以淺看一下或順便路過哦。
1. 神經(jīng)元:模擬大腦的基本單元
神經(jīng)網(wǎng)絡中的基本單元是神經(jīng)元,這個概念是受到生物學啟發(fā)的,就像大腦中的神經(jīng)元一樣。每個神經(jīng)元接收一些輸入,通過一定的權重進行加權,然后通過激活函數(shù)產(chǎn)生輸出,這個輸出會傳遞到下一層的神經(jīng)元,形成信息的傳遞鏈。
神經(jīng)元的工作原理分四步:接收信息,信息加權,整合與決策、傳遞信息。
【接收信息】:想象一下神經(jīng)元就像是一個小小的信息接收器,它從其他神經(jīng)元或外部輸入接收信息,就像你大腦中的神經(jīng)元通過神經(jīng)突觸傳遞信號一樣。
【信息加權】:接收到的信息并不是平等的,每個輸入都有一個權重。權重就像信息的重要性標志,有些信息可能對神經(jīng)元的決策更有影響。就像我們?nèi)粘L幚硎聞諘r,會考慮輕重緩急,重要緊急的事情相較于不重要不緊急的事情,權重會高很多。
【整合與決策】:神經(jīng)元會將加權的信息匯總,并通過一個激活函數(shù)來做出決策。這個激活函數(shù)就像是神經(jīng)元的思考過程,它決定了神經(jīng)元是否“激活”(發(fā)出信號)或“不激活”(保持靜默)。
【傳遞信息】:如果神經(jīng)元激活了,它會向連接的其他神經(jīng)元傳遞信息,就像一個信息傳遞者。這樣,信息就可以在神經(jīng)網(wǎng)絡中流動,實現(xiàn)復雜的任務和學習過程。
比方說,你可以將神經(jīng)元想象成一個小秘書。她接收來自不同同事的信息,對每個同事的話分配不同的重要性(權重),最后整合這些信息并作出決策。如果決策是積極的,她就會把相關信息傳遞給其他同事。這樣,整個辦公室中的信息可以有效地傳遞和處理,就像神經(jīng)元在神經(jīng)網(wǎng)絡中的作用一樣。
2. 層次結(jié)構:分層處理信息
神經(jīng)網(wǎng)絡通常有多層,分為輸入層、隱藏層和輸出層。輸入層接收外部輸入,比如圖像的像素值。隱藏層對輸入進行處理,提取特征。輸出層產(chǎn)生最終的結(jié)果。每個層都有很多神經(jīng)元,形成了一個層次化的結(jié)構。
如果把神經(jīng)網(wǎng)絡比作一家有分層管理的公司結(jié)構,其工作原理就是這樣的。
【輸入層】:假設有一家公司的員工小A,他工作是收集客戶的信息,這些信息就像是公司的輸入,而小A就處在神經(jīng)網(wǎng)絡中的輸入層。在這一層,信息通過各種通道(特征)進入系統(tǒng)。
【隱藏層】:通常情況下,公司的管理層會有多個負責處理不同任務的團隊。每個團隊都負責公司內(nèi)部的一部分處理工作,但他們的工作對外部來說是不可見的。這就像神經(jīng)網(wǎng)絡中的隱藏層,它在內(nèi)部處理信息,執(zhí)行各種復雜的計算,對外也是不可見的。
【輸出層】:公司最終需要將處理過的信息呈現(xiàn)出來,這就是輸出。管理層的決策通過“輸出層”來完成,就像神經(jīng)網(wǎng)絡中的輸出層將結(jié)果信息傳遞出來一樣。
同理,如果把神經(jīng)網(wǎng)絡的層次結(jié)構比作是電商平臺。輸入層就像是收集了用戶的瀏覽、購買等信息,隱藏層就像是進行了各種復雜的推薦算法和分析,最后輸出層將推薦的商品呈現(xiàn)給用戶。
總之,神經(jīng)網(wǎng)絡的這種分層結(jié)構,有助于更有效地處理和理解復雜的信息。
3. 權重:調(diào)整信息的關鍵
權重是神經(jīng)網(wǎng)絡中非常關鍵的參數(shù),每個連接都有一個權重,這個權重代表了網(wǎng)絡中連接的強度,而強度決定了信號在網(wǎng)絡中傳遞的影響程度。在訓練過程中,神經(jīng)網(wǎng)絡會通過學習調(diào)整這些權重,使其能更好地適應任務。
打個比方,作為一名咖啡深度用戶,每天一杯咖啡代表了一天工作的開始,我就以制作一款咖啡來比喻,說一下權重是如何發(fā)揮作用的。
如果我們想調(diào)制出一款符合自己口味的咖啡,配方中咖啡豆、牛奶和糖的比例,就像神經(jīng)網(wǎng)絡中的不同的連接權重,決定了每個成分對最終咖啡味道的影響程度。
發(fā)現(xiàn)咖啡的味道不夠濃郁,可能會增加咖啡豆的比例,就像在神經(jīng)網(wǎng)絡中增加“咖啡”連接的權重,這會使咖啡豆的影響更大,整體咖啡更濃。反之,如果咖啡太苦,我們可能會減少咖啡豆的比例,減輕其影響,就像在神經(jīng)網(wǎng)絡中減小“咖啡”連接權重。同理,如果喜歡甜一點,就會增加糖的比例,那么神經(jīng)網(wǎng)絡中“糖”連接的權重就會變大,反之亦然。
以調(diào)制咖啡為例,權重就是調(diào)整不同成分比例的關鍵。我們通過調(diào)整每個成分的比例,實現(xiàn)了咖啡味道的優(yōu)化,沖泡出了一杯自己喜歡的咖啡。同樣,神經(jīng)網(wǎng)絡通過調(diào)整連接權重,根據(jù)輸入數(shù)據(jù)的影響程度,優(yōu)化模型對不同輸入的響應,適應不同的任務和數(shù)據(jù),實現(xiàn)豐富的學習和預測功能。
4. 激活函數(shù):引入非線性因素
激活函數(shù)是神經(jīng)元內(nèi)部的一種數(shù)學操作,類似于人腦中神經(jīng)元的激活過程。激活函數(shù)接收神經(jīng)元的輸入,通過一些數(shù)學運算(通常是非線性的)得出一個輸出。這個輸出將決定神經(jīng)元是否激活,并將信息傳遞給網(wǎng)絡的下一層。簡單來說,它決定了神經(jīng)元是否應該“激活”并傳遞信息給其他神經(jīng)元。
如果沒有激活函數(shù),神經(jīng)網(wǎng)絡的每一層都只能執(zhí)行線性變換,多層的線性疊加依然只會得到線性關系。激活函數(shù)的引入使得神經(jīng)網(wǎng)絡能夠?qū)W習和表示更為復雜、非線性的模式和關系。
(也許有人對線性、非線性不太理解,我這里插播說明一下,如果你已知,可以直接略過)
在數(shù)學上,線性函數(shù)關系是可以用直線來表示,而非線性函數(shù)關系往往是非直線的,包括各種曲線、折線、不連續(xù)的線等。在線性關系中,一個變量的變化與另一個變量成正比例關系或反比例關系,而在非線性關系中,一個變量的變化不一定導致另一個變量的等比例變化。
在數(shù)學公式中,y=mx+b,就是線性關系。這種形式的關系圖像在坐標系中是一條直線。
同樣是數(shù)學公式,冪函數(shù)就是非線性關系。其關系圖像在坐標系中是一段曲線。(插播結(jié)束)
我們來舉個例子,便于理解激活函數(shù)的作用。
假設,如果要開發(fā)一款識別貓狗的AI工具,在神經(jīng)網(wǎng)絡中,就需要有一個神經(jīng)元專門負責識別貓耳朵的輪廓,激活函數(shù)就像是這個神經(jīng)元內(nèi)部的決策者,如果圖像中有貓耳朵的形狀,激活函數(shù)就會打開這個“開關”,讓信息傳遞到下一層,表示網(wǎng)絡認為圖像中可能存在貓。如果沒有貓耳朵的形狀,這個“開關”就關閉,信息不傳遞,表示網(wǎng)絡認為圖像中可能不存在貓。
所以,激活函數(shù)的作用就是通過這種開關的機制,讓神經(jīng)網(wǎng)絡能夠更智能地處理各種輸入,做出符合任務要求的決策。比如,幾秒鐘就成功識別出上千萬張圖中是貓還是狗。
四、更高級的神經(jīng)網(wǎng)絡:深度學習
深度學習專注于使用深層神經(jīng)網(wǎng)絡來解決復雜的問題。深度學習的“深度”指的是神經(jīng)網(wǎng)絡的層數(shù),通常包含很多層,使得模型能夠?qū)W到更加抽象和復雜的特征。深度學習的核心思想是通過多層次的非線性變換來提取數(shù)據(jù)的高級表示,從而實現(xiàn)更精確的預測和決策。
想象一下,淺層神經(jīng)網(wǎng)絡就像是簡單的任務處理者,而深層神經(jīng)網(wǎng)絡則是一個層層遞進、能夠理解更復雜信息的學習者。這種層次結(jié)構使得深度學習在處理大規(guī)模數(shù)據(jù)和復雜任務時表現(xiàn)更出色。
我們依舊以計算機識別貓和狗的圖片為例。
在深度學習中,我們會構建一個深層神經(jīng)網(wǎng)絡,這個網(wǎng)絡就像是一堆圖層疊在一起的學習器,每一層負責學習不同層次的特征,比如底層學習貓狗皮毛紋理、中層學習貓狗形狀、高層學習貓狗整體的樣子。通過反復調(diào)整網(wǎng)絡中的權重和參數(shù),計算機能夠逐漸學到貓和狗的區(qū)別,最終達到能夠準確識別的程度。
簡單來說,神經(jīng)網(wǎng)絡是一種計算模型,而深度學習是使用深層神經(jīng)網(wǎng)絡進行機器學習的方法。神經(jīng)網(wǎng)絡是深度學習的基礎,而深度學習則是神經(jīng)網(wǎng)絡發(fā)展的一種更高級、更復雜的形式。
五、神經(jīng)網(wǎng)絡的應用場景
最近幾年,神經(jīng)網(wǎng)絡就像潮流中的明星一樣,各個領域都紛紛圈粉。接下來,我們可以看看這位“明星”在不同應用場景中,分別做出了什么業(yè)績。
1. 金融領域:智能風控助力安全交易
在金融行業(yè),神經(jīng)網(wǎng)絡被廣泛應用于風險管理和欺詐檢測。根據(jù)FTC(美國聯(lián)邦貿(mào)易委員會)的數(shù)據(jù),2021年消費者報告的欺詐損失超過58億美元,比2020年增長了70%以上。
誰都不希望自己辛辛苦苦賺到的錢,因為一次網(wǎng)絡欺詐全打了水漂,可怕的是,只要我們通過網(wǎng)絡進行支付交易,都會面臨這個風險,所以反欺詐真的是非常重要。通過深度學習,神經(jīng)網(wǎng)絡可以分析大量的交易數(shù)據(jù)和用戶行為,識別潛在的風險和異常情況,保障金融系統(tǒng)的安全性。
高級授權(VAA)評分服務是Visa公司的反欺詐產(chǎn)品之一,VAA使用人工智能來評估正在進行的交易是否存在欺詐的可能性,可在300毫秒內(nèi)完成交易的欺詐檢測,幾乎不會影響客戶和商家的在線實時交易,神經(jīng)網(wǎng)絡在其中起到了重要作用。
根據(jù)Visa的報告,從2020年10月到2021年9月,Visa處理了2325億筆支付交易。僅在2021年,VAA就在其網(wǎng)絡上識別并防止了260億美元的欺詐行為。
隨著我們越來越多的財務生活存在于“云”中,真心的希望強大的人工智能可以保護好我們每一位老百姓的辛苦血汗錢。
2. 醫(yī)療領域:智慧輔助診斷
神經(jīng)網(wǎng)絡在醫(yī)療領域的應用為疾病診斷提供了新的思路。通過深度學習,神經(jīng)網(wǎng)絡可以分析醫(yī)學影像,輔助醫(yī)生更準確地診斷病癥。例如,在乳腺癌檢測中,神經(jīng)網(wǎng)絡可以識別微小的腫塊,提高了檢測的靈敏度。
IBM的Watson for Oncology利用神經(jīng)網(wǎng)絡,幫助醫(yī)生制定個性化的癌癥治療方案,根據(jù)大量醫(yī)學文獻和病例數(shù)據(jù),提供更精準的醫(yī)療建議。WFO通過從病歷中獲取有價值的信息,為癌癥患者提供合理的個體化治療方案。
WFO于2016年首次正式登陸中國,湘雅二醫(yī)院腫瘤中心就WFO在宮頸癌的治療幫助上進行了研究。宮頸癌是女性生殖道常見的惡性腫瘤,其發(fā)病率在全世界女性中僅次于乳腺癌,是威脅女性健康和生命的第二大癌癥。
在 300 名宮頸癌患者中,有 246 名患者符合 WFO 分析的條件。在246名患者中,有179名患者的宮頸癌病例,WFO 治療方案與實際臨床實踐總體一致,這個占比達到了72.8%。
有了神經(jīng)網(wǎng)絡的助攻,AI醫(yī)療可以讓越來越多的人因此受益,癌癥也將變得不再可怕。
3. 電商領域:個性化推薦
在個性化推薦系統(tǒng)中,系統(tǒng)收集用戶的行為數(shù)據(jù),包括點擊歷史瀏覽、購買記錄、搜索記錄等,這些數(shù)據(jù)構成神經(jīng)網(wǎng)絡的訓練集,用于學習用戶的行為模式。
接下來,神經(jīng)網(wǎng)絡將用戶的行為數(shù)據(jù)轉(zhuǎn)化為可理解的特征表示,并進行學習和訓練。
然后,根據(jù)用戶的實際反饋(點擊、購買等),系統(tǒng)不斷更新神經(jīng)網(wǎng)絡的參數(shù),對用戶的未知行為進行預測,以提高推薦的準確性和個性化程度。
亞馬遜(AWS)的推薦系統(tǒng)就利用神經(jīng)網(wǎng)絡進行深度學習,對大量用戶數(shù)據(jù)進行分析和學習。其推薦系統(tǒng)每天能夠處理數(shù)十億條數(shù)據(jù),包括用戶的點擊、購買、收藏等多方面的行為,以確保推薦的準確性。
根據(jù)麥肯錫的報告,亞馬遜有超過 35% 的銷售額來自于系統(tǒng)的推薦,AWS呈現(xiàn)在不同用戶面前的就是不同的商品頁面,也就是我們俗稱的“千人千面”。
六、神經(jīng)網(wǎng)絡的產(chǎn)品案例
1. 網(wǎng)易有道:神經(jīng)網(wǎng)絡翻譯技術
神經(jīng)網(wǎng)絡翻譯( Neural Machine Translation,以下簡稱NMT)是一種基于深度學習的機器翻譯方法,通過模擬人腦神經(jīng)元的工作原理,實現(xiàn)對輸入語言到輸出語言的端到端學習。
神經(jīng)網(wǎng)絡翻譯是神經(jīng)網(wǎng)絡在機器翻譯領域的應用,神經(jīng)網(wǎng)絡使得神經(jīng)網(wǎng)絡翻譯在處理大規(guī)模語料庫時能夠?qū)W到更復雜的語言規(guī)律和語境信息,實現(xiàn)準確的自動翻譯。
相較于傳統(tǒng)的機器翻譯方法,NMT更注重上下文的理解,能夠更好地處理句子的結(jié)構和語境,使得翻譯結(jié)果更為自然流暢。
早在2017年4月,網(wǎng)易有道就對外公布稱,由網(wǎng)易公司自主研發(fā)的神經(jīng)網(wǎng)絡翻譯技術(YNMT)正式上線。到了2018年,網(wǎng)易有道進一步采用Transformer作為基礎架構,研發(fā)出更高效的翻譯系統(tǒng)。
2. 神經(jīng)網(wǎng)絡的落地:網(wǎng)易有道翻譯
有道旗下的翻譯產(chǎn)品——網(wǎng)易有道翻譯,就是基于有道神經(jīng)網(wǎng)絡翻譯提供文本翻譯、圖片翻譯、文檔翻譯、網(wǎng)頁翻譯等各種場景的翻譯服務。這幫助我們在跨國交流中,即使不懂對方國家的語言,也可以滿足一些基本交流,至少在全球旅游的這個夢想下,語言障礙已經(jīng)不會排在第一位了。
相信有外語翻譯需求的朋友,對網(wǎng)易有道翻譯這款產(chǎn)品并不陌生,有時候因為工作或生活的需要,我們會瀏覽到國外的網(wǎng)站,不僅是英文,也許我們還會瀏覽到日文、俄文的或者是其他語言的網(wǎng)站。所以,相對準確又快速的翻譯,就顯得尤為重要。
有了YNMT有道神經(jīng)網(wǎng)絡翻譯技術作為基礎,網(wǎng)易有道翻譯這款產(chǎn)品的翻譯能力幾乎可以對標一名有專八水平的大學生,除了能支持109種語言互譯,還能提供42個專業(yè)術語庫或上傳自定義術語庫。用大白話來說,就是懂行,翻譯出的內(nèi)容符合行業(yè)術語要求,也符合專業(yè)場景下的語境要求。
目前能直觀地看到,官方推薦的術語庫就有材料科學、測繪科學技術、地球科學、電子、通信與自動控制技術、動力與電氣工程、法學、紡織科學技術、管理學、航空、航天科學技術、化學、環(huán)境科學技術、機械工程、計算機科學技術、交通運輸工程等等。
同時,我們在翻譯時,還可以根據(jù)具體的使用場景,比如醫(yī)學、計算機、金融經(jīng)濟,提供更符合語境的翻譯結(jié)果。
就在今年的4月份,網(wǎng)易有道翻譯升級至最新的V10.0.0版本,覆蓋10種翻譯場景,包含文本、文檔、圖片、音頻、視頻、同傳翻譯等,支持10種文檔格式,已開放每年240萬免費翻譯字符,雖然部分功能需要付費使用,比如音頻翻譯和同傳翻譯只能免費試用20分鐘,AI BOX智能潤色功能(支持句子、段落潤色,文章糾錯)也只能免費試用10次,但如果是基本翻譯需求,也已經(jīng)夠用了。
3. 從網(wǎng)易有道翻譯中看到NMT的亮點
當我們在知曉神經(jīng)網(wǎng)絡的原理之后,基于一定的AI知識儲備去體驗一款真實的產(chǎn)品,就像在知道魔術原理的背景下去看一場魔術表演,其中神奇又玄幻的部分,就不會覺得那么神秘了。
從網(wǎng)易有道翻譯這款產(chǎn)品出發(fā),我們能看到神經(jīng)網(wǎng)絡翻譯技術的特點。
【多語言支持】:網(wǎng)易有道翻譯借助神經(jīng)網(wǎng)絡翻譯技術,實現(xiàn)了對多語言的支持,支持109種語言互譯,可以說幾乎滿足了全球各個國家的語言溝通。
【上下文理解】:神經(jīng)網(wǎng)絡翻譯技術通過深度學習模型對大量語料進行訓練,能夠更好地理解句子的上下文關系。
這種能力使得翻譯系統(tǒng)能更好地把握文章或?qū)υ挼恼w語境,產(chǎn)生更連貫、自然的翻譯結(jié)果,讓用戶獲得更符合實際語言使用情境的譯文,而不是簡單地對獨立的句子進行翻譯。
【專業(yè)詞匯處理】:通過深度學習,網(wǎng)易有道翻譯產(chǎn)品可以處理各行業(yè)專業(yè)術語,翻譯的結(jié)果也會更精準、可靠。
比如支持材料科學、測繪科學技術、地球科學、動力與電氣工程、管理學、航空、航天科學技術等等術語庫。
【用戶體驗更棒】:神經(jīng)網(wǎng)絡翻譯技術在保持高準確性的同時,模型也強調(diào)翻譯的自然度,使得譯文更貼近人類語言表達習慣,為用戶提供更流暢、易懂的翻譯體驗。
有道AIBox(beta版)就在這個點上進行發(fā)力,YNMT模型支持的個性化體驗可以提供更符合用戶口感的翻譯結(jié)果,提高語言使用的舒適度,AI潤色后的翻譯內(nèi)容更懂人性。
4. 新功能亮相:更專業(yè)的AI翻譯
網(wǎng)易有道翻譯網(wǎng)頁版有新出一款新版的AI 翻譯,提供母語級高精AI翻譯,并支持繼續(xù)潤色及語法分析等功能。
中華文化博大精深,既然適合咱們中文母語,不知道翻譯一首李白的《將進酒》,效果如何?
于是,我將詩句輸入文本框,點擊“AI翻譯”,等待了幾秒的“文本生成中”,它給了我一段譯文,譯文如圖,大家覺得翻譯效果如何哈?
如果我試著將這段英文,再讓AI翻譯成中文,并且要求AI潤色一下,會是什么結(jié)果呢?帶著好奇心,我將AI翻譯好的英文復制進了文本框,再次點擊AI翻譯后,看到了英譯中的結(jié)果。
如圖可見,從語言的對仗、韻律、文字修辭,用詞精準達意,情感抒發(fā)等各方面看,還是咱李白的原詩更勝一籌哈。
接下來,我選擇了AI潤色,既然是一首詩,試試將句子潤色得更華麗,AI會給我什么結(jié)果呢?選擇“句子潤色-更華麗”,我看到了如圖回復,不知道看到此處的你,有什么新的靈感呢?
感受一下帶著文學才氣的AI翻譯之后, 再體驗一把論文翻譯的功能,arXiv論文翻譯功能支持arXiv論文摘要頁面鏈接、arXiv論文pdf下載鏈接、論文其他格式源下載鏈接或使用chrome打開的論文pdf鏈接。從結(jié)果看,翻譯內(nèi)容還是不錯的。從體驗看,雙語對照還是很貼心的。
其實,無論是多國語言翻譯,多場景翻譯,多術語庫支持,還是AI翻譯,網(wǎng)頁翻譯,論文翻譯等等。底層都是基于神經(jīng)網(wǎng)絡翻譯技術來實現(xiàn)的,它就在我們接觸的AI產(chǎn)品的界面背后,我們看不到、摸不著,卻又在每一次觸發(fā)翻譯時,都需要調(diào)用它。
未來,神經(jīng)網(wǎng)絡翻譯將更注重實時交互翻譯的能力。在翻譯領域,我們可以期待更快速、準確的實時翻譯,語言將不再是溝通的障礙,也許那時候,我們就不需要學外語了。無論是國際會議、日常旅游、還是商務洽談等場景下,靠AI就能實現(xiàn)無障礙跨國交流了,或許那時候,AI翻譯的結(jié)果比我們自己直接翻譯要更貼合語境,更快更準確呢。
本文由 @果釀 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于CC0協(xié)議。
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。
不錯,通俗易懂