認(rèn)真用用 AI 翻譯,再聊聊今后的人工翻譯
隨著 ChatGPT的出現(xiàn),各大廠都在布局AI模型。作者在測(cè)評(píng)過(guò)文心一言后,對(duì)其AI翻譯功力進(jìn)行了評(píng)估,并用兩個(gè)實(shí)例來(lái)分析目前的AI在翻譯上面的效果,并聊聊今后的人工翻譯。
大前天(沒(méi)趕上 0 點(diǎn)前發(fā),只好改了時(shí)間)文心一言終于給我發(fā)邀請(qǐng)碼了,我一下午都跟本社讀者群群友沉浸在調(diào)戲國(guó)產(chǎn)大模型的歡樂(lè)之中。但要想寫(xiě)個(gè)角度獨(dú)特的評(píng)測(cè)可不容易,因?yàn)檫@時(shí)已經(jīng)有很多人都評(píng)測(cè)過(guò)了。我會(huì)逐漸梳理清楚之后再寫(xiě)自己的版本。
但至少有一點(diǎn)是明確的:文心一言在翻譯方面的能力——這或許是它現(xiàn)階段表現(xiàn)最好的一種能力了——還是沒(méi)有 GPT 表現(xiàn)得那么穩(wěn)定。這一點(diǎn)很重要,不是說(shuō)好不好,而是沒(méi)有那么穩(wěn)定。也就是說(shuō),偶爾它會(huì)對(duì)某些原文掉鏈子。
我昨天就在翻譯一篇新聞報(bào)道時(shí)遇到了這樣的問(wèn)題,它甚至不舍得給我把 Deloitte 翻譯成德勤。這種情形,如果是在生產(chǎn)環(huán)節(jié),那我是不敢一直用的,最后還要自己上的話,就耽誤事了。
我現(xiàn)在已經(jīng)義無(wú)反顧地完全使用 ChatGPT(只需要 GPT-3.5,不舍得用 GPT-4)來(lái)做翻譯,就像在之前的文章《ChatGPT 對(duì) Grammarly 說(shuō):我干掉你,與你無(wú)關(guān)?》里說(shuō)的那樣。此后我測(cè)試過(guò)很多篇文字,都可以無(wú)條件信任它的結(jié)果。
目前仍有很多人類(lèi)的資深翻譯認(rèn)為,AI 大幅砍掉了人工翻譯的下限,但沒(méi)有定義人工翻譯的上限。最常用的例子是,有一些內(nèi)容涉及到大量本國(guó)的語(yǔ)言以及歷史文化,如果不了解該國(guó)歷史文化,會(huì)喪失很多閱讀時(shí)的樂(lè)趣。對(duì)其的翻譯幾乎相當(dāng)于再次創(chuàng)作。
經(jīng)過(guò)我的多次測(cè)試和實(shí)際使用,我的結(jié)論會(huì)是什么?
我將用兩個(gè)實(shí)例來(lái)解釋。這兩個(gè)實(shí)例都跑在 ChatGPT(GPT-3.5)上,不需要 GPT-4 效果就已經(jīng)足夠好了;而文心一言目前無(wú)法做到同樣的效果。
一、「誰(shuí)是麥太」
我英語(yǔ)學(xué)得其實(shí)沒(méi)有特別好,盡管我在自己的同齡人中比較少見(jiàn)的在學(xué)前班就請(qǐng)了英語(yǔ)家教,但現(xiàn)在還依然是啞巴英語(yǔ),讀和聽(tīng)都湊和,說(shuō)和寫(xiě)就露怯。這也可能是中國(guó)成長(zhǎng)的孩子們的通病吧。但自從谷歌和必應(yīng)翻譯到達(dá)基本可用的水平后,我都會(huì)半蒙半猜地直接閱讀機(jī)翻內(nèi)容。以前為了學(xué)英語(yǔ)我會(huì)逼自己閱讀英文原文,但現(xiàn)在到了用英語(yǔ)的時(shí)候,還是母語(yǔ)思維更為方便。
現(xiàn)在我可以先把上面這段翻譯成英文:
My English proficiency is not particularly good, even though I was one of the few in my age group who had an English tutor before starting preschool. Nevertheless, I still struggle with both speaking and writing, while my reading and listening skills are passable. This may be a common problem among children growing up in China. However, since Google and Bing translations have reached a reasonably usable level, I often read machine-translated content with half-guessing and half-mumbling. In the past, I would force myself to read English originals in order to improve my English, but now, when it comes to using English, my native language thinking is still more convenient.
然后再翻譯回來(lái):
盡管在幼兒園前我就是少數(shù)接受英語(yǔ)家教的同齡人之一,但我的英語(yǔ)水平并不是特別好。盡管如此,我仍然在口語(yǔ)和寫(xiě)作方面有困難,而閱讀和聽(tīng)力技能則勉強(qiáng)可以。這可能是在中國(guó)成長(zhǎng)的孩子普遍存在的問(wèn)題。然而,由于谷歌和必應(yīng)翻譯已經(jīng)達(dá)到了一個(gè)相當(dāng)可用的水平,我經(jīng)常閱讀機(jī)器翻譯的內(nèi)容,有一半是猜測(cè),有一半是咕噥。過(guò)去,我會(huì)強(qiáng)迫自己閱讀英語(yǔ)原著以提高我的英語(yǔ)水平,但現(xiàn)在,當(dāng)涉及到使用英語(yǔ)時(shí),我的母語(yǔ)思維仍然更加方便。
雖然丟失了一部分「醍醐味」的微妙,但作為一種工具溝通完全沒(méi)問(wèn)題了。我想過(guò),如果六七年前我曾有這個(gè)工具,或許那時(shí)我會(huì)直接轉(zhuǎn)為 TechCrunch 總站的撰稿人呢。(我現(xiàn)在也可以試試……)
機(jī)緣巧合,我訂閱了一個(gè)在香港推介 NFT 的人的 Newsletter。最近,他也寫(xiě)到跟 AI 翻譯有關(guān)的內(nèi)容。他開(kāi)頭的一個(gè)觀點(diǎn)跟我想的一樣:
「建議把文章翻譯成英語(yǔ),發(fā)展海外市場(chǎng)。那是既能保持自媒體的純粹,又能增加一個(gè)全新發(fā)展維度的『低垂的果實(shí)』。」
中文世界有很多完全不輸給英文同行的優(yōu)秀寫(xiě)作者以及同樣優(yōu)秀的文字作品,但因?yàn)檎Z(yǔ)言關(guān)系,沒(méi)有被譯介過(guò)去,而只能得到發(fā)展中國(guó)家的評(píng)價(jià)和待遇。打破「次元壁」的最好辦法就是通過(guò)翻譯,而所有在 ChatGPT 之前的翻譯質(zhì)量都會(huì)「差一點(diǎn)點(diǎn)」,或者說(shuō)差了不止一點(diǎn)。
這「差一點(diǎn)點(diǎn)」其中一個(gè)重要的問(wèn)題,就是瞎翻譯專(zhuān)有名詞和人名。英語(yǔ)對(duì)一個(gè)人的稱(chēng)呼,第一次出現(xiàn)的時(shí)候給出全名,此后只叫姓。而漢語(yǔ)的習(xí)慣是每次都用全名或至少只用名,所以谷歌或微軟翻譯就經(jīng)常出現(xiàn)給個(gè)姓隨便套名字的奇觀,比如林鄭特首之前經(jīng)常被翻譯為「林瑞麟」,李家超特首直接就是「李約翰」。
「來(lái)自北京的24歲陳怡寧今年1月在英國(guó)羅漢普頓大學(xué)的畢業(yè)表演視頻出現(xiàn)后,也在網(wǎng)上贏得了數(shù)百萬(wàn)粉絲。正在接受舞蹈實(shí)踐和表演研究生學(xué)位的陳說(shuō),她出于興奮而進(jìn)行了翻轉(zhuǎn),并補(bǔ)充說(shuō)她對(duì)壓倒性的反應(yīng)感到驚訝。回到中國(guó),3月3日,陳婷婷在抖音上上傳了畢業(yè)典禮的視頻片段后,數(shù)百萬(wàn)人為她自信的風(fēng)格鼓掌?!梗ㄎ④浄g)
在很多人用東北話、河南話、閩南話等輪番測(cè)試 AI 之后,這個(gè)人用在香港年輕人之間習(xí)慣使用的廣東話來(lái)測(cè)試 ChatGPT。香港粵語(yǔ)以廣州粵語(yǔ)為正音,但引入了一些對(duì)同一事物的不同翻譯,以及有很多語(yǔ)氣詞、專(zhuān)有名詞是與英語(yǔ)有關(guān)。舉個(gè)例子,麥當(dāng)勞的「麥香魚(yú)」被叫做「魚(yú)柳飽」。所以我把他的例子拿來(lái)又用 GPT-4 測(cè)了一次。
提示點(diǎn):
- 「左膠」在 GPT-3.5 和 4 的翻譯都對(duì)。
- 「弱弱一問(wèn)」的翻譯,Google 和 DeepL 上下文出現(xiàn)的兩次翻譯居然前后不一致。
- 「此地?zé)o銀」的意思應(yīng)該是「我說(shuō)的是與字面相反的意思」。沒(méi)有一家的回答是正確的。
- 「魚(yú)蛋」的標(biāo)準(zhǔn)翻譯是 Fish ball。
由此可見(jiàn),GPT-3.5 已經(jīng)基本可用,而 GPT-4 效果更佳。如果翻譯只是作為工具,目標(biāo)是不影響人與人的交流,那么 GPT-3.5 足矣。
該文作者最后舉了個(gè)例子:
麥嘜漫畫(huà)有這樣一個(gè)小故事。麥太問(wèn)麥兜,為甚麼總是吃很多飯。心地善良的麥兜說(shuō),吃得飯多就有力氣,就可以幫別人打開(kāi)瓶子了。
谷歌翻譯是:
McMug Comics has such a short story. Mai Tai asked McDull why he always eats a lot. The kind-hearted McDull said that if you eat a lot, you will have strength, and you can open bottles for others.
GPT-3.5 翻譯是:
There is a little story in McDull Comics. McDull’s mother asked him why he always eats so much rice. McDull, who has a kind heart, replied that by eating a lot of rice, he would have more strength to help others open bottles.
對(duì)于「麥太」,谷歌翻譯完全不懂,寫(xiě)成「Mai Tai」;DeepL 可以翻譯成不算錯(cuò)誤的「Mrs. Mak」;但 GPT-3.5 可以翻譯成「McDull’s mother」,意味著它的知識(shí)幫它理解了正確的人物關(guān)系。
接下來(lái)是一個(gè)彩蛋。
我:請(qǐng)翻譯下面這段話為英文:灰太狼又被紅太狼拿平底鍋打了!
文心一言:The Wolf of the Gray has been beaten with a frying pan by Red Tooth.
二、「傅雷再造計(jì)劃」
之前人類(lèi)智慧「皇冠上的明珠」被認(rèn)為是國(guó)際象棋或圍棋(后來(lái)的事我們都知道)。與之類(lèi)似的是,在翻譯當(dāng)中,最考驗(yàn)人類(lèi)智慧的,可能是那些玩弄當(dāng)?shù)卣Z(yǔ)言文字特性的「文字游戲」式的寫(xiě)作。
這有點(diǎn)類(lèi)似于現(xiàn)在的網(wǎng)友用「弱智吧」的問(wèn)題去測(cè)試 ChatGPT 或者文心一言。大多數(shù)弱智吧問(wèn)題的本質(zhì),實(shí)際上是考察語(yǔ)言的多義性以及邏輯的連貫。當(dāng)然現(xiàn)有的產(chǎn)品在這方面都不是特別好,但是本地部署一個(gè) GPT 或同類(lèi)的模型,并且進(jìn)行針對(duì)性的優(yōu)化,應(yīng)該很快就可以解決這種問(wèn)題。其實(shí),我甚至可以?xún)H僅在 ChatGPT 里使用自然語(yǔ)言來(lái)教育它如何改正,應(yīng)該針對(duì)性注意語(yǔ)義中哪些雙關(guān)和歧義的演變。那試想如果把整本小雞詞典都喂給它,它還會(huì)怕什么?
——這就是 ChatGPT 和之前所有的機(jī)器翻譯,包括谷歌翻譯或 DeepL 等一個(gè)最大的不同。它要想變換風(fēng)格或者微調(diào)某方面的效果,比此前人類(lèi)創(chuàng)作出的所有翻譯工具都要簡(jiǎn)單。只需要對(duì)它說(shuō)話就行了。
我這段時(shí)間用大量復(fù)雜的自然語(yǔ)言,調(diào)教 ChatGPT 做了很多不同的用途。為了驗(yàn)證我的想法,我準(zhǔn)備用一些法語(yǔ)材料來(lái)形成相對(duì)更「有匠氣」的翻譯,雖然我完全不懂法語(yǔ),只能機(jī)械地復(fù)制粘貼。
但首先我知道一個(gè)非常妙的例子。這就是《約翰·克里斯朵夫》第一句:
Le grondement du fleuve monte derriere la maison.
英譯本是:
From behind the house rises the murmuring of the river.
許聰這樣翻譯:江流滾滾,震動(dòng)了房屋后墻。
韓滬麟這樣翻譯:屋后江河咆哮,向上涌動(dòng)。
而傅雷這樣翻譯:
「江聲浩蕩,自屋后上升?!?/p>
前四個(gè)字就完全把人震住了。這簡(jiǎn)直是中國(guó)翻譯界的傳世經(jīng)典,有人評(píng)價(jià)說(shuō):「傅雷這翻譯,簡(jiǎn)直可以把紙釘在墻上?!?/p>
下面,我讓 GPT-3.5 來(lái)翻譯這段話的法文原文,沒(méi)有給出任何其他的條件。
此處還有一樁公案:據(jù)說(shuō),翻譯家許淵沖曾認(rèn)為,江聲「浩蕩」是誤譯,英譯本的「murmuring」(潺潺聲、低語(yǔ)聲)是正確的譯法。他認(rèn)為法語(yǔ)的 grondement 意思是「沉悶的聲音」。
GPT-3.5 認(rèn)為,「grondement」在法語(yǔ)中的意思是「轟鳴聲」或「隆隆聲」。根據(jù)其他網(wǎng)絡(luò)搜索結(jié)果,「grondement」也被用來(lái)形容諸如火車(chē)駛來(lái)的聲音,各種線索都指向傅雷的翻譯似乎更準(zhǔn)確一些。當(dāng)然,我自己完全不懂法語(yǔ)。
接下來(lái),我使用 prompt 讓 GPT-3.5 自行比對(duì)它的翻譯和人類(lèi)的優(yōu)秀翻譯,指出其中風(fēng)格不同并盡力模仿。
一位中國(guó)翻譯家將這段話翻譯成:「江聲浩蕩,自屋后上升。雨水整天的打在窗上。一層水霧沿著玻璃的裂痕蜿蜒流下?;椟S的天色黑下來(lái)了。室內(nèi)有股悶熱之氣?!?請(qǐng)?jiān)囍诮酉聛?lái)的翻譯中,將語(yǔ)句翻譯成類(lèi)似這樣有匠氣的風(fēng)格。
然后,我用其它經(jīng)典法語(yǔ)小說(shuō)的開(kāi)頭來(lái)測(cè)試:
在此處,我的測(cè)試其實(shí)并不嚴(yán)謹(jǐn)??梢钥吹?GPT-3.5 在翻譯第一個(gè)《洛麗塔》時(shí),還是非常注重文辭修飾的,最終結(jié)果也和人類(lèi)翻譯很接近;但越到后面,它似乎就越是忘記了我對(duì)于「有匠氣」的要求,而回歸到了平常的翻譯水準(zhǔn),當(dāng)然也不差了。
為了節(jié)省精力,我把以上人類(lèi)翻譯范文一起喂給了他,希望他最后生成一段汲取了人類(lèi)翻譯風(fēng)格經(jīng)驗(yàn)教訓(xùn)的譯文。我的 prompt 是:
我將結(jié)合一些優(yōu)秀的人類(lèi)翻譯對(duì)你的翻譯提出改進(jìn)意見(jiàn)。(在這里貼出對(duì)應(yīng)的翻譯段落)如果你可以對(duì)照這幾段人類(lèi)翻譯,和你自己的翻譯之間的區(qū)別,那么請(qǐng)說(shuō)你已經(jīng)準(zhǔn)備好了。我將再給你一些新的內(nèi)容讓你翻譯。
ChatGPT 回復(fù):
非常感謝您的反饋和指導(dǎo)!我會(huì)認(rèn)真學(xué)習(xí)優(yōu)秀的人類(lèi)翻譯,并努力改進(jìn)我的翻譯質(zhì)量。
它又給了幾個(gè)自己的例子來(lái)展示改進(jìn)效果,盡管這意味著它聽(tīng)錯(cuò)了我的指令。
于是我發(fā)布指令:
好的,下面用更像是人類(lèi)翻譯的風(fēng)格來(lái)翻譯這一段:
我選的是 2014 年諾貝爾文學(xué)獎(jiǎng)得主莫迪亞諾的小說(shuō)《暗店街》的開(kāi)頭。《文學(xué)報(bào)》的評(píng)論文章認(rèn)為:
莫迪亞諾的小說(shuō)代表作——《暗店街》的幾個(gè)中譯本有著不同的開(kāi)頭,鑒定譯本的優(yōu)劣,在我看來(lái)只需看看小說(shuō)的開(kāi)頭即可。
這篇評(píng)論緣起于《暗店街》在最新的一個(gè)譯本里更改了開(kāi)頭,讓老讀者很不習(xí)慣。不過(guò)新譯本的編者說(shuō),開(kāi)頭原本的翻譯「我的過(guò)去,一片朦朧」并不是嚴(yán)格對(duì)應(yīng)原文,只能說(shuō)因?yàn)橥跣〔ǖ亩蝹鞑ゲ抛兊媚捴巳丝凇K麄冞x擇的是更忠實(shí)原文的譯本。
那么我們就來(lái)一起欣賞《暗店街》開(kāi)頭的薛立華譯本(舊)、王文融譯本(新)和 GPT-3.5 譯本:
如果僅僅把三篇中譯看作是三篇同題「洗稿」文章,那么 GPT-3.5 的版本顯然支持新譯本的譯法「我什么也不是」,相比之下「我的過(guò)去,一片朦朧」對(duì)原文的改動(dòng)可能過(guò)多。
GPT 有幾處誤譯:「事務(wù)所」沒(méi)有翻譯出來(lái)?!溉榘撞A簟菇o翻譯成了「瓷燈」。「卷宗」變成了「文件夾」。「棕色」是用來(lái)形容頭發(fā)的,它弄成了棕色的眼睛。而且,「面部浮腫、棕色頭發(fā)」同時(shí)用來(lái)形容男子及男子妻子的情夫,應(yīng)該在上下文中保持一致以提起讀者注意。
但 GPT 一個(gè)顯著的特點(diǎn)——我個(gè)人喜歡這種特點(diǎn)——就是語(yǔ)言更簡(jiǎn)練,特別是在前幾句話里可以很明顯地看出來(lái)。如果排除誤譯,我會(huì)更欣賞 GPT 的譯本。
GPT 的另一個(gè)驚喜來(lái)自《洛麗塔》那里,它自作主張把 4 英尺 10 英寸翻譯成了 1 米 48。對(duì)于文中單位的互譯,我覺(jué)得多數(shù)時(shí)候都不應(yīng)該變動(dòng),特別是貨幣單位,就算換成文中時(shí)代的匯率對(duì)于現(xiàn)代讀者也毫無(wú)用處。然而將長(zhǎng)度單位由英制改公制絕對(duì)可以說(shuō)是一項(xiàng)「德政」。這個(gè)或許也應(yīng)該具體問(wèn)題具體分析,但這個(gè)現(xiàn)象說(shuō)明了 GPT 可以了解一些基礎(chǔ)的文化設(shè)定,就像它認(rèn)識(shí)麥兜他媽媽。
因此,在對(duì)復(fù)雜艱深的當(dāng)?shù)卣Z(yǔ)言進(jìn)行「再創(chuàng)作」時(shí),人類(lèi)譯者所需的背景資料,世界觀,該國(guó)文化設(shè)定等等,可以統(tǒng)一扔到大模型里面去訓(xùn)練,然后生成一個(gè)專(zhuān)精于翻譯培訓(xùn)的 bot 給人類(lèi)翻譯人員答疑。
三、結(jié)論
在翻譯香港風(fēng)格的粵語(yǔ)時(shí),ChatGPT 對(duì)一些專(zhuān)有名詞和表述的翻譯都比較成功,至少不會(huì)因?yàn)殄e(cuò)漏翻譯阻礙交流。而且,它對(duì)上下文的理解使得它不會(huì)忘記之前已經(jīng)出現(xiàn)過(guò)的內(nèi)容,進(jìn)一步保證了語(yǔ)義準(zhǔn)確和完整。
這個(gè)結(jié)果證明了我們這些外行和人類(lèi)專(zhuān)業(yè)翻譯共同認(rèn)可的一點(diǎn)——現(xiàn)在的 AI 翻譯可以讓中底層的人類(lèi)翻譯失業(yè)。而對(duì)此引發(fā)的進(jìn)一步后果,有兩種不同的預(yù)測(cè):
- 一種是,因?yàn)槿瞬艛鄬?,新的高?jí)翻譯無(wú)法從中低級(jí)翻譯晉升而來(lái),因此人類(lèi)翻譯將淪為小規(guī)模培訓(xùn)和傳承的類(lèi)似非遺的手藝活,失去自我造血能力。我也基本上傾向于這種預(yù)測(cè)。
- 一種是,人類(lèi)可以跳過(guò)中低級(jí)翻譯的訓(xùn)練,直接從教授高級(jí)別翻譯能力做起,一開(kāi)始做的就是最難的題。這意味著將中低級(jí)翻譯工作和高級(jí)翻譯工作視為兩門(mén)不同的學(xué)科,尚不知道這樣是否可以成功。
從結(jié)果看,似乎在「有匠氣」和有獨(dú)特風(fēng)格方面,第二個(gè)實(shí)驗(yàn)不算成功。ChatGPT 的翻譯雖然不失精準(zhǔn),但仍未能在風(fēng)格化這方面趕超人類(lèi)。
然而,這樣的測(cè)試也讓我看到了用最小化的人力來(lái)補(bǔ)足的希望——這也就意味著專(zhuān)職的人類(lèi)翻譯真正可以休息了。這就是讓擅長(zhǎng)中國(guó)文學(xué)的人,而不是擅長(zhǎng)外語(yǔ)的人成為這部分內(nèi)容的翻譯家。
新時(shí)代的翻譯人士可以完全不會(huì)外語(yǔ)。他們的作用就是把比較平直,但相對(duì)是逐字翻譯的內(nèi)容變得更有文采,負(fù)責(zé)「雅」的部分,然后也可以再喂給 AI 去進(jìn)一步促進(jìn)「信」和「達(dá)」。
其實(shí),這就是那位一輩子不會(huì)說(shuō)外語(yǔ),但是翻譯了 180 多部作品的翻譯家林紓的經(jīng)歷。相信這樣的事情會(huì)在未來(lái)更多次重現(xiàn)。
專(zhuān)欄作家
書(shū)航,微信公眾號(hào):航通社 (ID:lifeissohappy),人人都是產(chǎn)品經(jīng)理專(zhuān)欄作家。提供全原創(chuàng)科技新聞和觀點(diǎn)。為您呈現(xiàn)文字有力、觀點(diǎn)鮮明、打動(dòng)人心的文章。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來(lái)自Pexels,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!