91精品日本久久久久久牛牛,国产aⅴ夜夜欢一区二区三区

搜索

APP

起點課堂會員權益

職業(yè)體系課特權

線下行業(yè)大會特權

個人IP打造特權

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業(yè)技能直播

會員專屬社群

榮耀標識

開通會員

發(fā)布

注冊 | 登錄

認真用用 AI 翻譯，再聊聊今后的人工翻譯

航通社

2023-03-23

0 評論 5304 瀏覽 4 收藏

隨著 ChatGPT的出現，各大廠都在布局AI模型。作者在測評過文心一言后，對其AI翻譯功力進行了評估，并用兩個實例來分析目前的AI在翻譯上面的效果，并聊聊今后的人工翻譯。

大前天（沒趕上 0 點前發(fā)，只好改了時間）文心一言終于給我發(fā)邀請碼了，我一下午都跟本社讀者群群友沉浸在調戲國產大模型的歡樂之中。但要想寫個角度獨特的評測可不容易，因為這時已經有很多人都評測過了。我會逐漸梳理清楚之后再寫自己的版本。

但至少有一點是明確的：文心一言在翻譯方面的能力——這或許是它現階段表現最好的一種能力了——還是沒有 GPT 表現得那么穩(wěn)定。這一點很重要，不是說好不好，而是沒有那么穩(wěn)定。也就是說，偶爾它會對某些原文掉鏈子。

我昨天就在翻譯一篇新聞報道時遇到了這樣的問題，它甚至不舍得給我把 Deloitte 翻譯成德勤。這種情形，如果是在生產環(huán)節(jié)，那我是不敢一直用的，最后還要自己上的話，就耽誤事了。

我現在已經義無反顧地完全使用 ChatGPT（只需要 GPT-3.5，不舍得用 GPT-4）來做翻譯，就像在之前的文章《ChatGPT 對 Grammarly 說：我干掉你，與你無關？》里說的那樣。此后我測試過很多篇文字，都可以無條件信任它的結果。

目前仍有很多人類的資深翻譯認為，AI 大幅砍掉了人工翻譯的下限，但沒有定義人工翻譯的上限。最常用的例子是，有一些內容涉及到大量本國的語言以及歷史文化，如果不了解該國歷史文化，會喪失很多閱讀時的樂趣。對其的翻譯幾乎相當于再次創(chuàng)作。

經過我的多次測試和實際使用，我的結論會是什么？

我將用兩個實例來解釋。這兩個實例都跑在 ChatGPT（GPT-3.5）上，不需要 GPT-4 效果就已經足夠好了；而文心一言目前無法做到同樣的效果。

一、「誰是麥太」

我英語學得其實沒有特別好，盡管我在自己的同齡人中比較少見的在學前班就請了英語家教，但現在還依然是啞巴英語，讀和聽都湊和，說和寫就露怯。這也可能是中國成長的孩子們的通病吧。但自從谷歌和必應翻譯到達基本可用的水平后，我都會半蒙半猜地直接閱讀機翻內容。以前為了學英語我會逼自己閱讀英文原文，但現在到了用英語的時候，還是母語思維更為方便。

現在我可以先把上面這段翻譯成英文：

My English proficiency is not particularly good, even though I was one of the few in my age group who had an English tutor before starting preschool. Nevertheless, I still struggle with both speaking and writing, while my reading and listening skills are passable. This may be a common problem among children growing up in China. However, since Google and Bing translations have reached a reasonably usable level, I often read machine-translated content with half-guessing and half-mumbling. In the past, I would force myself to read English originals in order to improve my English, but now, when it comes to using English, my native language thinking is still more convenient.

然后再翻譯回來：

盡管在幼兒園前我就是少數接受英語家教的同齡人之一，但我的英語水平并不是特別好。盡管如此，我仍然在口語和寫作方面有困難，而閱讀和聽力技能則勉強可以。這可能是在中國成長的孩子普遍存在的問題。然而，由于谷歌和必應翻譯已經達到了一個相當可用的水平，我經常閱讀機器翻譯的內容，有一半是猜測，有一半是咕噥。過去，我會強迫自己閱讀英語原著以提高我的英語水平，但現在，當涉及到使用英語時，我的母語思維仍然更加方便。

雖然丟失了一部分「醍醐味」的微妙，但作為一種工具溝通完全沒問題了。我想過，如果六七年前我曾有這個工具，或許那時我會直接轉為 TechCrunch 總站的撰稿人呢。（我現在也可以試試……）

機緣巧合，我訂閱了一個在香港推介 NFT 的人的 Newsletter。最近，他也寫到跟 AI 翻譯有關的內容。他開頭的一個觀點跟我想的一樣：

「建議把文章翻譯成英語，發(fā)展海外市場。那是既能保持自媒體的純粹，又能增加一個全新發(fā)展維度的『低垂的果實』?！?/p>

中文世界有很多完全不輸給英文同行的優(yōu)秀寫作者以及同樣優(yōu)秀的文字作品，但因為語言關系，沒有被譯介過去，而只能得到發(fā)展中國家的評價和待遇。打破「次元壁」的最好辦法就是通過翻譯，而所有在 ChatGPT 之前的翻譯質量都會「差一點點」，或者說差了不止一點。

這「差一點點」其中一個重要的問題，就是瞎翻譯專有名詞和人名。英語對一個人的稱呼，第一次出現的時候給出全名，此后只叫姓。而漢語的習慣是每次都用全名或至少只用名，所以谷歌或微軟翻譯就經常出現給個姓隨便套名字的奇觀，比如林鄭特首之前經常被翻譯為「林瑞麟」，李家超特首直接就是「李約翰」。

「來自北京的24歲陳怡寧今年1月在英國羅漢普頓大學的畢業(yè)表演視頻出現后，也在網上贏得了數百萬粉絲。正在接受舞蹈實踐和表演研究生學位的陳說，她出于興奮而進行了翻轉，并補充說她對壓倒性的反應感到驚訝?；氐街袊?月3日，陳婷婷在抖音上上傳了畢業(yè)典禮的視頻片段后，數百萬人為她自信的風格鼓掌。」（微軟翻譯）

在很多人用東北話、河南話、閩南話等輪番測試 AI 之后，這個人用在香港年輕人之間習慣使用的廣東話來測試 ChatGPT。香港粵語以廣州粵語為正音，但引入了一些對同一事物的不同翻譯，以及有很多語氣詞、專有名詞是與英語有關。舉個例子，麥當勞的「麥香魚」被叫做「魚柳飽」。所以我把他的例子拿來又用 GPT-4 測了一次。

提示點：

「左膠」在 GPT-3.5 和 4 的翻譯都對。
「弱弱一問」的翻譯，Google 和 DeepL 上下文出現的兩次翻譯居然前后不一致。
「此地無銀」的意思應該是「我說的是與字面相反的意思」。沒有一家的回答是正確的。
「魚蛋」的標準翻譯是 Fish ball。

由此可見，GPT-3.5 已經基本可用，而 GPT-4 效果更佳。如果翻譯只是作為工具，目標是不影響人與人的交流，那么 GPT-3.5 足矣。

該文作者最后舉了個例子：

麥嘜漫畫有這樣一個小故事。麥太問麥兜，為甚麼總是吃很多飯。心地善良的麥兜說，吃得飯多就有力氣，就可以幫別人打開瓶子了。

谷歌翻譯是：

McMug Comics has such a short story. Mai Tai asked McDull why he always eats a lot. The kind-hearted McDull said that if you eat a lot, you will have strength, and you can open bottles for others.

GPT-3.5 翻譯是：

There is a little story in McDull Comics. McDull’s mother asked him why he always eats so much rice. McDull, who has a kind heart, replied that by eating a lot of rice, he would have more strength to help others open bottles.

對于「麥太」，谷歌翻譯完全不懂，寫成「Mai Tai」；DeepL 可以翻譯成不算錯誤的「Mrs. Mak」；但 GPT-3.5 可以翻譯成「McDull’s mother」，意味著它的知識幫它理解了正確的人物關系。

接下來是一個彩蛋。

我：請翻譯下面這段話為英文：灰太狼又被紅太狼拿平底鍋打了！

文心一言：The Wolf of the Gray has been beaten with a frying pan by Red Tooth.

二、「傅雷再造計劃」

之前人類智慧「皇冠上的明珠」被認為是國際象棋或圍棋（后來的事我們都知道）。與之類似的是，在翻譯當中，最考驗人類智慧的，可能是那些玩弄當地語言文字特性的「文字游戲」式的寫作。

這有點類似于現在的網友用「弱智吧」的問題去測試 ChatGPT 或者文心一言。大多數弱智吧問題的本質，實際上是考察語言的多義性以及邏輯的連貫。當然現有的產品在這方面都不是特別好，但是本地部署一個 GPT 或同類的模型，并且進行針對性的優(yōu)化，應該很快就可以解決這種問題。其實，我甚至可以僅僅在 ChatGPT 里使用自然語言來教育它如何改正，應該針對性注意語義中哪些雙關和歧義的演變。那試想如果把整本小雞詞典都喂給它，它還會怕什么？

——這就是 ChatGPT 和之前所有的機器翻譯，包括谷歌翻譯或 DeepL 等一個最大的不同。它要想變換風格或者微調某方面的效果，比此前人類創(chuàng)作出的所有翻譯工具都要簡單。只需要對它說話就行了。

我這段時間用大量復雜的自然語言，調教 ChatGPT 做了很多不同的用途。為了驗證我的想法，我準備用一些法語材料來形成相對更「有匠氣」的翻譯，雖然我完全不懂法語，只能機械地復制粘貼。

但首先我知道一個非常妙的例子。這就是《約翰·克里斯朵夫》第一句：

Le grondement du fleuve monte derriere la maison.

英譯本是：

From behind the house rises the murmuring of the river.

許聰這樣翻譯：江流滾滾，震動了房屋后墻。

韓滬麟這樣翻譯：屋后江河咆哮，向上涌動。

而傅雷這樣翻譯：

「江聲浩蕩，自屋后上升。」

前四個字就完全把人震住了。這簡直是中國翻譯界的傳世經典，有人評價說：「傅雷這翻譯，簡直可以把紙釘在墻上?！?/p>

下面，我讓 GPT-3.5 來翻譯這段話的法文原文，沒有給出任何其他的條件。

此處還有一樁公案：據說，翻譯家許淵沖曾認為，江聲「浩蕩」是誤譯，英譯本的「murmuring」（潺潺聲、低語聲）是正確的譯法。他認為法語的 grondement 意思是「沉悶的聲音」。

GPT-3.5 認為，「grondement」在法語中的意思是「轟鳴聲」或「隆隆聲」。根據其他網絡搜索結果，「grondement」也被用來形容諸如火車駛來的聲音，各種線索都指向傅雷的翻譯似乎更準確一些。當然，我自己完全不懂法語。

接下來，我使用 prompt 讓 GPT-3.5 自行比對它的翻譯和人類的優(yōu)秀翻譯，指出其中風格不同并盡力模仿。

一位中國翻譯家將這段話翻譯成：「江聲浩蕩，自屋后上升。雨水整天的打在窗上。一層水霧沿著玻璃的裂痕蜿蜒流下。昏黃的天色黑下來了。室內有股悶熱之氣?！?請試著在接下來的翻譯中，將語句翻譯成類似這樣有匠氣的風格。

然后，我用其它經典法語小說的開頭來測試：

在此處，我的測試其實并不嚴謹。可以看到 GPT-3.5 在翻譯第一個《洛麗塔》時，還是非常注重文辭修飾的，最終結果也和人類翻譯很接近；但越到后面，它似乎就越是忘記了我對于「有匠氣」的要求，而回歸到了平常的翻譯水準，當然也不差了。

為了節(jié)省精力，我把以上人類翻譯范文一起喂給了他，希望他最后生成一段汲取了人類翻譯風格經驗教訓的譯文。我的 prompt 是：

我將結合一些優(yōu)秀的人類翻譯對你的翻譯提出改進意見。（在這里貼出對應的翻譯段落）如果你可以對照這幾段人類翻譯，和你自己的翻譯之間的區(qū)別，那么請說你已經準備好了。我將再給你一些新的內容讓你翻譯。

ChatGPT 回復：

非常感謝您的反饋和指導！我會認真學習優(yōu)秀的人類翻譯，并努力改進我的翻譯質量。

它又給了幾個自己的例子來展示改進效果，盡管這意味著它聽錯了我的指令。

于是我發(fā)布指令：

好的，下面用更像是人類翻譯的風格來翻譯這一段：

我選的是 2014 年諾貝爾文學獎得主莫迪亞諾的小說《暗店街》的開頭。《文學報》的評論文章認為：

莫迪亞諾的小說代表作——《暗店街》的幾個中譯本有著不同的開頭，鑒定譯本的優(yōu)劣，在我看來只需看看小說的開頭即可。

這篇評論緣起于《暗店街》在最新的一個譯本里更改了開頭，讓老讀者很不習慣。不過新譯本的編者說，開頭原本的翻譯「我的過去，一片朦朧」并不是嚴格對應原文，只能說因為王小波的二次傳播才變得膾炙人口。他們選擇的是更忠實原文的譯本。

那么我們就來一起欣賞《暗店街》開頭的薛立華譯本（舊）、王文融譯本（新）和 GPT-3.5 譯本：

如果僅僅把三篇中譯看作是三篇同題「洗稿」文章，那么 GPT-3.5 的版本顯然支持新譯本的譯法「我什么也不是」，相比之下「我的過去，一片朦朧」對原文的改動可能過多。

GPT 有幾處誤譯：「事務所」沒有翻譯出來?！溉榘撞Ａ簟菇o翻譯成了「瓷燈」?！妇碜凇棺兂闪恕肝募A」?！缸厣故怯脕硇稳蓊^發(fā)的，它弄成了棕色的眼睛。而且，「面部浮腫、棕色頭發(fā)」同時用來形容男子及男子妻子的情夫，應該在上下文中保持一致以提起讀者注意。

但 GPT 一個顯著的特點——我個人喜歡這種特點——就是語言更簡練，特別是在前幾句話里可以很明顯地看出來。如果排除誤譯，我會更欣賞 GPT 的譯本。

GPT 的另一個驚喜來自《洛麗塔》那里，它自作主張把 4 英尺 10 英寸翻譯成了 1 米 48。對于文中單位的互譯，我覺得多數時候都不應該變動，特別是貨幣單位，就算換成文中時代的匯率對于現代讀者也毫無用處。然而將長度單位由英制改公制絕對可以說是一項「德政」。這個或許也應該具體問題具體分析，但這個現象說明了 GPT 可以了解一些基礎的文化設定，就像它認識麥兜他媽媽。

因此，在對復雜艱深的當地語言進行「再創(chuàng)作」時，人類譯者所需的背景資料，世界觀，該國文化設定等等，可以統一扔到大模型里面去訓練，然后生成一個專精于翻譯培訓的 bot 給人類翻譯人員答疑。

三、結論

在翻譯香港風格的粵語時，ChatGPT 對一些專有名詞和表述的翻譯都比較成功，至少不會因為錯漏翻譯阻礙交流。而且，它對上下文的理解使得它不會忘記之前已經出現過的內容，進一步保證了語義準確和完整。

這個結果證明了我們這些外行和人類專業(yè)翻譯共同認可的一點——現在的 AI 翻譯可以讓中底層的人類翻譯失業(yè)。而對此引發(fā)的進一步后果，有兩種不同的預測：

一種是，因為人才斷層，新的高級翻譯無法從中低級翻譯晉升而來，因此人類翻譯將淪為小規(guī)模培訓和傳承的類似非遺的手藝活，失去自我造血能力。我也基本上傾向于這種預測。
一種是，人類可以跳過中低級翻譯的訓練，直接從教授高級別翻譯能力做起，一開始做的就是最難的題。這意味著將中低級翻譯工作和高級翻譯工作視為兩門不同的學科，尚不知道這樣是否可以成功。

從結果看，似乎在「有匠氣」和有獨特風格方面，第二個實驗不算成功。ChatGPT 的翻譯雖然不失精準，但仍未能在風格化這方面趕超人類。

然而，這樣的測試也讓我看到了用最小化的人力來補足的希望——這也就意味著專職的人類翻譯真正可以休息了。這就是讓擅長中國文學的人，而不是擅長外語的人成為這部分內容的翻譯家。

新時代的翻譯人士可以完全不會外語。他們的作用就是把比較平直，但相對是逐字翻譯的內容變得更有文采，負責「雅」的部分，然后也可以再喂給 AI 去進一步促進「信」和「達」。

其實，這就是那位一輩子不會說外語，但是翻譯了 180 多部作品的翻譯家林紓的經歷。相信這樣的事情會在未來更多次重現。

專欄作家

書航，微信公眾號：航通社（ID：lifeissohappy），人人都是產品經理專欄作家。提供全原創(chuàng)科技新聞和觀點。為您呈現文字有力、觀點鮮明、打動人心的文章。

本文原創(chuàng)發(fā)布于人人都是產品經理，未經作者許可，禁止轉載

題圖來自Pexels，基于CC0協議

該文觀點僅代表作者本人，人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容，請關注人人都是產品經理微信公眾號或下載App