Google 翻譯今日全面啟動新 AI 支援英翻中多國語言更自然互譯
快兩個月前,我寫過一篇新聞,提到:「Google 翻譯宣布中翻英系統 AI 大升級,正確性更接近人類翻譯」,文章說到 Google 開發出全新的翻譯 AI 叫做:「Google Neural Machine Translation system (GNMT),( Google 神經機器翻譯系統)」,這個人工智慧翻譯系統最大的特色就是不會斷章取義,會考量整個句子的語境與通順度,翻出更流暢的文意。
只是兩個月前,這個 Google 翻譯新 AI 只開放中翻英做測試。而今天(2016/11/16), Google 正式宣布全面啟動這個新的 AI 翻譯系統,並且可以套用在英語與其他 8 國語言的互譯,8國語言包含:法語,德語,西班牙語,葡萄牙語,中文,日語,韓語和土耳其語。(例如英翻中、日翻英等等)
對於台灣用戶來說,英翻中、中翻英的強化,就是很確實的幫助,你可以立刻在 Google 翻譯的網站、 App 等服務端,測試看看翻譯一整句話、一段文章的結果是否更自然,更接近人類翻譯?
下面是我利用「 Google 翻譯擴充套件」,直接翻譯網頁上英文文章的結果,這樣翻完整篇文章,雖然還是有些錯誤之處,但感覺已經是一篇可讀且通順的譯文了。
剛好我最近翻譯了一篇英文文章,可以測試看看今日開放之前與之後的翻譯效果,擷取其中部分英文原文如下:
The automatic machine translation systems available today are not able to produce high-quality translations unaided: their output must be edited by a human to correct errors and improve the quality of translation. Computer-assisted translation (CAT) incorporates that manual editing stage into the software, making translation an interactive process between human and computer
之前用 Google 舊版翻譯出來的中文為:
目前可用的自動機器翻譯系統無法生產出高品質的翻譯外援:他們的輸出必須由人進行編輯,以糾正錯誤,提高翻譯質量。計算機輔助翻譯(CAT)結合了手動編輯階段到軟件中,使翻譯人與計算機之間的互動過程。
而今天,我使用 Google 翻譯(理論上應該就是使用新版的 AI 翻譯系統),翻譯的結果為:
當今可用的自動機器翻譯系統不能夠無輔助地產生高質量的翻譯:它們的輸出必須由人來編輯以校正錯誤並提高翻譯的質量。 計算機輔助翻譯(CAT)將手動編輯階段納入軟件,使翻譯成為人與計算機之間的交互過程
可以看到,雖然還是有些用語習慣的錯誤,但在新版的 AI 翻譯中,會主動為了句子更通順,加上一些輔助詞句、連接詞,並且懂得辨別語意來做更正確的整句翻譯(例如第一句話在舊版翻譯中文意是錯的)而非真的完全照著英文單字翻譯。
剛好我昨天也介紹到了 Google 翻譯裡隱藏的工具:「提升大量翻譯文章效率 Google 譯者工具包教學:免費 CAT 工具」。
這樣一來,以後你用 Google 翻譯進行英文文章的初步翻譯,或是在網路上閱讀英文文章,都可以更通順地翻譯為中文,起碼跟之前相比有大加分,大家也可以立刻試試看,並一起來討論你的測試結果。
延伸閱讀相關文章:
轉貼本文時禁止修改,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang(異塵行者),及附上原文連結:Google 翻譯今日全面啟動新 AI 支援英翻中多國語言更自然互譯
謝謝您的介紹!我也覺得這個Google翻譯做得真好。^_^
回覆刪除且容我說明一下我的想法,希望能做為小小的回饋。 ^_^
(Google翻譯是多語互譯,以下說明主要是以英翻中為觀點,但各位完全可以自由延伸 ^_^)
在我看來,翻譯可分成兩個層面。
第一個層面只要根據簡單規則(查單字、查文法。。。)就能做好,
另一個層面則是翻譯【道地】的程度。
只要做好第一個層面,翻譯基本上就能看得懂;
但如果能做好第二個層面,翻譯看起來就舒服多了。
不過,之前的Google翻譯,連文法規則都沒做好,
所以翻出來的東西根本看不懂。
我常舉的一個例子就是:
【I love the woman who loves me.】
這句話就是簡單的形容詞子句。
句子裡頭的那個who,只要是被翻譯成【誰】,這種翻譯就爛透了!
《== 之前Google翻譯就是翻成這樣,現在很多其他翻譯引擎還是如此。
不過,現在這句話Google翻譯成【我愛那個愛我的女人。】
嗯,真是太好了。
至於【I love you more than I can say.】
現在被翻譯成【我愛你比我能說的更多。】
字面上來說,其實也翻得沒錯,只是。。。不夠道地。
這個【道地】,就有點屬於藝術層次的工作了。
身為一個譯者,照理說應該要去做這個【藝術層次】的工作,
但各位請相信我,大部分譯者過去都是做文法規則層次的翻譯(還經常做錯 ^_^),
所以市面上一堆爛翻譯書,就是這麼來的。
譯者不是不想做【道地】,主要是因為
光是【文法規則】層次的翻譯,往往就耗費掉非常多譯者的精力,
結果譯者翻到最後沒力了,很多人就不去管道不道地了。。。
現在翻譯前段的工作,被Google用程式做掉了耶。
這麼一來,倒不是譯者就會失業;
應該說,譯者終於可以從文法規則中解放出來,把所有的精力用在更【道地】的翻譯了。
這絕對是件好事。
另一方面,大部分人看到英文就害怕,但真有想看的內容,卻又沒有好心人做好翻譯。
以前就算用Google翻譯,連文法都不對,翻出來的東西根本就看不懂(還不如看原文)。
現在,如果至少能把文法做對,出來的東西至少就能看懂。。。
重點是,只要做到【能看懂】的程度,其實就滿足大部分人80%的需求了呀。。。
我之所以認為這件事很重要,是因為全世界有大量的知識,都保存在英文這個語言裡面。
舉個例子來說,不管哪個國家的研究生,
就算用各自不同的母語寫論文,都一定還是會有一個英文的版本。。。
如果這些被保存在英文中的各種知識,通俗也好、專業也好,
如今都能被輕易地轉換成至少看得懂的中文,
然後其中真正重要的內容,也能有更多人去把它轉換成更道地的中文,
那絕對絕對更是件不得了的好事呀。
而Google只要做好這件事,
就會輕易成為中文世界進入英文世界(或是其他語言)的【入口網站】。。。
入口網站呀好久沒聽到這個名詞了,但
這就是當年Google強大起來的根源呀。
我覺得這件事有點像當年唐三藏去天竺取經一樣。
唐朝盛世人民物質生活極為滿足,於是進一步追求精神文明,
唐三藏取經(其實還有翻譯佛經)的重要性自有其背景。
真要說的話,唐三藏就好像唐人要進入佛教世界的入口站一樣。 ^_^
如今只要沒有戰爭,華人世界應該就要進入盛世,
對於蘊藏在英文世界卻還沒以中文呈現的一切,需求自然是越來越強。
所以我認為這件事在歷史上可能也會同樣具有極其重要的地位。
至於Google的下一步。。。他們可能在想(其實應該早就在做了),
那個【道地】的程度,要怎麼做到呢?
像文法規則這樣的東西,寫程式的人花20%的精力就能得到80%的效果。
至於那個有點【藝術】的層面,如果用傳統程式思維來做的話,
花80%的精力可能只能得到20%的效果。
所以【道地】這部分的工作,應該還會有段時間需要靠人來做。
但是,接下來可能會有兩種發展。
一種是,因為Google翻譯已經把英文翻譯成至少看得懂的中文了,
所以在【道地化】的過程中,譯者面對的已經不是只有【英文】,
而是【英文】+【至少看得懂的中文】。
也就是說,可能就會有一些專業很強但英文不好的人,
他們也可以開始做一些【道地化】的工作了。
另一種可能的發展,我還在觀察,
Google不知道會不會繼續發展更好的平台,收集大家【道地化】翻譯的結果。。。
(其實現在已經有但不夠好用)
因為這種【道地化】的翻譯,可說是非常珍貴,而且。。。
非常適合雲端化,適合用大數據的方式來產生人工智慧。
對吼,現在有大數據,有人工智慧耶。
而Google就是最適合做這件事的人。
因此,總有一天程式連【道地化】也可以做得很好。
【符合文法規則】這種層次,一般程式開發者就能做到,
(我之前就是很想用軟體去做這件事但現在被做掉了)
但【道地化】這個層次的工作,恐怕就是Google這種公司才能做的工作了。。。
我只能推想,Google接著就能把這件事做好,
然後,或許應該在這樣的發展上,想想下一步應該去做什麼好呢? ^_^
好了,就這樣,我講完了哈哈哈。
感謝您深入的回饋與比較
刪除