谷歌翻譯的“已審核”徽章有多可靠

為了幫助支持其 133 種語言的覆蓋范圍,Google 翻譯呼吁用戶和多語言志愿者提供機器翻譯(MT) 引擎輸出的審核和驗證服務,并自行翻譯單詞和短語。
翻譯社區首次出現于 2014 年,當時谷歌在一篇博客文章中宣布用戶可以對現有翻譯進行評分、生成新翻譯并發送反饋。谷歌表示:“我們計劃采納您的更正,并隨著時間的推移更好地學習您的語言”。
2014 年之前,可以將翻譯評為“有幫助”、“無幫助”或“無禮”,但現在,可以通過三種方式“有助于提高您的語言的翻譯質量”。這樣做再簡單不過了。
進入谷歌翻譯網頁后,用戶只需單擊“貢獻”圖標,輸入他們知道或想要使用的語言,然后選擇他們想要執行的三個貢獻任務中的哪一個。
它是如何工作的?
對于三種貢獻方式中的每一種,都有一個“標記”按鈕,大概是為了標記來源,盡管這還不清楚。第一種貢獻方式是“對單詞和短語的正式程度進行評分”。每個短語有五個正式級別可供選擇:非常非正式、非正式、中性、正式或非常正式。
第二個選項“驗證翻譯的準確性”,要求用戶簡單地說明其是否正確。
最后,用戶可以“翻譯單詞和短語”。除了源語言短語或單詞之外,Google 不提供任何信息,并且用戶輸入目標語言翻譯。
谷歌表示,“為谷歌翻譯做出貢獻的其他用戶可能會查看您建議的翻譯。如果您的評論被標記為正確,Google 翻譯可能會在您的翻譯上顯示一個徽章。這表明翻譯已被“貢獻者審閱”。
據谷歌發言人稱,“當翻譯經過谷歌翻譯社區的幾位志愿者審核后,我們會將翻譯標記為‘已驗證’”。究竟有多少審稿人必須對翻譯進行積極驗證才能獲得徽章,目前尚不清楚。
用戶還可以點擊 評估翻譯,或選擇“建議編輯”輸入新翻譯。
數量勝于質量,無論好壞
該系統適合進行大量翻譯和驗證,這正是谷歌翻譯不斷改進其機器翻譯引擎所需要的。眾包非常便宜,但允許訪問盡可能多的用戶。希望貢獻者越多,產出的質量就越高。
“翻譯公司關心的是有意義的輸出,以便一切都有意義并且忠實于源語言”,The Translation Company評論道。這應該會提高經過審核過程的翻譯質量。
然而,這種方法也有局限性。盡管快速的設置過程帶來了有吸引力的用戶體驗,但這意味著志愿者不會獲得任何流程介紹、審閱或翻譯規則或需要遵循的風格指南。
一位用戶質疑期望的質量是怎樣的:“完美的人工翻譯質量?或者正確表達意思的翻譯?”。因此,用戶會單獨做出判斷;每個審稿人都有自己的標準和規則來決定什么是正確的,什么是寬容的。
這位志愿者強調,有時審稿人選擇的“正確”翻譯實際上可能并不是 100% 準確。她舉例說,“大多數[翻譯]都明白了要點,但未能反映日語原文的禮貌。我選擇最接近的一個,盡管它沒有大寫和標點符號?!?/span>
這可能是仍然存在質量投訴的原因之一。谷歌翻譯的準確性受到質疑并不是一個新的討論,高資源語言的表現比低資源語言要好。
某些語言中可能仍然存在語法錯誤(例如,羅曼語言中完成時態與未完成時態的識別),無法區分正式和非正式的稱呼形式(法語中的“vous”與“tu”,“Sie”與“Sie”)德語中的“du”表示“你”等),以及性別(例如,在表示職業的名詞被性別化的語言中)。雖然一詞多義對于谷歌翻譯來說是一個難題——當單詞有多種含義時——人工翻譯人員可以根據上下文來決定最合適的翻譯。
當然,眾包的一個明顯問題是貢獻者可能會犯錯誤。谷歌也不需要證明審稿人有“資格”(足夠了解語言)來做出這些驗證判斷或翻譯。任何人都可以很容易地參與并在互聯網上進行惡搞。