July 8, 2024
許多翻譯引擎提供不同水平的效能和質量。但是你應該選擇哪一個?
MachineTranslation.com 研究了我們採用 AI 支援的翻譯彙總器上提供的各種頂級機器翻譯器。我們根據關鍵指標分析了領先的引擎,以找到速度和準確性的最佳平衡。
我們審查的頂級機器翻譯引擎是 DeepL,谷歌,聊天 GPT,微軟,靈瓦內克斯,現代 MT,皇家弗洛斯,尼烏蘭斯和格羅克。
我們採用 AI 技術的機器翻譯彙總器從用戶翻譯和互動中收集了大量數據。使用這些資料,我們分析了兩個關鍵指標:平均翻譯分數和處理時間。
平均分數是每個引擎所產生的翻譯品質的關鍵指標。分數來自對翻譯文本的反饋,並根據清晰度,一致性和所需編輯的程度進行評分。本文中提供的結果可能會有所不同,並可能會根據持續的反饋和研究進行更改。
以下是領先的翻譯引擎的平均分數:
DeepL:8.38
谷歌:7.90
聊天 GPT:7.82
微軟:7.77
靈瓦內克斯:7.49
現代 MT:7.48
皇家花費:6.54
新特蘭斯:6.65
格羅克:6.66
翻譯引擎平均分數
此圖表說明每個引擎的平均分數。
根據上圖表,DeepL 的平均分數最高,在十一位機器翻譯器中表現出色的翻譯品質。谷歌和聊天 GPT 也表現良好,密切接著微軟。
Lingvanex 和 Modern MT 表現適中,提供令人滿意的質量,但不像頂級表現那麼高。Royalflush、Niutrans 和 Groq 的平均分數最低,這意味著他們的翻譯通常需要更多編輯。
閱讀更多:流行機器翻譯引擎支援的語言
處理時間是反映翻譯引擎效率的關鍵指標。更快的處理時間對於即時翻譯至關重要。以下是每個引擎的平均處理時間:
谷歌:0.22 秒
微軟:0.26 秒
亞馬遜:0.33 秒
現代 MT:0.36 秒
靈瓦內克斯:0.45 秒
DeepL:0.51 秒
聊天 GPT:1.12 秒
新特蘭斯:1.47 秒
皇家花費:1.83 秒
不同引擎的處理時間
此圖表顯示了每個機器翻譯引擎的平均處理時間。
從上圖中,谷歌,微軟和亞馬遜是最快的,因此非常適合快速翻譯。現代的 MT、靈瓦內克斯和 DeepL 具有適中的速度。
ChatGPT、尼烏蘭和羅伊爾弗拉斯是最慢的,這在時間敏感的情況下可能會成為缺點。
熱圖矩陣
此圖表顯示翻譯速度和品質之間沒有相關性。
為了查看處理時間和翻譯品質之間是否有關係,我們分析了這兩個指標之間的關聯性。上圖顯示了約 -0.093 的相關係數,表明非常弱的負相關性。這意味著更快的翻譯時間不一定會影響質量,而且這兩個指標大部分是獨立的。
反饋提供有價值的翻譯品質的見解。以下是 MachineTranslation.com 的聚合器最常見的反饋類型及其頻率:
大部分清晰:它只需要一些修訂-76,877 個實例
幾乎平滑:需要可選的調整-64,001 個實例
非常精緻:可能從輕量編輯中受益-55,030 個執行個體
非常不一致:需要大量編輯-32,301 個執行個體
需要徹底編輯:它需要徹底的編輯- 27,697 個實例
除了提到的常見反饋類型之外,我們進一步進一步分析,以提供更準確的人工智慧型彙總器的翻譯品質表示,如下圖所示。
回饋分析的洞察
我們採用 AI 技術的翻譯彙總器根據其內部反饋分析產生「大部分清晰」的輸出。
上圖顯示了我們採用 AI 的聚合器對翻譯內容的內部反饋分析。平均分數最高是「非常清晰」、「接近平滑」和「非常精緻」。
「非常清晰」的平均分數最高,表明編輯需要最少。「近乎流暢」和「非常精緻」的平均分數相似,約 7.5-8,表明質量良好,需要少許改進。
同時,最低分為「高度不一致」和「需要徹底編輯」,平均分數低於 5,表明顯著翻譯問題。
閱讀更多:每種語言對的最佳機器翻譯引擎
我們的研究確定了不同翻譯引擎的優點和弱點。隨著我們繼續研究和開發我們採用 AI 的聚合器,本文中有關機器翻譯器的發現可能會發生變化。
這些研究結果可以幫助企業和個人根據他們的特定需求選擇最佳的翻譯引擎,無論是重視速度、品質還是兩者的平衡。如果您想嘗試本文中提到的機器翻譯引擎,請訪問我們的主頁。您還可以註冊我們的免費訂閱計劃,該計劃為您每月提供 1500 個積分,以便更多訪問權限。