Viðmiðun þýðingarvéla: Samanburðarrannsókn á frammistöðu og gæðum

Margar þýðingarvélar bjóða upp á mismunandi frammistöðu og gæði. En hvern ættir þú að velja?

MachineTranslation.com rannsakaði ýmsa helstu vélaþýðendur sem fáanlegir eru á gervigreindarforritinu okkar. Við greindum leiðandi vélar út frá lykilmælingum til að finna besta jafnvægi hraða og nákvæmni.

Helstu vélþýðingarvélarnar sem við skoðuðum eru DeepL, Google, Chat GPT, Microsoft, Lingvanex, Modern MT, Royalflush, Niutrans og Groq.

Ítarlegur samanburður á helstu þýðingarvélum

Okkar gervigreind vélþýðingarsafnari safnað umfangsmiklum gögnum úr þýðingum og samskiptum notenda. Með þessum gögnum greindum við tvo lykilmælikvarða: meðaltal þýðingarskora og vinnslutíma.

Meðalstig þýðingarvéla

Meðaleinkunn er lykilmælikvarði á þýðingargæði sem hver vél framleiðir. Stig koma frá endurgjöf á þýddan texta, metin út frá skýrleika, samræmi og umfangi nauðsynlegra breytinga. Niðurstöðurnar sem kynntar eru í þessari grein geta verið mismunandi og geta breyst miðað við áframhaldandi endurgjöf og rannsóknir.

Hér eru meðaleinkunnir fyrir leiðandi þýðingarvélar:

DeepL: 8.38
Google: 7.90
Spjall GPT : 7.82
Microsoft: 7.77
Lingvanex : 7.49
Nútíma MT : 7.48
Royalflush : 6.54
Niutrans : 6.65
Groq : 6.66

Meðalstig þýðingarvéla

Þessi mynd sýnir meðaleinkunn fyrir hverja vél.

Byggt á töflunni hér að ofan, Djúp L hefur hæstu meðaleinkunn, sem sýnir framúrskarandi þýðingargæði meðal ellefu vélþýðenda. Google og Chat GPT standa sig einnig vel, Microsoft fylgir fast á eftir.

Lingvanex og Modern MT eru í meðallagi frammistöðu, veita fullnægjandi gæði en ekki eins hátt og þeir sem standa sig best. Royalflush, Niutrans og Groq eru með lægstu meðaleinkunnina, sem þýðir að þýðingar þeirra þurfa oft fleiri breytingar.

Lestu meira: Tungumál studd af vinsælum vélþýðingarvélum

Vinnslutími mismunandi véla

Vinnslutími er mikilvægur mælikvarði sem endurspeglar skilvirkni þýðingarvélar. Hraðari vinnslutími er nauðsynlegur fyrir rauntímaþýðingar. Hér eru meðalvinnslutímar fyrir hverja vél:

Google: 0,22 sekúndur
Microsoft: 0,26 sekúndur
Amazon : 0,33 sekúndur
Nútíma MT : 0,36 sekúndur
Lingvanex : 0,45 sekúndur
DeepL: 0,51 sekúndur
Spjall GPT : 1,12 sekúndur
Niutrans : 1,47 sekúndur
Royalflush : 1,83 sekúndur

Vinnslutími mismunandi véla

Þessi mynd sýnir meðalvinnslutíma hverrar vélþýðingarvélar.

Frá töflunni hér að ofan eru Google, Microsoft og Amazon fljótustu, sem gerir þau tilvalin fyrir skjótar þýðingar. Nútíma MT, Lingvanex og DeepL eru með hóflegan hraða.

ChatGPT, Niutrans og Royalflush eru hægustu, sem getur verið galli í tímaviðkvæmum aðstæðum.

Fylgni milli ferlistíma og stigs

Hitakort fylki

Þetta graf sýnir engin fylgni milli þýðingarhraða og gæða.

Til að sjá hvort það sé samband á milli vinnslutíma og þýðingargæði , greindum við fylgni milli þessara tveggja mælikvarða. Myndin hér að ofan sýnir fylgnistuðul um -0,093, sem gefur til kynna mjög veika neikvæða fylgni. Þetta þýðir að hraðari þýðingartími hefur ekki endilega áhrif á gæðin og mælikvarðarnir tveir eru að mestu óháðir.

Innsýn í endurgjöfargreiningu

Endurgjöf veitir verðmæta innsýn í gæði þýðingar. Hér eru algengustu endurgjöfargerðirnar frá safnara MachineTranslation.com og tíðni þeirra:

Að mestu ljóst: Það þurfti aðeins nokkrar endurskoðun - 76.877 tilvik
Næstum slétt: Valfrjálsar lagfæringar eru nauðsynlegar - 64.001 tilvik
Alveg hreinsaður: Getur notið góðs af léttum breytingum - 55.030 tilvik
Mjög ósamræmi: Þarfnast verulegra breytinga - 32.301 tilvik
Krefst ítarlegrar klippingar: Það krefst ítarlegrar klippingar - 27.697 tilvik

Til viðbótar við algengar endurgjöfargerðir sem nefndar eru, greindum við frekar til að bjóða upp á nákvæmari framsetningu á þýðingargæðum frá gervigreindarknúnum safnvélinni okkar, eins og sýnt er á myndinni hér að neðan.

Innsýn í endurgjöfargreiningu

AI-knúna þýðingasafnari okkar framleiðir „að mestu skýran“ úttak byggt á innri endurgjöfargreiningu.

Myndin hér að ofan sýnir innri endurgjöfargreiningu gervigreindarsafnarans okkar fyrir þýdda efnið. Hæstu meðaleinkunnir eru fyrir „Outstandingly Clear“, „Nearly Smooth“ og „Quite Refined“.

„Outstandingly Clear“ hefur hæstu meðaleinkunn, sem gefur til kynna lágmarksþörf á breytingum. „Nearly Smooth“ og „Quite Refined“ eru með svipaða meðaleinkunn í kringum 7,5-8, sem bendir til góðra gæða þar sem þörf er á smávægilegum endurbótum.

Á sama tíma eru lægstu einkunnir fyrir „Mjög ósamræmi“ og „Krefst ítarlegrar klippingar“, með meðaleinkunn undir 5, sem gefur til kynna veruleg þýðingarvandamál.

Lestu meira: Bestu vélþýðingarvélar fyrir hvert tungumálapar

Niðurstaða

Rannsókn okkar greinir styrkleika og veikleika mismunandi þýðingarvéla. Niðurstöðurnar um vélþýðendur í þessari grein gætu breyst þegar við höldum áfram að rannsaka og þróa gervigreindartækið okkar.

Þessar niðurstöður geta hjálpað fyrirtækjum og einstaklingum að velja bestu þýðingarvélina út frá sérstökum þörfum þeirra, hvort sem er lögð áhersla á hraða, gæði eða jafnvægi beggja. Ef þú vilt prófa vélþýðingarvélarnar sem getið er um í þessari grein, farðu á heimasíðuna okkar. Þú getur líka skráð þig á okkar ókeypis áskriftaráætlun , sem gefur þér 1500 einingar mánaðarlega fyrir meiri aðgang.