Denník N

Google vylepšil preklady medzi slovenčinou a angličtinou. Niektoré slabiny však zostávajú

Google Translate stále prekladá slovné spojenie „vyprážaný syr s oblohou“ ako „fried cheese and sky“, ale inak sa zlepšuje.

Ak ste si v posledných týždňoch preložili niečo cez Google Translate, mohli ste si všimnúť, že preklad zo slovenčiny do angličtiny aj naopak je lepší. Prekladač využíva novú a vylepšenú technológiu.

Do 19. apríla Google využíval takzvaný štatistický systém, ktorý prekladal text podľa dopredu zadaných gramatických vzorcov. Po novom využíva neurónové siete, ktoré systému umožňujú učiť sa, ako prekladať texty tak, aby sa výsledok priblížil prirodzenej ľudskej reči. Lepšie povedané, aby sa výsledok podobal viac na texty, ktoré mu poskytli na učenie.

Novú technológiu sme vyskúšali na rôznych textoch v redakcii a konzultovali sme výsledky s profesionálnymi prekladateľmi.

Google Translate síce stále prekladá slovné spojenie „vyprážaný syr s oblohou“ ako „fried cheese and sky“ (sky je v preklade obloha, nebo, nebesia), ale inak sa vo viacerých ohľadoch zlepšil. Nový neurónový preklad umožňuje prekladať celé vety naraz, nie kúsok po kúsku. Využíva širší kontext okolo slov a ponúka tak aj vhodnejší preklad. Zlepšenie kvality by malo byť zreteľné najmä pri dlhších vetách. Google tvrdí, že nová technológia dokáže eliminovať chyby v prekladoch o 55 až 85 percent.

„Na úrovni samotnej vety už vie v slovenčine skloňovať, vie, aká predložka sa spája so slovesom, v tom je veľký posun. Ale stále mu chýba čitateľské vedomie, ktoré má len ľudská bytosť,“ hovorí prekladateľka a zakladateľka vydavateľstva Inaque Aňa Ostrihoňová.

Na internete sa dá nájsť mnoho príkladov toho, aké hlúpe chyby robil Google Translate doteraz. Napríklad prekladal slovné spojenie „nebuď labuť“ ako „don’t wake up a swan“ (nezobuď labuť). Dnes ponúka dve možnosti – doslovný preklad „do not be a swan“ a aj ako frazeologizmus „do not be silly“ (nebuď hlúpy). Pri preklade z češtiny pozná ešte tretí význam „come on“ (ide ti to, robíš pokrok, nezdráhaj sa).

Graf znázorňuje používateľské hodnotenie prekladov z angličtiny do španielčiny, francúzštiny, čínštiny a opačne. Na preklade z francúzštiny do angličtiny vidno, že neurónový preklad (zelená) je vnímaný skoro tak dobre ako preklad priemerného ľudského dvojjazyčného prekladateľa (oranžová). Preklady do a z čínštiny sú zatiaľ horšie, ale neurónový preklad výrazne zlepšil pôvodný štatistický preklad (modrá). Zdroj: research.googleblog.com

Systém sa sám učí

Google zaznamená každý deň približne jednu miliardu prekladov. Každý deň preloží 140 miliárd slov, ktoré zadáva viac ako 500 miliónov ľudí.

Spoločnosť predstavila novú technológiu v novembri minulého roku, keď spustila neurónové preklady pre prvých osem svetových jazykov – nemčinu, francúzštinu, španielčinu, portugalčinu, čínštinu, japončinu, kórejčinu a turečtinu. Dnes už nové preklady fungujú medzi angličtinou a vyše dvoma desiatkami jazykov. Od apríla je medzi nimi aj slovenčina.

Neurónový preklad sa neučí od ľudí, ale sám analyzuje preložené texty a učí sa z nich. Zároveň sa neučí jednotlivé jazyky samostatne, ale spracúva ich niekoľko naraz. Je to podobné ako u človeka, ktorý ak pozná nejaký románsky jazyk (francúzštinu alebo španielčinu), ľahšie sa naučí ďalší príbuzný cudzí jazyk (portugalčinu alebo taliančinu).

„Neurónové siete prekladajú celé vety a potrebujú obrovskú výpočtovú silu. Google prekladá medzi 103 jazykmi a ak by sme museli vytvoriť samostatný model pre každú kombináciu, hardvér by to neutiahol,“ povedal pre denník SME produktový vedúci Prekladača Barak Turovsky. „Jazyky preto spájame do skupín. Ideálne ide o lingvisticky podobné jazyky, napríklad slovanské či indické.“

Prekladateľka Ostrihoňová vraví, že Translator je dnes oveľa inteligentnejší, ako bol pre troma alebo štyrmi rokmi. Zároveň dodáva, že preklad je veľmi doslovný a nie je v ňom upravená štylistika. Samotný preklad slovíčok z jedného jazyka do druhého je totiž minimum. „Potom už však nasleduje register, štýl, rôzne jazykové vrstvy, ktoré používajú rozprávači v dialógoch… To Google Translate nevie.“

Jej slová potvrdzuje Martin Kubuš, ktorý prednáša na Univerzite Mateja Bela o anglickej literatúre aj o preklade umeleckých textov: „Google nemá strategickú kompetenciu, nemá socio-lingvistickú kompetenciu. Má len jazykovú základňu – vymieňa jazykový materiál.“

Prekladač podľa neho nevie dekódovať štýl, nemá dobrú syntax. „Je to užitočné pre človeka, ktorý si potrebuje urobiť škaredý hrubý preklad, ale na umelecký preklad to nestačí. Na to treba človeka, ktorý dokáže vymyslieť nejakú vhodnú stratégiu, ktorú úplatní pri konkrétnej pasáži textu.“

„Pravdepodobne sa ani jeden jazyk nedá zredukovať na pravidlá, ktoré by vedel používať softvér,“ dodáva Ostrihoňová. „Navyše jazyk sa každý deň mení a vyvíja, slová dostávajú iné konotácie.“

Aké chyby robí nový Google Translate v prekladoch?

Niekedy nepreloží ani jednoduchý text

V systéme sú zjavne ešte stále chyby, ktoré spôsobujú, že sa nepodarí preložiť aj jednoduchý text.

 Originál: You can’t get away from it in Mexico. Death. Blood. Pain. Torture is everywhere.

Google Translate: Nemôžete sa od neho dostať v Mexiku. Death. Krvi. Pain. Mučenie je všade.

Správny preklad: V Mexiku jej neuniknete. Smrti. Krvi. Bolesti. Mučenie na každom kroku.

Niektoré vety nepreloží správne, lebo ich nevidí v kontexte

Niektoré vety sú chybné preto, lebo nie sú preložené v kontexte celého odseku či strany. Vo výsledku teda nedávajú zmysel.

Originál: „It doesn’t make sense.“
„Well, it does.“

Google Translate: „To nedáva zmysel.“
„No, to je.“

Správny preklad: „Nedáva to zmysel“
„Ale áno, dáva.“ 

Zbytočne prisvojuje

„Angličtina, nemčina, francúzština často prisvojujú – napríklad ‚zobrala si jej veci‘, ‚odišiel do jeho izby‘. Do slovenčiny to prekladáme ako ‚odišiel do svojej izby‘, či ‚odišiel do izby‘,“ vysvetľuje Ostrihoňová. „Nemá cit pre jazyk. Nevie, že čo je podstatné v jednom jazyku, nemusí byť podstatné v druhom, alebo či ide len o gramatickú funkciu, ktorá sa do druhého jazyka neprenáša​, prípadne sa prekladá lexikálne alebo štylisticky​.“

Originál: When the operator finally rang her room, she was sitting on the window seat and had almost finished putting lacquer on the nails of her left hand.

Google Translate: Keď operátor nakoniec zazvonil v miestnosti, sedela na okennom sedadle a takmer dokončovala lak na nechty svojej ľavej ruky.

Správny preklad: Keď sa konečne v jej izbe ozvalo zvonenie, sedela pri okne a mala nalakované skoro všetky nechty na ľavej ruke. 

Niektoré slová v preklade zbytočne opakuje

Google niektoré slová opakuje, hoci to v preklade nie je potrebné. „Len vymieňa jazykový materiál a vôbec neberie do úvahy niektoré špecifiká slovenčiny,“ vraví Kubuš.

Originál: „Who says so?“
„Commodore says so.“

Google Translate: „Kto to hovorí?“
„Commodore to hovorí.“

Správny preklad: „Kto povedal?“
„Komodor.“ 

Problémy s postavami a ich menami

Google často nevie trafiť, aký rod má postava v príbehu. Aj keď bola postava predstavená, už v nasledujúcej vete systém nemusí vedieť, či šlo o dievča alebo chlapca. Tiež si občas nevie poradiť s menami postáv – niekedy ich nechá v originálnej verzii, o pár riadkov nižšie ich preloží. Pozitívom je, že prechyľuje, teda vie, že pri ženských priezviskách má použiť príponu -ová.

Keď niečo nevie preložiť, použije češtinu

V situáciách, keď si Google nevie poradiť s prekladom nejakého slovíčka, siahne po češtine.

Originál: „Hello,“ she said, keeping the fingers of her left hand outstretched and away from her white silk dressing gown.

Google Translate: „Dobrý deň,“ povedala a držala prsty ľavej ruky nataženej a odtiahnutá od bielych hodvábnych županov.

Správny preklad: „Prosím,“ povedala a ľavú ruku natiahla čo najďalej od bieleho hodvábneho županu. 

Preklad je umelý a nevhodne doslovný

Niektoré preklady sú doslovné, hoci v slovenčine sa niektoré veci povedia inak. Teda aj vtedy, keď Translator neurobí gramatickú chybu, je preklad nevhodný. „Je to umelé. Nie je tam interpretácia prekladateľa,“ vraví Kubuš.

Originál: It’s not in his nature

Google Translate: Nie je to jeho povaha

Správny preklad: Nemá to v povahe. 

Nevie, kto je činiteľ deja

V situáciách, keď v literatúre nie je explicitne uvedené, kto čo urobil, je Translator stratený.

Originál: I heard Charlie coming up the stairs and jumped into bed, pretending I was fast asleep. He stuck his head in the room and said my name but I did not answer.

Google Translate: Počul som, ako Charlie vchádza po schodoch a skočil do postele a predstieral, že som spal. Zavrel hlavu do izby a povedal moje meno, ale neodpovedal som.

Správny preklad: Počul som, ako Charlie kráča hore po schodoch, a hodil som sa do postele, akože tvrdo spím. Nakukol do izby a oslovil ma, no ja som nereagoval. 

Problémy s interpunkciou

Prekladač občas robí nezmyselné chyby pri interpunkcii. Medzi slovo a záverečné úvodzovky občas nesprávne vkladá medzeru. Medzeru nesprávne vkladá aj medzi slovo a nasledujúce tri bodky, hoci v zdrojovom texte sa táto chyba nevyskytovala. Stalo sa tiež, že bodku nahradil čiarkou, hoci nasledujúce slovo nechal s veľkým začiatočným písmenom, akoby šlo o začiatok vety.

Má problém so zastaranejšími slovami

Niektoré staršie slová prešli vývojom a ich význam sa postupne menil. Google Translate si však nevie text datovať a tak nevie, aký preklad použiť. Problémy mal napríklad, keď sme mu dali preložiť text z knihy Deväť poviedok, ktorú napísal J. D. Salinger v roku 1953.

Originál: She tweezed out two freshly surfaced hairs in her mole.

Google Translate: Odštartovala dva čerstvo vystupujúce vlasy na krku.

Správny preklad: Vytrhla si dva malé chĺpky zo znamienka. 

Nevie, že slovenčina už nemá vokatív

Google často nevie použiť správny štýl. Pri testovaní sa nám stalo, že použil 5. pád, hoci v slovenčine už takmer neexistuje.

Originál: „Mother, darling, don’t yell at me. I can hear you beautifully,“ said the girl.

Google Translate: „Matko, miláčik, nekrič na mňa, počujem ťa nádherne,“ povedala dievča.

Správny preklad: „Mama, drahá, nekrič na mňa. Počujem ťa veľmi dobre,“ povedala dievčina. 

Prekladateľov zatiaľ nenahradí

Testovanie nového Translatora ukazuje, že technológie v blízkej budúcnosti profesionálnych prekladateľov nenahradia. Systém totiž stále robí chyby, ktoré by priemerný prekladateľ alebo tlmočník neurobil.

„My prekladatelia môžeme byť stále pokojní. Tento nešťastný stroj nás ešte nenahradí,“ hovorí prekladateľ Martin Kubuš. Myslí si, že Google Translate by mal bez problémov prekladať informatívne texty, kde nie je potrebná interpretácia prekladateľa, napríklad manuály a návody na použitie.

„Je rozdiel medzi zážitkovo-expresívnym textom a informatívnym textom. Google by možno trafil preklad nejakých šablónovitých zmlúv, možno by zvládol takzvanú sivú literatúru Európskej únie, ale aj tam by ešte asi bola potrebná úprava,“ vraví. „Ale keď treba interpretovať text, niečo doplniť, čo nie je pochopiteľné, niečo skrátiť, to systém nevie.“

Google Translate nielen že nenahradí prekladateľov krásnej literatúry, ale zatiaľ sa naň nemožno spoľahnúť ani v oblastiach, kde je využitý jazyk jednoduchší. V odborných, technických, finančných či právnych textoch je síce gramatika často jednoduchšia, ale aj malé chybičky sú neakceptovateľné.

Navyše autori nového Prekladača priznávajú, že nová technológia prekladu môže byť v niektorých momentoch menej presná ako starý spôsob, keď sa vlastne len prekladalo slovíčko po slovíčku. Systém sa totiž snaží nájsť najlepšie znejúci preklad a môže mať problém napríklad s prekladom zriedkavo používaných slov. Niekedy sa zas nemusí podariť preložiť všetky slová.

Budúcnosť Translatora závisí aj od toho, z akých kvalitných dvojjazyčných textov sa bude systém ďalej učiť. Využitie neurónových sietí na preklad je naozaj veľká a významná technologická zmena, ale ak sa softvér bude učiť na zle preložených textoch, môže si osvojiť aj zlé spôsoby.

🗳️ Ak chcete podporiť našu prácu pred druhým kolom volieb aj nad rámec predplatného, môžete to urobiť aj darom.🗳️

Máte pripomienku alebo ste našli chybu? Prosíme, napíšte na [email protected].

Slovensko

Teraz najčítanejšie