Onajnovšom vývoji strojových prekladačov sme hovorili sodborníkom na umelú inteligenciu Martinom Takáčom.
Na akom princípe funguje strojový prekladač DeepL?
Pracuje na báze takzvaných umelých neurónových sietí, ktoré sú inšpirované ľudským mozgom. Ten sa skladá zo sto miliárd neurónov ainformácia sa medzi nimi šíri cez spojenia, ktoré sú tvárne, plastické, amenia sa pri zapamätávaní si nových vecí. Umelá neurónová sieť je obrovská matematická funkcia smiliardami parametrov, ktoré sa menia počas učenia. Sieť sa učí nové veci počas takzvaného trénovania, kde sa jej predkladajú vzory toho, čo sa má naučiť. Pri preklade sú to páry viet, takže pri tréningu jej predložím napríklad slovenskú vetu, sieť vypočíta jej preklad, ten sa porovná so vzorovým, napríklad anglickým, prekladom aparametre siete sa upravia tak, aby vbudúcnosti dali výsledok bližší tomu želanému vzorovému prekladu. Ato sa robí milióny krát srôznymi vetami. Na rovnakom princípe fungujú aj ďalšie prekladače, napr. Google Translate, avšak DeepL, ktorý vsúčasnosti dokáže prekladať medzi 31 jazykmi, býva vslepých textoch hodnotený až trikrát lepšie, čo sa týka presnosti, prirodzenosti acelkovej kvality prekladu. Detaily, prečo je lepší, nevieme, pretože algoritmy učenia sú obchodným tajomstvom, ale časť jeho úspechu je vtom, že má veľmi kvalitný paralelný korpus. Čerpá ztextov, ktoré sú viacjazyčné, či už patenty, dokumenty EU a podobne. Vtakýchto korpusoch identifikuje vety, ktoré si navzájom zodpovedajú apotom má iný algoritmus, ktorý hodnotí kvalitu prekladu aje natrénovaný na základe hodnotení ľudských expertov vpreklade.
Je preklad totožného textu zakaždým rovnaký?
Je. Je to preto, že keď sa takýto veľký model natrénuje, parametre sa zafixujú aďalej sa nemenia, pokiaľ tam nevstupuje nejaký náhodný faktor, tak výsledok je vždy rovnaký. To však ale zároveň znamená, že pokiaľ autori budú takúto sieť dotrénovávať na nových dátach abudú svoj algoritmus zlepšovať, tak preklad toho textu už vbudúcnosti rovnaký byť nemusí. Takisto aj užívateľ môže do procesu prekladu zasahovať tým, že dodá svoj slovník termínov aDeepL ho bude rešpektovať apodľa neho konzistentne prekladať. Dočítal som sa, že je možné aj zvoliť si medzi formálnym amenej formálnym módom prekladu.
Je teda možné overiť autorstvo prekladu?
Áno, jednoduchým porovnaním zhody. Vo vedeckej komunite sa používajú rôzne testy na plagiátorstvo aaj tu, ak máte preklad, oktorom neviete, či ho urobil človek alebo stroj, porovnáte ho s prekladom urobeným pomocou DeepL azistíte percentuálnu zhodu.
Hovorí sa o hrozbe, že prekladatelia prídu vsúvislosti sumelou inteligenciou oprácu ako prví astanú sa znich editori strojových prekladov...
Strojové preklady sa ešte vsúčasnosti nevyrovnajú ľudským prekladom, ale stále sa zlepšujú, takže je reálne, že jedného dňa dosiahnu porovnateľnú kvalitu. To však nemusí znamenať, že prekladatelia prídu oprácu, len sa povaha ich práce zmení. Budú používať strojové prekladače ako nástroje, tak ako dnes možno používajú nástroje na gramatické opravy. Ich práca bude spočívať veditovaní acizelovaní prvotného prekladu, dodávaní osobitého štýlu apodobne. Sám som si to vyskúšal pri mojej knihe, ktorej anglický preklad chystám. Najprv som sa strojovému prekladu veľmi bránil, ale keď som si skúsil preklad malého úryvku, bol som prekvapený prirodzenosťou viet vygenerovaných DeepLom. Bolo tam však dosť nepresností, takže si to vyžadovalo ďalšiu precíznu prácu editorky najmä čo sa týkalo správnosti prekladu niektorých technických záležitostí. Ale bolo to rýchlejšie, ako manuálny preklad od nuly. Experimentoval som aj so spätným prekladom. Vzal som kus svojho slovenského textu, dal ho preložiť do angličtiny aspäť aprekvapilo ma, že na mnohých miestach sa mi spätný preklad páčil viac ako originál, bol jednoduchší aplynulejší.
Myslím, že DeepL nemusí byť nutne hrozba, prekladateľom zvýši pohodlie práce aich produktivitu, čo im umožní znížiť cenu azvýšiť svoju dostupnosť. Dopyt po prekladoch stále bude, takže otázka by nemala byť formulovaná tak, že ľudský verzusstrojový preklad, ale čo dokážu ľudskí prekladatelia spomocou výpočtových nástrojov.
Zmení sa DeepL vbudúcnosti natoľko, že bude schopný vtexte rozoznávať citové zafarbenie ametafory?
DeepL je už teraz veľmi dobrý vpreklade idiómov ametafor. Nerobí iba doslovný preklad. Ak je však niekde miesto pre autorskú originalitu prekladateľov, tak je to pri preklade umeleckých textov, alebo textov, ktoré by mali mať istý osobitý štýl. Aj toto sa však vbudúcnosti môže zmeniť. Existuje nástroj umelej inteligencie na generovanie obrázkov, ktorému môžete zadať želaný obsah, teda napríklad krajinu skoňmi, ale nech je to napríklad v štýle Dalího. Pokiaľ by boli umelé neurónové siete trénované na textoch určitých štýlov alebo autorov, bude možné zadať, aby prekladač preložil text vštýle napríklad Borgesa, alebo Kerouaca.
doc. RNDr. Martin Takáč, PhD.
Pôsobí v Centre pre kognitívnu vedu Katedry aplikovanej informatiky FMFI UK. Je autorom knihy Myseľ ako objekt. Kde hľadať pevný bod vmeniacom sa svete? (Absynt, 2020)