KOLIK JAZYKŮ UMÍŠ, TOLIKRÁT JSI…

#Zaujalo nás
Zpět

DÍKY MOBILU SE TEĎ SNADNO DOROZUMÍTE KDEKOLI NA SVĚTĚ – STAČÍ BÝT PŘIPOJENÝ A VYBRAT SI PŘÍSLUŠNÝ JAZYK, DO KTERÉHO SI NECHÁTE PŘELOŽIT SVÁ PŘÁNÍ. STROJOVÝ PŘEKLAD NÁS PROPOJUJE S CELÝM SVĚTEM, BOŘÍ JAZYKOVÉ BARIÉRY A ŠETŘÍ PENÍZE. ZAJÍMÁ VÁS, JAK TO VŠECHNO FUNGUJE?

 

Používáme ho denně a vděčíme mu za mnohé. Studovaní překladatelé sice možná brzy nebudou mít co do huby, ale vy se díky němu dozvíte třeba to, co si právě teď napsal do facebookového statusu váš kámoš z Izraele a v minutě si hodíte do souvislostí online projev francouzského premiéra, i když se tímhle jazykem umíte jen líbat.

 

Strojový překlad nás propojuje s celým světem, boří jazykové bariéry a šetří peníze. Uvědomíme-li si fakt, že se na světě mluví třemi až osmi tisíci jazyků, devět z nich má víc než 100 milionů mluvčích a jen v Evropské unii je třiadvacet oficiálních jazyků, jsou pro náš život strojové překlady opravdu objevem století.

 

Kateřina Veselovská„Je to hravá a neskutečně zábavná disciplína na pomezí informatiky a lingvistiky, ale vyřádí se na ní i statistici a softwaroví inženýři,“ říká Kateřina Veselovská, která se v Ústavu formální a aplikované lingvistiky Matematicko-fyzikální fakulty Univerzity Karlovy dlouhodobě zabývá možnostmi automatického zpracování emocí v rámci psané i mluvené řeči a textovou analytikou obecně a působí také jako datová analytička ve společnosti Deloitte.

 

 

 

„Český strojový překlad má ve světě dobré jméno. Hybridní systémy kombinující pravidla a statistiku, se kterými pracujeme třeba my na ÚFALu, pravidelně poráží i Překladač Google,“ doplňuje. Jak frázový překlad, který pracuje se slovy jako nedělitelnými a izolovanými jednotkami a vnímá tedy větu jako celek, tak překlad hloubkověsyntaktický, jehož úkolem je vzít v potaz gramatiku zdrojového i cílového jazyka, se nejen díky narůstajícímu množství dat neustále zdokonaluje.

 

Nepřekládá se mezi všemi jazykovými páry, ale většinou přes takzvaný pivotní jazyk, kterým je často angličtina. To znamená, že například z češtiny do čínštiny probíhá překlad způsobem čeština-angličtina a odtud angličtina-čínština. Frázový statistický překlad prý umí využít i posloupnost slov, takže nezvrtá idiomy, které jsou obzvlášť citlivé. „Když si má takový překladač poradit třeba s frází ‚Kick the bucket‘, nepřeloží ji jako ‚nakopnout koš‘, ale správně jako ‚natáhnout bačkory‘,“ doplňuje Kateřina Veselovská. Na druhou stranu prý statistickému překladu ale dělají problémy třeba frázová slovesa v angličtině nebo odlučitelné předpony v němčině, protože jsou v textu prostě moc daleko od sebe. „Na to se zase víc hodí syntaktický překlad, který bere v úvahu celou větnou strukturu,“ dodává.

 

JAZYKOVĚDCI, KTEŘÍ ZACHRAŇUJÍ ŽIVOTY

Že pořád netušíte, která bije? Nevadí, my vlastně taky ne. Zajímavou informací pro vás ale budiž bezesporu fakt, že se díky strojovému překladu podařilo už zachránit i pár životů. Před dvěma lety vytvořili čeští vědci během pouhých devíti hodin strojovýpřekladač z filipínštiny, který po tajfunu Hagupit pomohl během záchranných akcí. „Použili jsme frázový překlad, kde se všechno děje automaticky, stačí jen dodat dvojice dokumentů, které si jdou příkladem. Data jsme naládovali do opensourcového strojového překladače Moses a sám počítač pak vyhodnotil, která slova v jednotlivých větách a které věty si odpovídají. Ty samé úseky se pak použily pro překlad nových vět,“ vysvětluje mladá vědkyně. Hrubý překlad sice nebyl dokonalý, ale pro účely záchranářů bohatě stačil.

 

POKROK NEZASTAVÍŠ

Všechno by prý běželo podle plánu a překladače by se nadále zdokonalovaly, ale to by to nebyla věda, aby jí do cesty nevstoupil nějaký zádrhel. „Loni nám do toho vlezly neuronky, respektive s příchodem hlubokých neuronových sítí se mnohé změnilo,“ pokračuje Veselovská. Neuronová síť je výpočetní model používaný v umělé inteligenci a v principu kopíruje chování biologických struktur. Říká se tomu biologicky inspirované algoritmy a můžeme si to představit podobně jako fungování lidského mozku. Síť se skládá z neuronů, které si mezi sebou posílají signály pomocí přenosových funkcí. Když máme dostatek dat, neuronová síť se v nich sama naučí hledat vzorce, takže v rámci překladu třeba pochopí, jaký ekvivalent odpovídá jakému slovnímu spojení.

 

„Tenhle princip už existuje dlouho, ale průlom nastal až teď, v éře tzv. big dat, kdy už máme na čem systémy trénovat. Průšvih je, že neuronka funguje jako tzv. ‚black box‘ a my vlastně moc nevíme, co se ve které fázi učení děje. Takže je to systém náročný z hlediska interpretace, což je prostě trabl,“ říká Kateřina.

 

Celková úspěšnost je podle ní sice lepší, ale když se člověk podívá na kompletní výsledky, vypadá to u překladu tak, že většina vět je správně, ale když se náhodou přeloží jedna špatně, vznikne totální slovní salát.

 

„To se u statistického překladu většinou nestane. Tam třeba chybí čárka, ale neztratí se význam,“ upozorňuje. Ideální je podle ní tedy nakombinovat neuronové sítě a tradiční přístupy. Tam, kde se neuronka netrefí, použije se statistika. „Představte si, že by takhle fungovala třeba samořiditelná auta. Většinu tras by jela dobře, ale pak by to nepředvídatelně někam napálila. To ať si radši občas blbě vyhodí blinkr,“ uzavírá Kateřina Veselovská a my z toho máme hlavu jako balon.

 

Takže až si příště budete bezděky házet nějakou větu do překladače, zamyslete se nad tím vším a vzdejte hold českým vědcům. Ti momentálně zkouší ve spolupráci s Psychologickým ústavem experimentovat s tím, na co se vlastně lidé při hodnocení kvality překladu soustředí.

 

„Kolega Ondřej Bojar vede výzkum, ze kterého vzniká jakýsi automatický tlumočník. Mělo by to v praxi fungovat třeba tak, že když například cizinec ztratí kufry, zavolá tam, řekne ‚ztratil jsem kufry‘ a ono mu to tu větu přeloží do češtiny, takže ji může sdělit policajtům, kteří by mu jinak nerozuměli. Zatím sbíráme data, ale mělo by se to brzy rozjet,“ uzavírá Veselovská a my smekáme.

 


Google_Translate_Icon100x100PŘEKLADAČ GOOGLE

ANDROID, iOS (zdarma)

 

 

 

Umělá inteligence už pronikla i do slavného překladače od Googlu. Nový algoritmus Google Neural Machine Translation se snaží pochopit význam celé věty, nejen jejích částí, a jeho cílem je zničit bariéru mezi lidským a strojovým překladem. Díky pokročilé neuronové síti klesl počet chyb v překladech nejpoužívanějších jazyků o 55 až 85 %.

 

 

Zpět