Lidé

11. září 2018

Petr Ondrášek z Lingey: Online překladače pracují s citlivými daty, která se mohou dostat ven. Proto se zaměřujeme na offline řešení a bezpečnost dat

Firma Lingea působí na trhu překladačů a slovníků už více než 20 let | Autor: archiv firmy Lingea

V budoucnu by se mohla role překladatelů výrazně změnit, a to zejména díky chytrým softwarům, které dokážou už dnes text přeložit téměř bez chyb a ve správném významu. Časem by se tak z překladatelů mohli stát spíše korektoři, kteří by kontrovali správnost překladu a případně ho uhladili. Významným hráčem v oblasti překladačů, nejen na tuzemském trhu, je česká firma Lingea, jež právě na vývoji svých produktů spolupracuje s VUT. V jejím čele stojí Petr Ondrášek, který prozradil, jak se z původně malé firmy stala společnost, která se rozrostla o další pobočky a své jméno si vybudovala i na mezinárodním trhu.

Čím se firma zabývá a jaká je její historie?
V loňském roce jsme oslavili 20. výročí od založení. Od počátku se firma zaměřovala na jazykové nástroje pro zpracování textu, následoval vývoj překladových slovníků. Naše elektronické slovníky se vždy výrazně odlišovaly od toho, co bylo na trhu. Začínalo se s angličtinou a němčinou a postupně se přidávaly další jazyky a databáze se neustále rozšiřovala a zdokonalovala, např. o další významy a příklady jejich použití. V roce 1997 na veletrhu Invex Lingea se svými slovníky zabodovala – podařilo se jí za čtyři dny prodat více než dvě stě padesát slovníků. Vždy se kladl důraz na kvalitu, proto třeba první slovník vznikal zhruba dva roky. V Lingey se neustále pracuje na různých jazykových datech – na slovnících synonym, korektorech pravopisu a dalších. Máme i vlastní morfologie, tzn. že slovníky obsahují i různé tvary slov. Momentálně jsou naší prioritou překladače, kde je velkým hráčem Google. My mu samozřejmě nechceme, a ani nemůžeme globálně konkurovat, ale v našem regionu střední Evropy chceme rozhodně vyvíjet lepší překladače než on.

Vydáváte ale i tištěné slovníky.
Ano, zhruba před dvanácti lety jsme se vrhli na knižní trh a začali jsme vydávat slovníky tištěné. Prodejnost nás celkem překvapila, protože už v té době byl silný trend používat elektronické slovníky. I knihkupci se na naše tituly dívali nedůvěřivě se slovy, že mají jiných slovníků v regálech nepřeberné množství. Ale nakonec si naše tituly k uživatelům cestu našly a dodnes se knižní slovníky dobře prodávají. Naší výhodou je, že všechna data máme svá, máme na ně autorská práva a můžeme si s nimi nakládat, jak chceme. Díky tomu, že data využíváme v aplikacích, tak už pro nás není problém z nich vytvořit data i pro tisk.

Dokonce se firmě podařilo dostat se za hranice naší republiky. S jakým produktem?
Po zkušenostech z Česka jsme se postupně rozhodli zaměřit na region střední a východní Evropy a s knižními i elektronickými slovníky expandovat do této oblasti. Díky tomu, že jsme měli data různých jazyků k dispozici, tak už bylo překlopení do dalších jazyků jednodušší, než kdybychom vše dělali od začátku. Postupně jsme se i v dalších zemích stali lídry na trhu.

Na vývoji překladačů se v Lingey neustále pracuje. Stále je co vylepšovat | Autor: archiv firmy Lingea

Zmiňoval jste překladače. Kam v této oblasti míříte?
Jsme velmi dobří ve slovanských jazycích, takže jak už jsem zmínil, v této oblasti chceme naši výhodu využít. V překladech dosahujeme lepších výsledků než třeba známý Google. Pro ně region střední Evropy není až tak zajímavý, a proto některé jazyky překládají přes angličtinu – např. překlad z francouzštiny do polštiny. Tím pádem jsou zde větší nepřesnosti. U Lingey se překládá přímo z konkrétního jazyka do jiného. Při vývoji technologie našeho překladače jsme spolupracovali mimo jiné i s VUT.

Na čem aktuálně spolupracujete s naší univerzitou?
Poslední projekt byl MINT – Meeting Assistant, kdy jsme kombinovali rozpoznávání řeči a překladač, tuto funkci jsme začlenili i do našeho CAT nástroje – Computer Aided Translation Tool. Ten mohou využívat třeba překladatelé nebo editoři, kdy vloží text, který se má přeložit, a když nebudou s výsledkem plně spokojeni, mohou vkládat nebo diktovat své vlastní varianty. Aplikaci kombinující rozpoznání řeči s překladačem mohou využít i call centra a oddělení technické podpory, v tomto případě bude software schopen rozpoznat, kterou řečí volající mluví, a hovor přeložit. Variantou bude i plně automatizovaný hovor, kdy podle určitých kritérií software vyhledá v databázi odpověď na dotaz volajícího.

Jejich slovníkům knihkupci zpočátku moc šancí nedávali. Lidé si je však oblíbili | Autor: archiv firmy Lingea
Jak je to s odborností vašich slovníků?
Snažíme se vytvářet i oborově zaměřené překladače, momentálně třeba spolupracujeme s firmou z oblasti medicíny. Dostali jsme data, se kterými ve firmě pracují, a my pak učíme překladač pracovat s tímto typem textů, aby byl překlad kvalitnější a přesnější. Velké zkušenosti už máme s turistickými průvodci, opět jsme využili data, která už máme, a připravili specializovaný neuronový překladač. Odezvy od samotných překladatelů pak byly překvapivé – sami nevěřili, jak jsou přesné a šetří jim čas. Právě na tyto oborové překladače se nyní soustředíme.

V čem se tedy softwary od Lingey liší od konkurence?
Lidé si někdy neuvědomují, že když vloží text do online překladače, ať už je to Google Translate nebo kterýkoli jiný, data se dostanou po síti ven. Problém to může být například, pokud do překladače vkládají pasáže ze smluv apod., kde jsou citlivá data. Online překladače totiž vložená data dále využívají k obohacení svých korpusů. Už se tak stalo, že někdo našel segment citlivého překladu a byl z toho problém. S novou evropskou legislativou GDPR je to ještě přísnější. Lingea je schopná pro klienta připravit řešení offline, takže se data nedostanou mimo firmu a její servery, a jsou tak chráněná. Naše aplikace jsou tedy z tohoto hlediska bezpečnější.

Kolik jazyků podporuje aktuálně váš překladač?
Jsou to hlavně světové jazyky v kombinaci s těmi slovanskými – angličtina, němčina, francouzština, španělština, italština a ruština se překládá do češtiny, slovenštiny, polštiny, ruštiny a pracuje se také na maďarštině a rumunštině. Naše slovníková databáze pak čítá přes padesát světových jazyků.

(kah)

Témata

Související články:
Před šedesáti lety vstoupilo VUT do éry počítačů
Tomáš Dacík se věnuje statické analýze programů. Za práci dostal ocenění Brno Ph.D. Talent
Projekt Ekhi propojuje psychoterapii a virtuální realitu. Pomáhá pacientům zvládat stresující situace
Propojení IT a humanitních věd je nezbytné, říká zakladatel českých metal studies
Vědci z FIT VUT vyvíjejí aplikaci pro psychoterapeuty. Pomocí deep learningu chtějí analyzovat terapeutická sezení