Czym są neuronowe tłumaczenia maszynowe?
Neuronowe tłumaczenia maszynowe (ang. Neural Machine Translation, NMT) to automatyczny przekład z jednego języka naturalnego na inny, wykorzystujący technologię głębokiego uczenia się (ang. deep learning). Deep learning to z kolei rodzaj uczenia maszynowego, korzystający z mechanizmu sieci neuronowych, wzorowanych na działaniu neuronów w ludzkim mózgu.
Gdzie wykorzystywane jest uczenie maszynowe?
Głębokie uczenie zrewolucjonizowało wiele dziedzin naszego życia. Jest wykorzystywane m.in.
- do rozpoznawania mowy, w asystentach głosowych takich jak Siri i Cortana czy chatbotach,
- do rozpoznawania obrazu, co umożliwiło np. rozwój pojazdów autonomicznych,
- w wykrywaniu przestępstw finansowych,
- w przetwarzaniu języka naturalnego (ang. Natural Language Processing, NLP).
I właśnie wykorzystanie głębokiego uczenia w NLP przyczyniło się do rewolucji w tłumaczeniach maszynowych.
Większość z nas kojarzy tłumaczenia maszynowe z internetowymi memami i niegramatycznymi zdaniami. Jeszcze kilka lat temu, kiedy Google Translate i większość innych automatycznych tłumaczy online bazowała na statystycznych silnikach maszynowych (ang. Statistical Machine Translation, SMT), rzeczywiście wiele maszynowych tłumaczeń przyprawiało o napad śmiechu. W dużym uproszczeniu SMT dzieliło zdanie w języku źródłowym na frazy, tłumaczyło je i sklejało w zdanie w języku docelowym. Czasami efekt był świetny, a czasami tragiczny.
NMT przy tłumaczeniu bierze pod uwagę kontekst całego zdania. Znacznie lepiej radzi sobie z morfologią i składnią. Jest też znacznie bardziej przewidywalne. Technologia neuronowych tłumaczeń maszynowych rozwija się bardzo szybko. Silniki maszynowe obsługują coraz więcej języków, a jakość tłumaczeń sukcesywnie się polepsza.
Różnice pomiędzy SMT, a dzisiejszym standardem – NMT dobrze pokazuje poniższy przykład.
Don’t let us forget that the causes of human actions are usually immeasurably more complex and varied than our subsequent explanations of them. |
|
Tłumaczenia maszynowe kiedyś (oparte na metodzie statystycznej)
|
Tłumaczenia maszynowe teraz (oparte na sieciach neuronowych)
|
Nie pozwalać nam zapominać, że powody ludzkich działań są zazwyczaj niezmiernie więcej skomplikowany i różnorodny niż nasze z nich późniejsze wyjaśnienia.
|
Nie zapominajmy, że przyczyny ludzkich działań są zwykle niezmiernie bardziej złożone i zróżnicowane niż nasze ich późniejsze wyjaśnienia.
|
Najpopularniejsze darmowe silniki maszynowe, korzystające z technologii NMT:
- Tłumacz Google https://translate.google.pl/
- DeepL Translator https://www.deepl.com/en/translator
- eTranslation https://ec.europa.eu/cefdigital/wiki/display/CEFDIGITAL/eTranslation+for+SMEs (Tłumacz Komisji Europejskiej, dostępny dla MŚP)
Skoro tłumaczenia maszynowe są tak dobre, do czego potrzebne jest biuro tłumaczeń?
Profesjonalne biuro tłumaczeń wykonuje szereg innych zabiegów mających na celu nie tylko weryfikację tekstu czy nadaje się do tłumaczenia maszynowego, ale również postedycję, czy o bezpieczeństwo danych.
Ocena tekstu przed tłumaczeniem
Tłumaczenia maszynowe są o wiele lepsze niż jeszcze kilka lat temu, ale daleko im jeszcze do doskonałości. Silniki maszynowe z niektórymi rodzajami tekstów radzą sobie lepiej, a z innymi gorzej. Nie każdy tekst czy dokument będzie nadawał się do tłumaczenia maszynowego. W Birecie na początek sprawdzamy każdy tekst i decydujemy, czy możemy wykorzystać do tłumaczenia NMT i obniżyć koszt klienta, czy dobry efekt tłumaczenia uzyskamy jedynie przy tłumaczeniu przez człowieka.
Postedycja
Tłumaczenia neuronowe bez dodatkowego sprawdzenia powinny być używane tylko przy tłumaczeniach prywatnych, wewnętrznych, mało istotnych, gdzie ogólne poznanie sensu tłumaczonego tekstu będzie wystarczające. W przypadku profesjonalnych dokumentów np. tłumaczeń prawnych i finansowych NMT stanowi narzędzie pomocnicze, które pomaga w zredukowaniu czasu i kosztów klienta. Każde tłumaczenie powinno zostać sprawdzone przez tłumacza, który zna zarówno język źródłowy, jak i docelowy (taką korektę nazywamy postedycją). Te wymagania określa norma ISO 18587, dotycząca właśnie tłumaczeń maszynowych, zgodnie z którą działa nasze biuro. W efekcie powstaje tłumaczenie, którego nie da się odróżnić od tłumaczenia wykonanego tylko przez człowieka.
Długość tekstu
Dostępne za darmo silniki neuronowe, takie jak Tłumacz Google czy DeepL, mają ograniczenia w liczbie znaków, które mogą przetłumaczyć. Nie da się w nich tłumaczyć bardzo długich tekstów. W Birecie korzystamy z kilku różnych płatnych silników tłumaczeniowych, dzięki czemu długość tekstu nie stanowi dla nas ograniczenia.
Bezpieczeństwo danych
Nie powinniśmy korzystać z darmowych silników maszynowych do tłumaczenia informacji poufnych i tekstów zawierających dane osobowe. Również płatne wersje nie zawsze gwarantują bezpieczeństwo danych. Dzięki ścisłej współpracy z dostawcami silników tłumaczeniowych Bireta może zadbać lepiej o ochronę informacji przetwarzanych w silnikach maszynowych. Dzięki czemu każde tłumaczenie specjalistyczne czy zwyczajne jest obsługiwanie zgodnie z zasadami ochrony danych. W naszym biurze wdrożyliśmy także System Zarządzania Bezpieczeństwem Informacji, zgodny z normą ISO 27001, co pozwala nam jeszcze lepiej chronić dane naszych klientów oraz własne.
Jakie są korzyści z wykorzystania neuronowych tłumaczeń maszynowych?