DAJ CYNK

Tłumacz Google zaszalał. Kosmiczna liczba nowych języków

Mieszko Zagańczyk

Aplikacje

Tłumacz Google zaszalał. Kosmiczna liczba nowych języków

Google rozszerzył możliwości aplikacji Tłumacz, dodając do niej aż 110 nowych języków, w tym długo oczekiwany kantoński. Na tym jednak nie koniec, bo celem jest aż tysiąc języków.

Tłumacz Google (Google Translate) nieustannie się rozwija, nie tylko pod względem nowych funkcji, ale także obsługiwanych języków. Google dodaje je, wykorzystując sztuczną inteligencję i uczenie maszynowe, co sprawdziło się już w 2022 roku, gdy słownik wzbogacił się o 24 nowe języki. Jak przekonuje Google, dzięki przyjętej metodzie model uczenia maszynowego uczy się tłumaczyć na inny język, nie znając nawet przykładów zastosowań określonych fraz.

100 nowych  języków dzięki PaLM 

Najnowsze uaktualnienie Tłumacza to efekt pracy dużego modelu językowego PaLM 2, dzięki któremu udało się wprowadzić 110 nowych języków, co jest największym rozszerzeniem Tłumacza w historii.

Choć wiele z nowych języków może wydawać się bardzo egzotycznych, Google wyliczył, że w sumie posługuje się nimi 614 milionów użytkowników na całym świecie, co oznacza około 8% światowej populacji. Największy z nowych języków to kantoński, którego w Chinach używa około 83 mln osób. Dlaczego dopiero teraz? Jak wyjaśnia Google, kantoński na piśmie często pokrywa się z językiem mandaryńskim, więc znalezienie danych i wyszkolenie modeli było bardzo trudne.

Z mniej znanych w Tłumaczu pojawiły się też takie języki jak Afar (język tonalny używany w Dżibuti, Erytrei i Etiopii), Manx (mański, język celtycki na Wyspie Man), NKo (jeden z języków zachodnioafrykańskich), Shahmukhi (odmiana języka pendżabskiego), Tamazight (berberyjski) czy Tok Pisin (kreolski język bazujący na angielskim stosowany na Papui-Nowej Gwinei).

Około jedna czwarta nowych języków pochodzi z Afryki, co stanowi największą jak dotąd ekspansję języków afrykańskich w Tłumaczu. Wśród nich pojawiły się języki Fon, Kikongo, Luo, Ga, Swati, Venda i Wolof.

Google zwraca uwagę na trudności w opanowaniu takich języków – wiele z nich nie ma jednej standardowej formy, za to istnieją liczne dialekty. Pośród nich przyjęte zostały te najczęściej używane. Jako przykład podano język romski, który ma wiele dialektów w całej Europie. Google zaadaptował dialekt najbliższy południowemu Vlax Romani, odmianie powszechnie używanej w internecie, ale dodał do tego także elementy innych, takich jak północny Vlax i bałkański Romani. 

PaLM 2 ma z większą skutecznością pomagać Tłumaczowi w nauce języków, które są ze sobą blisko spokrewnione. W pracach nad rozwojem Tłumacza pomagają także native speakerzy oraz eksperci od lingwistyki. Celem Google jest zwiększenie liczby języków w Tłumaczu do tysiąca.

Zobacz: Arkusze Google nieźle się rozpędziły. Na to czekaliśmy
Zobacz: Nowości w przeglądarce Google. Takie rozwiązania doceni każdy

Chcesz być na bieżąco? Obserwuj nas na Google News

Źródło zdjęć: Shutterstock

Źródło tekstu: Google