Polska sztuczna inteligencja PLLuM już dostępna dla każdego

Ministerstwo Cyfryzacji zaprezentowało polski model językowy sztucznej inteligencji – PLLuM – oraz plan jego rozwoju. Od dziś model dostępny jest dla każdego.

Mieszko Zagańczyk (Mieszko)
30
Udostępnij na fb
Udostępnij na X
Polska sztuczna inteligencja PLLuM już dostępna dla każdego

PLLuM (Polish Large Language Model) to rodzina modeli sztucznej inteligencji, które pozwalają przetwarzać i generować teksty w języku polskim. Modele zostały stworzone przez polskich ekspertów z dziedziny IT i lingwistyki.

Dalsza część tekstu pod wideo

PLLuM to dowód na to, że możemy rozwijać nowoczesne technologie na własnych warunkach, w naszym języku, z korzyścią dla obywatelek i obywateli. Tworzymy fundament pod inteligentne usługi publiczne i innowacje, które będą realnym wsparciem zarówno dla administracji, jak i biznesu

powiedziałwicepremier i minister cyfryzacji Krzysztof Gawkowski.

Polski model językowy PLLuM wykorzystuje od 8 do 70 miliardów parametrów i pozwala na precyzyjne generowanie treści w języku polskim. Jego twórcy przekonują, że mniejsze wersje dobrze sprawdzają się w szybkich zadaniach, podczas gdy większe modele mają oferować wyższą precyzję i kontekstową spójność w rozumieniu języka polskiego. 

Wersje PLLuM do użytku komercyjnego wykorzystują zasoby tekstowe od właścicieli, którzy udzielili licencji konsorcjum, a także zasoby, które, zgodnie z ustawą o prawie autorskim i prawach pokrewnych oraz przepisami UE, mogą być wykorzystane do budowy w pełni otwartego modelu. Modele naukowe (udostępniane na licencjach, które nie pozwalają na zastosowania komercyjne) korzystają także z ogólnodostępnych zbiorów danych, takich jak Common Crawl.

Ministerstwo Cyfryzacji zapowiada dalsze budowanie ekosystemu polskich modeli językowych. Wspólnie z modelem Bielik mają promować sztuczną inteligencję tworzoną w Polsce, wspierając się wzajemnie.

Rząd przeznaczył na ten projekt 14,5 mln zł, a kolejne 19 mln zł ma pozwolić na wdrożenie modelu w administracji publicznej i rozszerzenie współpracy o nowych partnerów. Projekt realizowany jest na zlecenie Ministerstwa Cyfryzacji, które jest właścicielem wyników i kontroluje rozwój PLLuM.

Twórcy nowego modelu przekonują, że PLLuM wyróżnia się na tle innych modeli językowych. Jest dostosowany do specyfiki języka polskiego oraz terminologii administracji publicznej. PLLuM przede wszystkim korzysta z danych organicznych – opracowywanych ręcznie, a nie przy użyciu innych modeli językowych. Jest trenowany na polskich zasobach, ma bardzo dobrze radzić sobie z wyzwaniami fleksji i złożonej składni generując precyzyjne treści.

Do czego w praktyce przyda się PLLuM? Ma być wsparciem dla administracji publicznej, biznesu i całego społeczeństwa. Jednym z przewidywanych zastosowań będzie wirtualny asystent w mObywatelu, ułatwiający korzystanie z aplikacji. Powstanie też inteligentny asystent urzędniczy, który zautomatyzuje przetwarzanie dokumentów, analizę treści, wyszukiwanie informacji i zapewnia wsparcie w udzielaniu odpowiedzi na pytania obywateli. Twórcy PLLuM widzą też jego rolę w edukacji – model ułatwi rozwój aplikacji edukacyjnych, tłumaczeń i pomoc nauczycielom w prowadzeniu lekcji z użyciem najnowszych technologii.

PLLuM jest dostępny na stronie: http://pllum.clarin-pl.eu. Modele można pobrać na Hugging Face (https://router.huggingface.co/CYFRAGOVPL).