Polska też może w A.I. Polacy tworzą PLLuM – konkurencję dla Chat GPT!

Rozwój sztucznej inteligencji coraz bardziej przypomina zimnowojenny rozwój technologii kosmicznych. Stawka jest wysoka i wszystkim dobrze znana: całkowite zrewolucjonizowanie rynku pracy i rozwoju technologicznego w ogóle. Nie zawsze jednak, kiedy mamy do czynienia z takim globalnym wyścigiem, okazuje się, że również Polska bierze w nim udział. Najnowsze informacje potwierdzają, że interdyscyplinarny zespół polskich naukowców stanie przed zadaniem zbudowania własnej, polskiej sztucznej inteligencji. Fundusze już zostały zaakceptowane. Na czym ma polegać polski moduł językowy PLLuM?

Polski model językowy PLLuM – sensacja, która stała się rzeczywistością

Jeśli 30 listopada 2022 roku, kiedy premierę miał Chat GPT, ktoś na serio stwierdziłby, że rok później Polska przystąpi do rywalizacji w zakresie rozwoju sztucznej inteligencji, zostałby raczej słusznie wyśmiany. Tymczasem ten fantasmagoryczny scenariusz powoli staje się faktem. Polska alternatywa dla Chat GPT została już oficjalnie ogłoszona. Co wiemy o polskim module wykorzystującym A.I.?

Na początku grudnia potwierdził się pozytywny scenariusz dla polskiego, interdyscyplinarnego zespołu ekspertów, który ma zająć się przełomowym projektem. Moduł językowy ma nosić nazwę PLLuM – to akronim od Polish Large Language Universal Model. PLLuM – bądź też po prostu “Śliwka” – ma być modułem z jednej strony całkowicie otwartym, z drugiej zaś – darmowym i dostępnym dla wszystkich.

Otwartoźródłowy, duży model językowy ma czerpać przede wszystkim z polskojęzycznych źródeł. Ma stanowić alternatywę dla projektów opartych przede wszystkim na źródłach anglojęzycznych. Jak podkreślają wnioskodawcy projektu naukowego, bo w takiej formule będą trwały prace, rozwój sztucznej inteligencji może niekorzystnie wpływać na globalizację kulturową, pozbawiając mniejsze jednostki cennych informacji, które powinny być skatalogowane na przyszłość. Mówiąc bardziej kolokwialnie, PLLuM to polska alternatywa, która ma nas zabezpieczyć na wypadek, gdyby Chat GPT postanowiło “odłączyć wtyczkę”.

Fundusze już pozyskane. Jak będą przebiegać prace nad polskim modułem PLLuM?

Przełomowy polski projekt dopiero startuje. Realizowany jest przez jednostki naukowe, co już na wstępie wyróżnia go na tle wiodących rozwiązań komercyjnych. Największe różnice, które wynikają z tego faktu, dotyczą przejrzystości procesu badawczego, niekomercyjnego celu projektu oraz coraz częściej podnoszonej kwestii w przestrzeni publicznej, jaką jest poszanowanie praw autorskich.

Za prace nad PLLuM odpowiada polskie konsorcjum naukowe, w skład którego wchodzi sześć jednostek naukowych:

  • Politechnika Wrocławska (lider konsorcjum),
  • Państwowy Instytut Badawczy NASK,
  • Państwowy Instytut Badawczy – Ośrodek Przetwarzania Informacji,
  • Instytut Podstaw Informatyki Polskiej Akademii Nauk,
  • Uniwersytet Łódzki,
  • Instytut Slawistyki Polskiej Akademii Nauk.

Wiadomo już, że projekt otrzymał dofinansowanie w kwocie 100 milionów złotych. Środki te zostaną wykorzystane na realizację pierwszego etapu prac badawczych – stworzenie dedykowanego centrum obliczeniowego, w którym będzie powstawać PLLuM.

Kolejne etapy obejmują zarówno prace programistyczne z zakresu uczenia maszynowego, jak i prace źródłowe. Warto zwrócić uwagę na interdyscyplinarny charakter zespołu, w składzie którego znaleźli się zarówno reprezentanci nauk informatycznych i matematycznych, jak i językoznawcy i badacze kultury.

Polska “Śliwka”, która ma przysłużyć się społeczeństwu

Jak wspomnieliśmy, Polish Large Language Universal Model ma mieć charakter otwartoźródłowy i ogólnodostępny. Do materiałów treningowych posłużą w większości treści polskojęzyczne. Zamysł autorów projektu jest taki, aby polska “Śliwka” miała charakter maksymalnie użyteczny i mogła być wykorzystywana w różnych obszarach życia społecznego.

W zakresie potencjalnych zastosowań wymieniane jest wsparcie dla usług obywatelskich i urzędów publicznych. Inteligentny, polski chatbot ma docelowo stanowić formę wsparcia komunikacyjnego w miejscach publicznych, np. aby przedstawić petentowi w urzędzie potrzebne informacje.

Dysponując rodzimym modelem językowym, zwiększają się szanse związane z nowoczesną archiwizacją dóbr kultury, a także innymi zagadnieniami z obszaru kultury i dziedzictwa narodowego. To obszar wiedzy, który w dyskursie o sztucznej inteligencji, najczęściej zdominowanym przez pryzmat możliwości technicznych, często jest zaniedbywany.

PLLuM – polska innowacja na skalę światową?

Model PLLuM powstaje zgodnie z metodologią i procesem naukowym, z zasadami odpowiedzialnego rozwoju systemów AI i z poszanowaniem praw autorskich. Transparentność systemu i jego zapowiadana otwartoźródłowość (open-source) to unikaty w skali światowej, jeśli chodzi o rozwój A.I. Potencjał drzemiący w otwartych źródłach może być olbrzymi.

Przede wszystkim jednak PLLuM ma łączyć ułatwianie dostępu do danych, kompetencji, zasobów technicznych i know-how różnych jednostek rządowych, przedsiębiorstw, instytucji publicznych i instytucji naukowych. W oficjalnym ogłoszeniu Wojciech Pawlak, dyrektor Państwowego Instytutu Badawczego NASK, jednego z członków konsorcjum projektu, mówi o wspieraniu nauki, jak i gospodarki. W modelu PLLuM pokładana jest ogromna nadzieja. Projekt ma przyczyniać się do wzrostu konkurencyjności polskich przedsiębiorstw.

flaga Polski, grafika
Jeżeli stworzenie modelu językowego PLLuM się powiedzie, polska nauka może zyskać światową rozpoznawalność.

Wsparcie nauki dla nauki

Model językowy PLLuM ma być wykorzystywany również w nauce, co jest jednym z głównych zastosowań wskazywanych przez uczestników projektu. Na tej płaszczyźnie możemy wyodrębnić kilka zastosować szczegółowych.

Po pierwsze, PLLuM ma być sam w sobie obiektem badań dostarczających wniosków na temat funkcjonowania modeli językowych. Najbardziej ciekawi badaczy fenomen powstawania tzw. halucynacji, czyli efektu, kiedy duży moduł językowy udziela fałszywych informacji przedstawiając je tak, jakby były prawdziwe. Zjawisko to wciąż nie jest do końca zbadane. Istnieje wiele udokumentowanych case studies z innych LLM, kiedy to algorytmy teoretycznie dysponują wystarczającą wiedzą do udzielenia informacji prawidłowej. Prompty również nie są skomplikowane i nie zaburzają logiki odpowiedzi. Pomimo tego rezultatem jest fałszywa informacja udzielona przez LLM.

Po drugie, model PLLuM ma stymulować rozwój nauki w Polsce także w innych obszarach, niż sztuczna inteligencja. Ma służyć wspieraniu prac badawczych, jak i projektów naukowo-komercyjnych.

Ostatecznie, po trzecie, jak wyjaśnia dr Inez Okulska z Zakładu Inżynierii Lingwistycznej i Analizy Tekstu NASK-PIB, polska “Śliwka” ma stanowić istotny krok w rozwoju badań w dziedzinie XAI. XAI – Explainable A.I. – to zupełnie nowa subdyscyplina badawcza, która zajmuje się kwestiami wyjaśnialności sztucznej inteligencji i jej sposobów działania, a także związanymi z nimi kontekstami wykraczającymi poza machine learning.

Polski model językowy PLLuM – podsumowanie

W momencie, kiedy Google prezentuje multimodalny model Google Gemini, a Open A.I. w pocie czoła pracuje nad dalszym rozwojem Chat GPT, Polska nagle staje się małym centrum uwagi ekspertów od sztucznej inteligencji. Polski moduł językowy PLLuM prawdopodobnie nie będzie mógł być porównywany jakościowo do istniejących projektów komercyjnych. Trudno zresztą byłoby tego wymagać, biorąc pod uwagę realia polskiej nauki.

Nie zmienia to jednak faktu, że dopiero u progu prac polska “Śliwka” już zyskała status projektu przełomowego. I słusznie, bo projekt zakłada stworzenie modułu na bazie otwartych źródeł, z poszanowaniem praw autorskich, który będzie służył przede wszystkim nauce i z tego powodu może być potencjalnie bardziej obiektywny. Nie bez znaczenia jest to, że będzie szkolony głównie na materiałach polskojęzycznych, co stanowi istotny krok w kierunku nowoczesnej archiwizacji dóbr kultury i nie tylko. Z pewnością warto obserwować ten temat na bieżąco!

Napisz komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *