Aktualności Narzędzia AI

Opublikowano nowy model polskiego modelu PLLuM

śliwki na gałęzi

NASK poinformował o udostępnieniu nowego modelu PLLuM‑12B‑nc‑250715. Zbudowano go na rozszerzonym i starannie wyselekcjonowanym zbiorze danych. W jego treningu wykorzystano bowiem m.in. treści pochodzące z polskich serwisów rządowych, zasobów naukowych oraz dokumentów urzędowych. Poprawiło jego przydatność w pracy administracyjnej i akademickiej. Nowa wersja lepiej radzi sobie z generowaniem zrozumiałych i dobrze sformatowanych tekstów, takich jak e-maile urzędowe, wnioski czy raporty.

Trzy warianty nowego modelu PLLuM

Nowy PLLuM dostępny jest w trzech wariantach, różniących się stopniem specjalizacji i zastosowaniem:

  • base – surowy model językowy po adaptacji do języka polskiego, trenowany na ponad 140 miliardach słów,
  • instruct – wersja dostrojona do wykonywania poleceń i komend,
  • chat – wariant konwersacyjny, przeszkolony w dialogu, wzbogacony o dane syntetyczne i oceniany przez ludzi.

Każdą z wersji opracowano z myślą o konkretnym scenariuszu zastosowań. Mówimy tutaj o badaniach naukowych, przez administrację publiczną, aż po integrację w produktach komercyjnych.

Bezpieczeństwo, etyka i zgodność z prawem

Nowy wariant modelu PLLuM stworzono także z myślą o ograniczeniu potencjalnych zagrożeń związanych z generatywną sztuczną inteligencją. Zastosowane mechanizmy ochrony znacząco redukują bowiem skuteczność ataków typu prompt injection. Mianowicie, jak podaje NASK, skuteczność takich ataków spadła do zaledwie 2–3% przypadków. To oznacza, że model lepiej rozpoznaje próby manipulacji i jest mniej podatny na generowanie niepożądanych treści.

Dane zgodne z regulacjami krajowymi i unijnymi

Ważnym elementem rozwoju PLLuM‑12B‑nc była zgodność z obowiązującym prawem. Zbiory danych wykorzystywane w procesie uczenia starannie wyselekcjonowano pod kątem legalności. W związku z tym całkowicie wykluczono materiały objęte prawem autorskim bez zgody właścicieli. Proces generowania danych syntetycznych podlegał dodatkowej ocenie przez ekspertów.

Model PLLuM wpisuje się tym samym w europejskie standardy rozwoju sztucznej inteligencji – w szczególności w kontekście nadchodzących regulacji AI Act.

Kto stoi za nowym modelem PLLuM? Polskie konsorcjum HIVE AI

Rozwój modelu PLLuM to efekt współpracy w ramach konsorcjum HIVE AI, które skupia kluczowe polskie instytucje naukowe i technologiczne. Liderem projektu jest Politechnika Wrocławska, a w skład zespołu wchodzą także:

  • NASK – Państwowy Instytut Badawczy
  • OPI PIB – Ośrodek Przetwarzania Informacji
  • Instytut Podstaw Informatyki PAN
  • Uniwersytet Łódzki
  • Instytut Slawistyki PAN

Współpraca tych jednostek umożliwiła nie tylko stworzenie modelu na światowym poziomie, ale również przygotowanie go do zastosowań w polskich realiach językowych i instytucjonalnych.

Finansowanie i zaplecze technologiczne

Projekt finansuje Ministerstwo Cyfryzacji, które przekazało blisko 14,5 miliona złotych na jego rozwój. Dalsze wsparcie techniczne i wdrożeniowe zapewniają COI (Centralny Ośrodek Informatyki) oraz ACK Cyfronet AGH, gdzie model jest testowany i rozwijany w środowisku wysokowydajnych obliczeń.

Gdzie i jak można skorzystać z PLLuM?

Nowa odsłona PLLuM została udostępniona społeczności badaczy, programistów i instytucji w otwartym dostępie, za pośrednictwem platformy Hugging Face. Użytkownicy mogą pobrać i testować wszystkie trzy warianty modelu: base, instruct oraz chat. Dostęp do modeli jest poprzedzony krótkim formularzem, co pozwala twórcom monitorować zastosowania i zapewniać zgodność z zasadami etycznymi.

Dodatkowo, model konwersacyjny – PLLuM Chat – można już testować za pomocą dedykowanej aplikacji webowej. Została ona przygotowana z myślą o instytucjach publicznych i partnerach technologicznych.

Zastosowania w administracji, nauce i biznesie

Nowy PLLuM został zaprojektowany z myślą o praktycznych zastosowaniach – przede wszystkim w administracji publicznej. Może wspierać samorządy, ministerstwa czy urzędy w tworzeniu dokumentów, korespondencji czy analiz tekstowych. Dzięki wysokiej jakości danych naukowych i technicznych, model znajdzie też zastosowanie w sektorze badawczo-rozwojowym oraz w projektach komercyjnych.

Już teraz trwają prace nad integracją modelu z systemami obiegu dokumentów i e-usługami. Konsorcjum zapowiada także kolejne wersje i eksperymentalne rozszerzenia modelu, które mają pojawić się w najbliższych tygodniach.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *