NASK poinformował o udostępnieniu nowego modelu PLLuM‑12B‑nc‑250715. Zbudowano go na rozszerzonym i starannie wyselekcjonowanym zbiorze danych. W jego treningu wykorzystano bowiem m.in. treści pochodzące z polskich serwisów rządowych, zasobów naukowych oraz dokumentów urzędowych. Poprawiło jego przydatność w pracy administracyjnej i akademickiej. Nowa wersja lepiej radzi sobie z generowaniem zrozumiałych i dobrze sformatowanych tekstów, takich jak e-maile urzędowe, wnioski czy raporty.
Trzy warianty nowego modelu PLLuM
Nowy PLLuM dostępny jest w trzech wariantach, różniących się stopniem specjalizacji i zastosowaniem:
- base – surowy model językowy po adaptacji do języka polskiego, trenowany na ponad 140 miliardach słów,
- instruct – wersja dostrojona do wykonywania poleceń i komend,
- chat – wariant konwersacyjny, przeszkolony w dialogu, wzbogacony o dane syntetyczne i oceniany przez ludzi.
Każdą z wersji opracowano z myślą o konkretnym scenariuszu zastosowań. Mówimy tutaj o badaniach naukowych, przez administrację publiczną, aż po integrację w produktach komercyjnych.
Bezpieczeństwo, etyka i zgodność z prawem

Nowy wariant modelu PLLuM stworzono także z myślą o ograniczeniu potencjalnych zagrożeń związanych z generatywną sztuczną inteligencją. Zastosowane mechanizmy ochrony znacząco redukują bowiem skuteczność ataków typu prompt injection. Mianowicie, jak podaje NASK, skuteczność takich ataków spadła do zaledwie 2–3% przypadków. To oznacza, że model lepiej rozpoznaje próby manipulacji i jest mniej podatny na generowanie niepożądanych treści.
Dane zgodne z regulacjami krajowymi i unijnymi
Ważnym elementem rozwoju PLLuM‑12B‑nc była zgodność z obowiązującym prawem. Zbiory danych wykorzystywane w procesie uczenia starannie wyselekcjonowano pod kątem legalności. W związku z tym całkowicie wykluczono materiały objęte prawem autorskim bez zgody właścicieli. Proces generowania danych syntetycznych podlegał dodatkowej ocenie przez ekspertów.
Model PLLuM wpisuje się tym samym w europejskie standardy rozwoju sztucznej inteligencji – w szczególności w kontekście nadchodzących regulacji AI Act.
Kto stoi za nowym modelem PLLuM? Polskie konsorcjum HIVE AI
Rozwój modelu PLLuM to efekt współpracy w ramach konsorcjum HIVE AI, które skupia kluczowe polskie instytucje naukowe i technologiczne. Liderem projektu jest Politechnika Wrocławska, a w skład zespołu wchodzą także:
- NASK – Państwowy Instytut Badawczy
- OPI PIB – Ośrodek Przetwarzania Informacji
- Instytut Podstaw Informatyki PAN
- Uniwersytet Łódzki
- Instytut Slawistyki PAN
Współpraca tych jednostek umożliwiła nie tylko stworzenie modelu na światowym poziomie, ale również przygotowanie go do zastosowań w polskich realiach językowych i instytucjonalnych.
Finansowanie i zaplecze technologiczne
Projekt finansuje Ministerstwo Cyfryzacji, które przekazało blisko 14,5 miliona złotych na jego rozwój. Dalsze wsparcie techniczne i wdrożeniowe zapewniają COI (Centralny Ośrodek Informatyki) oraz ACK Cyfronet AGH, gdzie model jest testowany i rozwijany w środowisku wysokowydajnych obliczeń.
Gdzie i jak można skorzystać z PLLuM?
Nowa odsłona PLLuM została udostępniona społeczności badaczy, programistów i instytucji w otwartym dostępie, za pośrednictwem platformy Hugging Face. Użytkownicy mogą pobrać i testować wszystkie trzy warianty modelu: base, instruct oraz chat. Dostęp do modeli jest poprzedzony krótkim formularzem, co pozwala twórcom monitorować zastosowania i zapewniać zgodność z zasadami etycznymi.

Dodatkowo, model konwersacyjny – PLLuM Chat – można już testować za pomocą dedykowanej aplikacji webowej. Została ona przygotowana z myślą o instytucjach publicznych i partnerach technologicznych.
Zastosowania w administracji, nauce i biznesie
Nowy PLLuM został zaprojektowany z myślą o praktycznych zastosowaniach – przede wszystkim w administracji publicznej. Może wspierać samorządy, ministerstwa czy urzędy w tworzeniu dokumentów, korespondencji czy analiz tekstowych. Dzięki wysokiej jakości danych naukowych i technicznych, model znajdzie też zastosowanie w sektorze badawczo-rozwojowym oraz w projektach komercyjnych.
Już teraz trwają prace nad integracją modelu z systemami obiegu dokumentów i e-usługami. Konsorcjum zapowiada także kolejne wersje i eksperymentalne rozszerzenia modelu, które mają pojawić się w najbliższych tygodniach.