Naukowcy z Politechniki Gdańskiej oraz OPI zaprezentowali swoje nowe osiągnięcie w technologii AI – modele językowe Qra. Są to narzędzia, które interpretują i generują tekst w języku polskim. Przewyższają pod tym względem dotychczasowe rozwiązania takie jak narzędzia Mety czy Mistral AI.
Qra wyznacza nowe standardy w zrozumieniu i generowaniu polskiego tekstu. Oferuje ponadto możliwości nieosiągalne dla wcześniejszych modeli, nietrenowanych w wystarczającym stopniu na języku polskim. Dzięki zaawansowanej analizie i syntezie języka otwiera również nowe horyzonty dla polskojęzycznych aplikacji AI.
Technologiczne podwaliny
Stworzenie Qra było możliwe dzięki zaawansowanej infrastrukturze Politechniki Gdańskiej, w tym superkomputerowi Kraken oraz specjalistycznemu oprogramowaniu. Kluczową rolę odegrał tu bowiem klaster 21 kart graficznych NVidia A100 80GB, co pozwoliło skrócić proces tworzenia najbardziej złożonych modeli z lat do zaledwie miesiąca.
Różnorodność modeli Qra
W ramach projektu powstały trzy warianty modelu o różnym stopniu złożoności: Qra1B, Qra7B oraz Qra13B. Modele te charakteryzują się zdolnością do analizy i generowania polskiego tekstu. Zostało to potwierdzone przez naukowców w kilku testach.
Modele Qra będą służyć jako fundament dla zaawansowanych rozwiązań informatycznych, które wymagają głębokiego zrozumienia języka polskiego. Potencjalne aplikacje obejmują klasyfikację tekstów, generowanie streszczeń czy udzielanie odpowiedzi na zadane pytania.
Dostępność i przyszłość
Opracowane modele Qra są dostępne w repozytorium OPI-PG na platformie huggingface, co umożliwia ich wykorzystanie w różnorodnych dziedzinach i zastosowaniach. Nadchodzące prace nad strojeniem modeli otwierają nowe perspektywy w precyzyjnym modelowaniu języka polskiego w kontekście AI.
Qra stanowi znaczący krok naprzód w rozwoju polskojęzycznej sztucznej inteligencji. Ustanawia także nowe standardy w zrozumieniu i generowaniu tekstów w języku polskim.