Słownik AI

Generatywna sztuczna inteligencja – ang. Generative Artificial Intelligence, GenAI

Generatywna sztuczna inteligencja: definicja i działanie

Czym jest Generatywna sztuczna inteligencja (generative artificial intelligence)?

Generatywna sztuczna inteligencja, skracana do GenAI, to klasa algorytmów uczonych na dużych zbiorach danych w celu samodzielnego wytwarzania nowych treści, od tekstu i obrazów po dźwięk, kod czy cząsteczki chemiczne. Podstawą jej działania jest modelowanie rozkładu prawdopodobieństwa w danych treningowych tak, aby możliwe stało się tworzenie przykładów, które nie występowały wcześniej, lecz zachowują spójność ze zjawiskami zaobserwowanymi podczas uczenia. GenAI różni się od klasycznych systemów predykcyjnych AI tym, że zamiast wskazywania klasy lub wartości liczbowej, syntetyzuje kompletne obiekty o nowych właściwościach.

Tło historyczne

Pierwsze próby generatywnego podejścia sięgają modeli Markowa rozwijanych w latach 50. XX w., lecz prawdziwy rozwój nastąpił wraz z publikacją Generative Adversarial Networks Iana Goodfellowa i zespołu Uniwersytetu Montrealskiego w 2014 r. Od tego czasu pojawiły się kolejne architektury: wariacyjne autoenkodery (VAE) wspierane przez Google Brain, transformatory zaproponowane przez badaczy Google w 2017 r., a ostatnio dyfuzyjne modele obrazowe rozwijane przez OpenAI, Stability AI i wielu niezależnych badaczy. Integracja dużych mocy obliczeniowych GPU oraz samo-uczenia na masywnych zbiorach danych uczyniła GenAI praktycznym narzędziem badawczym i biznesowym.

Jak dokładnie działa Generatywna sztuczna inteligencja (generative artificial intelligence)

Typowy model generatywny uczy się poprzez samodzielną analizę korelacji w nieoznaczonych danych, stosując techniki uczenia samonadzorowanego lub kontrastowego. W trakcie fazy treningowej sieć neuronowa optymalizuje funkcję straty, która mierzy różnicę między wytworzonym a rzeczywistym przykładem. Warianty architektoniczne determinują algorytm generacji:

Proces uczenia

W GAN-ach sieć generatora rywalizuje z siecią dyskryminatora, aż do osiągnięcia równowagi gry. VAEs inkorporują probabilistyczne kodowanie rozkładu ukrytego, a transformatory przewidują kolejne tokeny na podstawie kontekstu. Modele dyfuzyjne odtwarzają dane, ucząc się odwracania procesu dodawania szumu Gaussowskiego.

Etap generacji

Po zakończeniu uczenia użytkownik przekazuje zapytanie lub warunek początkowy. Model, iteracyjnie lub autoregresyjnie, próbuje wygenerować nowy przykład zgodny ze statystyką rozkładu. W przypadku modeli językowych dobór słów regulują techniki takie jak temperature sampling, nucleus sampling czy beam search, z kolei w modelach obrazowych stosuje się krokową denoizację lub latencję w przestrzeni VAE.

Zastosowania w praktyce

GenAI wspiera tworzenie treści marketingowych, personalizację komunikatów, projektowanie opakowań i grafiki, komponowanie muzyki, syntezę głosu, automatyzację kodu czy przyspieszenie badań farmaceutycznych poprzez projektowanie białek. Przykładowo model językowy może wygenerować roboczy szkic raportu finansowego w oparciu o dane kwartalne, oszczędzając analitykom wielogodzinnej pracy, a algorytm dyfuzyjny potrafi zaproponować koncepcję plakatu kampanii, której szczegóły grafik dopracuje ręcznie.

Zalety i ograniczenia

Do najważniejszych atutów należy zdolność szybkiego wytwarzania wariantów i prototypów, wzbogacanie kreatywności zespołów oraz przyspieszenie rozwiązywania problemów złożonych, gdzie klasyczne algorytmy wyszukiwania zawodzą. Ograniczenia to znaczne zapotrzebowanie na dane i energię, trudność w zapewnieniu pełnej interpretowalności działania oraz ryzyko halucynacji, czyli wygenerowania treści fałszywej, ale spójnej z wzorcem językowym lub wizualnym.

Na co uważać?

Zastosowanie GenAI wymaga świadomego zarządzania ryzykiem prawnym i etycznym. Modele mogą odzyskiwać fragmenty danych źródłowych, rodząc pytania o prawa autorskie. Ponadto generowanie syntetycznych obrazów osób lub wypowiedzi może wprowadzać odbiorców w błąd, dlatego warto stosować znaczniki metadanych i procedury weryfikacji faktów. Wykluczenia i uprzedzenia utrwalone w danych mogą przenosić się na wyniki, wpływając na dyskryminację w rekomendacjach i decyzjach biznesowych.

Dodatkowe źródła

Przegląd współczesnych metod i zastosowań GenAI prezentuje artykuł A Survey of Foundation Models. Wprowadzenie do teorii sieci generatywnych GAN można znaleźć w oryginalnej pracy Generative Adversarial Nets. Szerszy kontekst historyczny opisuje hasło Sztuczna inteligencja w Wikipedii, a aktualne przykłady kodu dostępne są w repozytoriach HuggingFace.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *