Artykuły Graficzne Narzędzia AI

FLUX.1: Pretendent do tronu w generowaniu obrazów AI

Właśnie pojawił się nowy pretendent do tytułu lidera w generowaniu obrazów. Mowa o FLUX.1. Ten nowy model AI, stworzony przez Black Forest Labs, firmę założoną przez kluczowych twórców Stable Diffusion, szybko zdobywa uznanie za swoją zdolność do generowania realistycznych obrazów na niespotykanym dotąd poziomie szczegółowości i precyzji. Co sprawia, że FLUX.1 jest tak wyjątkowy? Przyjrzyjmy się bliżej tej technologii, jej twórcom i potencjalnym zastosowaniom.

FLUX.1 zupełnie nowy model

FLUX.1 to model AI, który od samego początku był projektowany jako następca Stable Diffusion – modelu, który zrewolucjonizował sposób, w jaki generowane są obrazy. Co wyróżnia FLUX.1 na tle konkurencji, to jego zdolność do wiernego odwzorowywania trudnych detali, takich jak ludzkie dłonie, które stanowiły wyzwanie dla wcześniejszych modeli generatywnych.

Firma Black Forest Labs oficjalnie ogłosiła swoje powstanie i wprowadzenie na rynek FLUX.1 w sierpniu 2024 roku. I już jest o niej bardzo głośno.

Twórcy FLUX.1 to zespół ekspertów z misją

Za FLUX.1 stoi zespół ekspertów, którzy wcześniej współtworzyli Stable Diffusion. W skład zespołu wchodzą:

Imię i NazwiskoPoprzednie Miejsce Pracy / Projekty
Dr Robin RombachWspółtwórca Stable Diffusion, Uniwersytet w Heidelbergu.
Dr Patrick EsserWspółtwórca Stable Diffusion, praca nad modelami dyfuzyjnymi.
Dr Andreas BlattmannPracował nad modelami dyfuzyjnymi, współtwórca Stable Diffusion.
Dustin PodellPraca przy projektach związanych z AI, w tym Stable Diffusion.
Dominik LorenzZwiązany z projektami AI, m.in. Stable Diffusion.
https://blackforestlabs.ai/our-team/

„Naszym celem jest nie tylko stworzenie najnowocześniejszych modeli generatywnych, ale także udostępnienie ich szerokiej publiczności,” mówi Dr Robin Rombach, jeden z założycieli Black Forest Labs. „Chcemy, aby każdy mógł korzystać z mocy AI, niezależnie od zasobów, jakimi dysponuje.”

Możliwości FLUX.1

FLUX.1 otwiera nowe możliwości dla różnych branż, od rozrywki po edukację. Dzięki wysokiej precyzji i jakości generowanych obrazów, model ten może znaleźć zastosowanie w tworzeniu grafik koncepcyjnych, ilustracji, a nawet w bardziej zaawansowanych projektach, takich jak tworzenie wirtualnych środowisk i postaci.

Na wykresie przedstawionym na obrazku widzimy porównanie modeli generatywnych AI pod względem ich wyników ELO, co jest metodą oceny jakości generowanych obrazów na podstawie testów porównawczych. Wykres ukazuje, jak FLUX.1 w różnych wariantach (pro, dev, schnell) porównuje się do innych modeli, takich jak SD5-Ultra, Ideogram, Midjourney V6.0, DALL-E 3 HD i inne.

ELO score to miara często używana do oceny skuteczności modeli generatywnych, gdzie modele są oceniane na podstawie wyników porównań parami, co daje bardziej wyrafinowany obraz ich wydajności niż proste metryki jakości. Wyższy wynik ELO oznacza lepsze wyniki w generowaniu obrazów w różnych testach, takich jak precyzja odwzorowania detali, zgodność z promptem oraz ogólna jakość wizualna.

Jednym z najbardziej imponujących aspektów FLUX.1 jest jego zdolność do wiernego odwzorowania ludzkich dłoni – elementu, który stanowił wyzwanie dla wcześniejszych modeli. To osiągnięcie stawia FLUX.1 w jednym rzędzie z takimi modelami jak Midjourney V6, a w niektórych aspektach nawet je przewyższa. Kilka przykładów poniżej:

FLUX.1 DEV

FLUX.1 jest dostępny w trzech różnych wariantach, z których każdy ma swoje unikalne zastosowanie i przeznaczenie:

WariantOpisZastosowanieDostępność
FLUX.1 [pro]Najbardziej zaawansowany model, oferujący najwyższą jakość generowanych obrazów.Zastosowania komercyjne, dostępny przez API.Replicate, fal.ai, API Black Forest Labs.
FLUX.1 [dev]Model z otwartymi wagami, przeznaczony do niekomercyjnych zastosowań.Badania, projekty akademickie, indywidualne eksperymenty.HuggingFace, Replicate, fal.ai.
FLUX.1 [schnell]Najszybszy model, zoptymalizowany do użytku lokalnego i osobistego.Użytek domowy, szybkie prototypowanie.HuggingFace, GitHub, fal.ai.

FLUX.1 jest modelem open source. Black Forest Labs, firma odpowiedzialna za stworzenie FLUX.1, udostępniła wersję [dev] oraz [schnell] z otwartymi wagami (open weights) do użytku niekomercyjnego. Model FLUX.1 [dev] jest dostępny na platformie HuggingFace, co umożliwia szerokie zastosowanie w badaniach i projektach akademickich. Z kolei FLUX.1 [schnell] jest dostępny również na HuggingFace oraz GitHubie, gdzie można pobrać i używać modelu zgodnie z licencją Apache 2.0.

Jedynie wersja FLUX.1 [pro], która jest przeznaczona do zastosowań komercyjnych i oferuje najwyższą jakość generowanych obrazów, nie jest w pełni open source i wymaga dostępu przez API oferowane przez Black Forest Labs.

FLUX.1 jest dostępny na wielu platformach, w tym na Replicate, fal.ai, oraz HuggingFace. Niezależnie od tego, czy jesteś artystą, naukowcem, czy po prostu entuzjastą technologii, FLUX.1 oferuje narzędzie, które pozwoli Ci przekroczyć granice kreatywności. Dzięki różnym wariantom modelu, każdy może znaleźć wersję najlepiej dopasowaną do swoich potrzeb i możliwości sprzętowych.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *