Właśnie pojawił się nowy pretendent do tytułu lidera w generowaniu obrazów. Mowa o FLUX.1. Ten nowy model AI, stworzony przez Black Forest Labs, firmę założoną przez kluczowych twórców Stable Diffusion, szybko zdobywa uznanie za swoją zdolność do generowania realistycznych obrazów na niespotykanym dotąd poziomie szczegółowości i precyzji. Co sprawia, że FLUX.1 jest tak wyjątkowy? Przyjrzyjmy się bliżej tej technologii, jej twórcom i potencjalnym zastosowaniom.
FLUX.1 zupełnie nowy model
FLUX.1 to model AI, który od samego początku był projektowany jako następca Stable Diffusion – modelu, który zrewolucjonizował sposób, w jaki generowane są obrazy. Co wyróżnia FLUX.1 na tle konkurencji, to jego zdolność do wiernego odwzorowywania trudnych detali, takich jak ludzkie dłonie, które stanowiły wyzwanie dla wcześniejszych modeli generatywnych.
Firma Black Forest Labs oficjalnie ogłosiła swoje powstanie i wprowadzenie na rynek FLUX.1 w sierpniu 2024 roku. I już jest o niej bardzo głośno.
🔥 I am so damn excited to announce the launch of Black Forest Labs. We set ourselves on a mission to advance state-of-the-art, high-quality generative deep learning models for images and video, and make them available to the broadest audience possible.
— Robin Rombach (@robrombach) August 1, 2024
Today, we release FLUX.1 https://t.co/RXmEvgOj5t
Twórcy FLUX.1 to zespół ekspertów z misją
Za FLUX.1 stoi zespół ekspertów, którzy wcześniej współtworzyli Stable Diffusion. W skład zespołu wchodzą:
Imię i Nazwisko | Poprzednie Miejsce Pracy / Projekty |
---|---|
Dr Robin Rombach | Współtwórca Stable Diffusion, Uniwersytet w Heidelbergu. |
Dr Patrick Esser | Współtwórca Stable Diffusion, praca nad modelami dyfuzyjnymi. |
Dr Andreas Blattmann | Pracował nad modelami dyfuzyjnymi, współtwórca Stable Diffusion. |
Dustin Podell | Praca przy projektach związanych z AI, w tym Stable Diffusion. |
Dominik Lorenz | Związany z projektami AI, m.in. Stable Diffusion. |
„Naszym celem jest nie tylko stworzenie najnowocześniejszych modeli generatywnych, ale także udostępnienie ich szerokiej publiczności,” mówi Dr Robin Rombach, jeden z założycieli Black Forest Labs. „Chcemy, aby każdy mógł korzystać z mocy AI, niezależnie od zasobów, jakimi dysponuje.”
Możliwości FLUX.1
FLUX.1 otwiera nowe możliwości dla różnych branż, od rozrywki po edukację. Dzięki wysokiej precyzji i jakości generowanych obrazów, model ten może znaleźć zastosowanie w tworzeniu grafik koncepcyjnych, ilustracji, a nawet w bardziej zaawansowanych projektach, takich jak tworzenie wirtualnych środowisk i postaci.
Na wykresie przedstawionym na obrazku widzimy porównanie modeli generatywnych AI pod względem ich wyników ELO, co jest metodą oceny jakości generowanych obrazów na podstawie testów porównawczych. Wykres ukazuje, jak FLUX.1 w różnych wariantach (pro, dev, schnell) porównuje się do innych modeli, takich jak SD5-Ultra, Ideogram, Midjourney V6.0, DALL-E 3 HD i inne.
ELO score to miara często używana do oceny skuteczności modeli generatywnych, gdzie modele są oceniane na podstawie wyników porównań parami, co daje bardziej wyrafinowany obraz ich wydajności niż proste metryki jakości. Wyższy wynik ELO oznacza lepsze wyniki w generowaniu obrazów w różnych testach, takich jak precyzja odwzorowania detali, zgodność z promptem oraz ogólna jakość wizualna.
Jednym z najbardziej imponujących aspektów FLUX.1 jest jego zdolność do wiernego odwzorowania ludzkich dłoni – elementu, który stanowił wyzwanie dla wcześniejszych modeli. To osiągnięcie stawia FLUX.1 w jednym rzędzie z takimi modelami jak Midjourney V6, a w niektórych aspektach nawet je przewyższa. Kilka przykładów poniżej:
FLUX.1 jest dostępny w trzech różnych wariantach, z których każdy ma swoje unikalne zastosowanie i przeznaczenie:
Wariant | Opis | Zastosowanie | Dostępność |
---|---|---|---|
FLUX.1 [pro] | Najbardziej zaawansowany model, oferujący najwyższą jakość generowanych obrazów. | Zastosowania komercyjne, dostępny przez API. | Replicate, fal.ai, API Black Forest Labs. |
FLUX.1 [dev] | Model z otwartymi wagami, przeznaczony do niekomercyjnych zastosowań. | Badania, projekty akademickie, indywidualne eksperymenty. | HuggingFace, Replicate, fal.ai. |
FLUX.1 [schnell] | Najszybszy model, zoptymalizowany do użytku lokalnego i osobistego. | Użytek domowy, szybkie prototypowanie. | HuggingFace, GitHub, fal.ai. |
FLUX.1 jest modelem open source. Black Forest Labs, firma odpowiedzialna za stworzenie FLUX.1, udostępniła wersję [dev] oraz [schnell] z otwartymi wagami (open weights) do użytku niekomercyjnego. Model FLUX.1 [dev] jest dostępny na platformie HuggingFace, co umożliwia szerokie zastosowanie w badaniach i projektach akademickich. Z kolei FLUX.1 [schnell] jest dostępny również na HuggingFace oraz GitHubie, gdzie można pobrać i używać modelu zgodnie z licencją Apache 2.0.
Jedynie wersja FLUX.1 [pro], która jest przeznaczona do zastosowań komercyjnych i oferuje najwyższą jakość generowanych obrazów, nie jest w pełni open source i wymaga dostępu przez API oferowane przez Black Forest Labs.
FLUX.1 jest dostępny na wielu platformach, w tym na Replicate, fal.ai, oraz HuggingFace. Niezależnie od tego, czy jesteś artystą, naukowcem, czy po prostu entuzjastą technologii, FLUX.1 oferuje narzędzie, które pozwoli Ci przekroczyć granice kreatywności. Dzięki różnym wariantom modelu, każdy może znaleźć wersję najlepiej dopasowaną do swoich potrzeb i możliwości sprzętowych.