Sakana Fugu: model-orkiestrator, który kieruje zespołem AI zamiast robić wszystko sam

Japońskie laboratorium Sakana AI opublikowało Fugu – system, który nie próbuje być jednym wszechwiedzącym modelem, lecz pełni rolę dyrygenta zarządzającego zespołem mniejszych, wyspecjalizowanych modeli. Sakana Fugu proponuje architekturę radykalnie odmienną od dominującego podejścia „większy model = lepszy model”. Zamiast budować coraz większy monolit, można zbudować orkiestrę.

Spis treści

Czym właściwie jest Sakana Fugu

Wyobraźmy sobie szpital. Można zatrudnić jednego lekarza, który zna się na wszystkim – od kardiologii po dermatologię. Albo można mieć zespół specjalistów i jednego koordynatora, który wie, do kogo skierować pacjenta z konkretnym problemem. Fugu to właśnie taki koordynator. Nie wykonuje zadań samodzielnie. Analizuje zapytanie użytkownika, rozkłada je na podzadania, a potem deleguje każde z nich do modelu najlepiej przygotowanego do odpowiedzi.

Według oficjalnego ogłoszenia Sakana AI, system udostępniono jako pojedyncze API – użytkownik nie musi wiedzieć, ile modeli pracuje pod spodem ani który z nich akurat odpowiada. Z zewnątrz wygląda to jak rozmowa z jednym asystentem. Wewnątrz działa sieć agentów.

Architektura: jak Fugu decyduje, komu przekazać zadanie

Kluczowy mechanizm Fugu opisano szczegółowo w artykule naukowym opublikowanym na arXiv. Model-orkiestrator Mixture-of-Agents (MoA) otrzymuje zapytanie i przeprowadza analizę intencji. Nie chodzi tu o proste dopasowanie słów kluczowych – Fugu rozumie kontekst, złożoność i dziedzinę problemu. Na tej podstawie wybiera strategię: czy odpowiedzieć jednym modelem, czy rozłożyć zapytanie na kilka równoległych lub sekwencyjnych kroków.

Każdy podmodel w ekosystemie Fugu ma zdefiniowany profil kompetencji. Jeden radzi sobie lepiej z kodem, inny z rozumowaniem matematycznym, jeszcze inny z generowaniem tekstu kreatywnego. Orkiestrator wie o tych mocnych stronach i wykorzystuje je, zamiast zmuszać jeden model do bycia przeciętnym we wszystkim. To podejście zbliżone koncepcyjnie do systemów agentowych, ale realizowane na poziomie infrastruktury, nie pojedynczego promptu.

Co odróżnia Fugu od klasycznego routingu modeli

Routing modeli – czyli przekierowywanie zapytań do różnych modeli w zależności od typu – istnieje od dawna. Platformy takie jak OpenRouter czy nawet proste instrukcje warunkowe w kodzie aplikacji potrafią to robić. Fugu idzie jednak dalej. Różnica polega na trzech elementach.

Po pierwsze, dekompozycja zadań. Fugu nie tylko wybiera model – potrafi rozbić jedno złożone pytanie na kilka prostszych, delegować je osobno i scalić odpowiedzi w spójną całość. Po drugie, adaptacyjność: system uczy się, które modele sprawdzają się w jakich kontekstach i dostosowuje routing dynamicznie. Po trzecie, transparentność dla użytkownika – jedno API, jeden interfejs, zero konfiguracji po stronie developera.

Zespół Sakana AI podkreśla na stronie produktowej Fugu, że celem jest demokratyzacja dostępu do najlepszych możliwości AI bez wymuszania wyboru jednego dostawcy czy jednego modelu.

Sakana Fugu a problem rosnących kosztów monolitycznych modeli

Trenowanie pojedynczego dużego modelu językowego kosztuje dziesiątki, a czasem setki milionów dolarów. Utrzymanie go w produkcji – kolejne miliony miesięcznie. A mimo tych nakładów żaden monolit nie jest najlepszy we wszystkim jednocześnie. GPT-4o świetnie pisze, ale Claude lepiej analizuje długie dokumenty. Gemini ma przewagę w multimodalności. Każdy model ma swoją niszę.

Sakana Fugu proponuje ekonomicznie rozsądną alternatywę: zamiast budować jeden kosztowny model-do-wszystkiego, lepiej skoordynować kilka tańszych, wyspecjalizowanych modeli. Łączny koszt inferencji może być niższy, bo do prostych zadań nie angażujemy pełnej mocy obliczeniowej gigantycznego modelu. To logika znana z inferencji oraz architektury Mixture of Experts, ale przeniesiona na wyższy poziom abstrakcji – z warstw wewnątrz jednego modelu na cały ekosystem wielu modeli.

Kontekst: Sakana AI i filozofia natury

Sakana AI to laboratorium założone w Tokio w 2023 roku przez byłych badaczy Google. Nazwa „sakana” oznacza po japońsku „ryba”, a cała filozofia firmy czerpie z obserwacji natury – stad ryb, które bez centralnego dowodzenia tworzą złożone formacje.

Firma wcześniej zasłynęła pracami nad ewolucyjnym łączeniem modeli (evolutionary model merging), gdzie zamiast trenować model od zera, łączyła istniejące modele metodami inspirowanymi ewolucją biologiczną. Fugu to naturalne rozwinięcie tej idei: skoro modele można łączyć, to można też nauczyć się ich orkiestrować w czasie rzeczywistym.

Efekt?

Wykresy pokazują, że podejście oparte na „inteligencji zbiorowej” pozwala Fugu osiągać znakomite rezultaty, często przewyższające potężne modele monolityczne działające w pojedynkę:

Źródło: https://arxiv.org/pdf/2606.21228

LiveCodeBench & GPQA-D: W tych testach Fugu dominuje. Na LiveCodeBench wersja Ultra zdobywa 93.2, a standardowa 92.9, zostawiając w tyle m.in. Fable 5 (89.8) oraz GPT 5.5 (85.3). W trudnym teście wiedzy GPQA-D oba warianty Fugu osiągają najwyższy wynik (95.5), wyprzedzając Mythos Preview i Gemini 3.1 Pro.
Terminal Bench 2.1 & CharXiv Reasoning: Fugu Ultra zajmuje najwyższe stopnie na podium z wynikami odpowiednio 82.1 oraz 86.6, wyprzedzając konkurencyjne modele od OpenAI, Anthropic i Google.
SWEBench Pro: W wymagającym benchmarku inżynierii oprogramowania Fugu Ultra radzi sobie świetnie z wynikiem 73.7%, znacznie dystansując GPT 5.5 (58.6%) oraz Gemini 3.1 Pro (54.2%), ustępując jedynie modelowi Fable 5 (80.0%).
SciCode & Humanity’s Last Exam: W tych ultra-trudnych testach naukowych Fugu Ultra osiąga odpowiednio 58.7 i 50.0, co plasuje je blisko ścisłej czołówki (nieznacznie za Fable 5, ale wyraźnie przed GPT 5.5 i Gemini 3.1 Pro).
CTI-REALM: Fugu Ultra z wynikiem 69.4 plasuje się na poziomie zbliżonym do lidera zestawienia – Opus 4.8 (69.6).

Główne zalety i wnioski z sieci

Wyższa jakość i mniej błędów: Dzięki temu, że różne modele oceniają i poprawiają nawzajem swoje odpowiedzi (w rolach takich jak myśliciel, wykonawca i weryfikator), generowany kod, analizy czy interfejsy wizualne są o wiele bardziej dopracowane i spójne.
Odporność na awarie i blokady: Fugu stanowi zabezpieczenie przed tzw. vendor lock-in (uzależnieniem od jednego dostawcy). Jeśli dany dostawca API ma awarię lub ograniczy dostęp, Fugu automatycznie i niezauważalnie dla użytkownika przekieruje zadanie do innych dostępnych modeli.
Elastyczność dla firm: Standardowa wersja Fugu pozwala administratorom na wykluczenie określonych modeli z puli (opt-out), co ułatwia spełnienie wewnętrznych wymogów dotyczących prywatności danych i zgodności z przepisami.

Słabe strony i ograniczenia

Brak przejrzystości (Black-box): Cały proces wyboru modeli i ich komunikacji jest objęty tajemnicą handlową Sakana AI. Użytkownik końcowy widzi tylko ostateczny wynik i nie jest w stanie zweryfikować, które dokładnie modele brały udział w wygenerowaniu danej odpowiedzi.

Wyższa latencja: Ponieważ system musi wysłać zapytania do wielu modeli, poczekać na nie, a potem przeprowadzić syntezę, czas oczekiwania na odpowiedź jest zauważalnie dłuższy niż przy bezpośrednim odpytaniu jednego modelu.

Większe koszty: Uruchomienie całego panelu eksperckiego i syntezatora zużywa znacznie więcej tokenów, co przekłada się na wyższą cenę za zapytanie.

Drugie pytanie dotyczy spójności. Gdy różne fragmenty odpowiedzi generują różne modele, istnieje ryzyko niespójności stylistycznej lub faktograficznej. Trzecie – zaufanie: użytkownik nie wie, który model odpowiada, co utrudnia debugowanie i audyt w zastosowaniach krytycznych.

Częste pytania

Jak działa system Sakana Fugu w zarządzaniu zespołem AI?

Sakana Fugu działa jako model-orkiestrator, który analizuje zapytania użytkowników, rozkłada je na podzadania i deleguje każde z nich do najlepiej przygotowanego modelu. Dzięki temu zamiast jednego dużego modelu, system korzysta z zespołu wyspecjalizowanych modeli, co zwiększa efektywność odpowiedzi.

Dlaczego Sakana Fugu jest bardziej efektywny niż tradycyjne monolityczne modele AI?

Sakana Fugu proponuje alternatywę dla monolitycznych modeli poprzez koordynację kilku tańszych, wyspecjalizowanych modeli, co pozwala na obniżenie kosztów inferencji. Dodatkowo, Fugu potrafi dekomponować złożone pytania na prostsze zadania, co zwiększa jakość generowanych odpowiedzi.

Kiedy warto użyć Sakana Fugu zamiast klasycznego routingu modeli?

Warto użyć Sakana Fugu, gdy potrzebujemy elastyczności i zdolności do dynamicznego dostosowywania się do kontekstu zapytań. Fugu nie tylko kieruje zapytania do odpowiednich modeli, ale również uczy się, które modele najlepiej sprawdzają się w różnych sytuacjach.

Jakie są główne zalety korzystania z Sakana Fugu?

Główne zalety Sakana Fugu to wyższa jakość odpowiedzi dzięki współpracy różnych modeli, odporność na awarie oraz elastyczność w zarządzaniu danymi. System zapewnia lepszą spójność i dokładność generowanych wyników.

Jakie ograniczenia ma system Sakana Fugu?

Ograniczenia Sakana Fugu obejmują brak przejrzystości w wyborze modeli, wyższą latencję ze względu na konieczność komunikacji z wieloma modelami oraz większe koszty związane z uruchomieniem całego panelu eksperckiego.