Claude Mythos wyciekł - najpotężniejszy model AI, o którym Anthropic wolał milczeć

W piątek świat obiegła wiadomość o nieplanowanym wycieku wewnętrznych dokumentów Anthropic. Firma, znana z ostrożnego i „odpowiedzialnego” podejścia do rozwoju sztucznej inteligencji, przypadkowo ujawniła szczegóły swojego najnowszego, jeszcze nieopublikowanego modelu: Claude Mythos (wewnętrznie nazywanego też Capybara).Nie był to atak hakerski ani celowe działanie pracownika. To klasyczny błąd konfiguracyjny.

Spis treści

Jak doszło do wycieku?

Z powodu błędu w systemie zarządzania treścią (CMS) Anthropic około 3000 nieopublikowanych plików stało się publicznie dostępnych. W repozytorium znalazły się m.in. drafty wpisów na bloga, obrazy, PDF-y oraz materiały przygotowywane do wewnętrznych wydarzeń. Dane były dostępne bez żadnego uwierzytelniania – wystarczyło znać odpowiedni adres. Wyciek jako pierwszy zauważyli badacze bezpieczeństwa (m.in. Roy Paz z LayerX Security i Alexandre Pauwels z University of Cambridge). Informację jako pierwsza podała Fortune, po czym Anthropic szybko zablokowało dostęp do zasobów.

Co wiemy o modelu Claude Mythos

Zgodnie z wyciekłym draftem wpisu na bloga, Mythos to nowy tier modeli powyżej dotychczasowego flagowca – Claude Opus 4.6. Firma opisuje go jako:

„by far the most powerful AI model we’ve ever developed” czyli najlepszy model jaki kiedykolwiek stworzyli a wiadomo ż etreaz jest to jeden z wiodących modeli na rynku
„step change” w możliwościach (znacząca, jakościowa zmiana),
najbardziej wszechstronny

Model osiąga dramatycznie wyższe wyniki niż Opus 4.6 w kluczowych obszarach:

programowaniu (software coding),
rozumowaniu akademickim (academic reasoning),
zadaniach związanych z cyberbezpieczeństwem (cybersecurity).

Anthropic podkreśla, że model jest szczególnie zaawansowany w cyber-zagrożeniach na tyle, że stwarza bezprecedensowe ryzyko cybernetyczne. Firma obawia się, że może on znacząco przyspieszyć ataki hakerskie, wyprzedzając możliwości obrony.

Potwierdzenie Anthropic

Firma nie zaprzeczyła wyciekowi. W oficjalnym oświadczeniu dla Fortune, Anthropic potwierdziło:

„Rozwijamy model ogólnego przeznaczenia z znaczącymi postępami w rozumowaniu, kodowaniu i cyberbezpieczeństwie. Biorąc pod uwagę siłę jego możliwości, podchodzimy do wydania z rozwagą. Uważamy ten model za step change i najpotężniejszy, jaki kiedykolwiek zbudowaliśmy.”

Model jest już w fazie testów zarówno wewnętrznych, jak i z wybranymi klientami z programu wczesnego dostępu. Trening został zakończony.

Reakcja branży

Wyciek wywołał natychmiastowe poruszenie:

akcje firm cyberbezpieczeństwa (m.in. CrowdStrike, Palo Alto Networks) spadły o kilka procent – inwestorzy obawiają się fali ataków wspomaganych przez zaawansowane AI,
media społecznościowe i fora AI zalała fala spekulacji,
konkurencja (OpenAI, Google DeepMind) milczy.

Paradoksalnie, incydent może wzmocnić pozycję Anthropic na rynku. Firma, która pozycjonuje się jako lider odpowiedzialnego AI, pokazała, że ma technologię wyraźnie wyprzedzającą to, co jest obecnie publicznie dostępne.

Anthropic nie podało żadnej daty premiery. Podkreśla, że wyda model ostrożnie i w kontrolowany sposób. Wyciek może zarówno przyspieszyć, jak i opóźnić decyzję – wszystko zależy od wyników testów bezpieczeństwa. Jedno jest pewne: Claude Mythos istnieje i jest już w użyciu (w ograniczonym zakresie). Branża AI właśnie dostała kolejny dowód, że granica między „jeszcze niegotowe” a „zbyt potężne, by wypuścić” staje się coraz cieńsza.