Ocena i porównanie dużych modeli językowych (LLM) pozostaje kluczowe dla użytkowników szukających najmocniejszych modeli do pracy, researchu i kodowania. Platforma arena.ai, znana jako Text Arena, pokazuje obecnie ranking 356 modeli oparty na 6 035 972 głosach.
Poniżej skupiamy się na top 10 modeli ogólnych oraz aktualnych liderach kategorii Creative Writing i Coding. Tabele pokazują stan rankingu sprawdzony 5 maja 2026, na podstawie aktualizacji widocznej w źródle z 1 maja 2026.
Według aktualizacji z 1 maja 2026, liderem zestawienia ogólnego jest claude-opus-4-7-thinking od Anthropic, przed claude-opus-4-6-thinking i claude-opus-4-6.
Ranking LLM Top 10 ogólny
| Miejsce | Model | Wynik | Organizacja |
|---|---|---|---|
| 1 | claude-opus-4-7-thinking | 1503 | Anthropic |
| 2 | claude-opus-4-6-thinking | 1502 | Anthropic |
| 3 | claude-opus-4-6 | 1497 | Anthropic |
| 4 | gemini-3.1-pro-preview | 1493 | |
| 5 | claude-opus-4-7 | 1491 | Anthropic |
| 6 | muse-spark | 1491 | Meta |
| 7 | gpt-5.5-high | 1488 | OpenAI |
| 8 | gemini-3-pro | 1486 | |
| 9 | grok-4.20-beta1 | 1480 | xAI |
| 10 | grok-4.20-beta-0309-reasoning | 1477 | xAI |
Top 3 modele do pisania tekstów (Creative Writing)
| Miejsce | Model | Wynik |
|---|---|---|
| 1 | claude-opus-4-7-thinking | 1494 |
| 2 | claude-opus-4-6-thinking | 1493 |
| 3 | gemini-3.1-pro-preview | 1490 |
Top 5 modeli do programowania (Coding)
| Miejsce | Model | Wynik |
|---|---|---|
| 1 | claude-opus-4-7-thinking | 1573 |
| 2 | claude-opus-4-6-thinking | 1554 |
| 3 | claude-opus-4-6 | 1550 |
| 4 | claude-opus-4-7 | 1550 |
| 5 | claude-opus-4-5-20251101-thinking-32k | 1531 |
Dzięki takiemu podejściu, arena.ai zapewnia dynamiczny i oparty na rzeczywistych interakcjach ranking LLM-ów, który pozostaje cennym źródłem informacji dla badaczy, deweloperów i entuzjastów AI. Więcej o metodologii opisano także w publikacji: https://arxiv.org/pdf/2403.04132.








1 Komentarz