Claude Opus 4.8: co přináší a jak si stojí proti GPT-5.5 a Gemini

Anthropic vydal 28. května 2026 Claude Opus 4.8 — nový vlajkový model, který nahrazuje Opus 4.7 jen 41 dní po jeho uvedení. Není to skok v jednom velkém čísle, ale soubor menších zlepšení: lepší úsudek u agentních úloh, vyšší „upřímnost“ o vlastní práci a schopnost běžet déle bez zásahu člověka. Pro majitele webů je zajímavé hlavně to, co tahle generace modelů znamená pro způsob, jakým AI čte a používá obsah na internetu.

Introducing Claude Opus 4.8: it builds on Opus 4.7 with sharper judgment, more honesty about its own progress, and the ability to work independently for longer than its predecessors.

Available today at the same price. pic.twitter.com/EufxL7T1kb
— Claude (@claudeai) May 28, 2026

Co je Claude Opus 4.8

Claude Opus 4.8 je nejvýkonnější veřejně dostupný AI model od společnosti Anthropic, vydaný 28. května 2026. Navazuje na Opus 4.7 a cílí především na agentní úlohy — tedy práci, kterou model dělá samostatně v několika krocích: programování, ovládání počítače, vícekrokové analýzy.

„Agentní“ znamená, že model nedostane jen jednu otázku a nevrátí jednu odpověď. Místo toho si rozplánuje úkol, sám si volá nástroje (prohlížeč, terminál, API) a postupně se dopracuje k výsledku. Právě v tomhle režimu je posun 4.8 nejvíc vidět.

Cena zůstává stejná jako u předchůdce: 5 dolarů za milion vstupních tokenů a 25 dolarů za milion výstupních. Model je dostupný v claude.ai, přes Claude API (identifikátor claude-opus-4-8) i v nástroji Claude Code.

Co Opus 4.8 přináší

Hlavní novinkou není výkon v jednom benchmarku, ale spolehlivost při dlouhé samostatné práci. Anthropic i nezávislí testeři shodně popisují čtyři posuny:

Vyšší „upřímnost“. Modely občas tvrdí, že úkol splnily, i když pro to nemají dost důkazů. Opus 4.8 je podle evaluací Anthropicu zhruba čtyřikrát méně náchylný přehlédnout chybu ve vlastním kódu, než byl Opus 4.7. Pro firmu, která nechává AI pracovat bez dozoru, je to konkrétní úspora času na kontrolách.
Lepší úsudek. Testeři uvádějí, že model se víc ptá na správné otázky, dřív upozorní na nejasnost v zadání a nevrhne se do velké změny, dokud si není jistý.
Delší samostatná práce. Ve spojení s novou funkcí dynamic workflows (viz níže) dokáže model běžet déle a zvládnout rozsáhlejší úkoly v jedné relaci.
Ovládání míry úsilí. V claude.ai a v Cowork přibyl ovladač, kterým nastavíte, kolik „přemýšlení“ má Claude do odpovědi vložit. Vyšší stupeň znamená hlubší a lepší odpovědi, nižší rychlejší reakci a šetrnější čerpání limitů. Opus 4.8 má ve výchozím stavu stupeň „high“.

Vedle samotného modelu Anthropic spustil i tři související funkce. Dynamic workflows v Claude Code (zatím v režimu research preview) umožňují modelu naplánovat velký úkol, spustit stovky paralelních subagentů v jedné relaci a výstupy pak ověřit — například při migraci kódu napříč stovkami tisíc řádků. Fast Mode je stejný model běžící zhruba 2,5× rychleji a u Opusu 4.8 je nově třikrát levnější než u předchozích verzí. A Messages API nově přijímá systémové instrukce přímo v poli zpráv, takže vývojáři mohou měnit pokyny modelu během běhu úlohy.

Opus 4.7 vs Opus 4.8: co se zlepšilo

Mezi verzemi 4.7 a 4.8 je největší skok v agentním kódování a práci s terminálem. Následující tabulka shrnuje hlavní rozdíly podle dat Anthropicu.

Benchmark (co měří)	Opus 4.7	Opus 4.8
SWE-Bench Pro — agentní kódování	64,3 %	69,2 %
Terminal-Bench 2.1 — práce v terminálu	66,1 %	74,6 %
OSWorld-Verified — ovládání počítače	82,3 %*	83,4 %
GDPval-AA — znalostní práce (body)	1753	1890
Cena za 1M tokenů (vstup / výstup)	5 / 25 $	5 / 25 $

*Anthropic skóre Opusu 4.7 u OSWorld zpětně přepočítal na 82,3 %, aby lépe odráželo reálné použití. Zdroj: Anthropic.

Pro běžné každodenní použití (psaní, shrnutí, dotazy) je rozdíl proti 4.7 spíš mírný. Sám Anthropic mluví o „skromném, ale hmatatelném“ zlepšení. Největší přínos pocítí týmy s dlouhými, samostatně běžícími úlohami.

Opus 4.8 vs GPT-5.5 a Gemini 3.1 Pro

V agentních benchmarcích Opus 4.8 podle dat Anthropicu vede nad GPT-5.5 (OpenAI) i Gemini 3.1 Pro (Google). Výjimkou je práce v terminálu, kde vede GPT-5.5.

Benchmark	Opus 4.8	GPT-5.5	Gemini 3.1 Pro
SWE-Bench Pro — agentní kódování	69,2 %	58,6 %	54,2 %
OSWorld-Verified — ovládání počítače	83,4 %	78,7 %	76,2 %
Terminal-Bench 2.1 — práce v terminálu	74,6 %	78,2 %†	—
GDPval-AA — znalostní práce (body)	1890	1769	—

†GPT-5.5 dosáhl v terminálu 78,2 % s harnessem Terminus-2, resp. 83,4 % s vlastním Codex CLI. Všechna čísla pocházejí z evaluací Anthropicu — berte je orientačně, výrobci běžně publikují metriky, ve kterých vyniká jejich vlastní model.

Gemini má tradičně silné stránky v délce kontextu a ceně, GPT-5.5 v práci s terminálem. Pro výběr modelu proto nestačí jedno číslo — záleží na tom, jakou úlohu řešíte. Pro srovnání jednotlivých AI služeb a jejich silných stránek slouží sekce AI chaty.

Co to znamená pro váš web a GEO

Silnější agentní modely zvyšují tlak na to, aby byl web připravený nejen pro lidi, ale i pro AI. GEO (Generative Engine Optimization — optimalizace webu pro AI vyhledávače a asistenty jako ChatGPT, Perplexity nebo Claude) je dnes nadstavbou klasického SEO právě proto, že obsah čte stále častěji stroj, ne člověk.

Model jako Opus 4.8 dokáže samostatně procházet weby, vyplňovat formuláře a dokončovat úkoly za uživatele. Pokud váš web nemá srozumitelnou strukturu, strojově čitelná data a jasné signály o tom, co nabízíte, agent si poradí hůř — nebo vás přeskočí ve prospěch konkurence, která to má vyřešené. Konkrétní signály, které AI z webu čte (od llms.txt přes schema.org až po pravidla pro AI boty), rozebíráme v sekci Signály webu. Tomu, jak se na web dívají autonomní agenti, se věnuje sekce AI agenti.

Co bude dál: Claude Mythos

Anthropic zároveň naznačil, kam míří. Připravuje novou třídu modelů s vyšší inteligencí než Opus, pojmenovanou Claude Mythos. Zatím ji v rámci projektu Glasswing používá omezený počet organizací pro práci v kyberbezpečnosti — modely téhle úrovně totiž vyžadují silnější ochranná opatření, než je možné je široce vydat. Anthropic plánuje jejich zpřístupnění „v nadcházejících týdnech“. Souběžně chce vydat i levnější modely s podobnými schopnostmi jako Opus.

Pro koho má přechod na 4.8 smysl

Největší přínos pocítí týmy s dlouhými, samostatně běžícími agentními úlohami — vývoj softwaru, ovládání počítače, rozsáhlé analýzy. Pokud Claude používáte hlavně na běžné texty a dotazy, rozdíl proti 4.7 bude spíš mírný a není důvod spěchat. Cena je stejná, takže přechod sám o sobě nic nestojí.