Společnost Anthropic oznámila spuštění svého nejnovějšího modelu umělé inteligence, Claude Opus 4.8. Anthropic tvrdí, že model je efektivnějším spolupracovníkem s vylepšeními v agentním kódování, finanční analýze a další.



Testeři zjistili, že Opus 4.8 je spolehlivější a má jasnější úsudek při provádění agentních úkolů. „První testeři uvádějí, že Opus 4.8 s větší pravděpodobností upozorní na nejistoty ohledně své práce a s menší pravděpodobností bude činit nepodložená tvrzení. To potvrzují i ​​naše hodnocení, která ukazují, že Opus 4.8 má přibližně čtyřikrát menší pravděpodobnost než jeho předchůdce, že nechá chyby v kódu, který napsal, bez povšimnutí.“ Benchmarky Anthropic ukazují, že Opus 4.8 dosáhl v SWE-Bench Pro skóre 69,2 %, čímž překonal GPT–5.5 a Gemini 3.1 Pro v testu a několika dalších benchmarkech, ačkoli GPT–5.5 vede v benchmarku kódování. Rychlý režim Opusu 4.8 běží také 2,5krát rychleji a je nyní třikrát levnější než předchozí modely.