Opus 4.8 est tombé hier soir. Voilà le vrai changelog, sans la com Anthropic.
Pour ceux qui codent avec Claude Code :
→ Coding agentique : 64,3% → 69,2%
→ 4x moins de bugs silencieux dans le code généré
→ Long contexte qui tient sans dériver après compaction
→ Tool calling plus fiable, il oublie moins de lancer un outil quand il faut
Pour ceux qui utilisent Claude.ai au quotidien (non-tech) :
→ Il flag ses incertitudes au lieu d'inventer. C'est le plus gros saut qualité depuis le 4.6.
→ Quand il enchaîne des actions (Gmail, Notion, Drive via les connecteurs), il est plus fiable
→ Computer use (Claude qui pilote ton navigateur tout seul) : 82,8% → 83,4%. Marginal, on s'en fout.
→ Online-Mind2Web : 84%, premier modèle à passer ce seuil sur la navigation web autonome
→ Reasoning + tools : 54,7% → 57,9%
Les nouveautés API pour les builders :
→ Mid-conversation system messages : tu peux injecter une nouvelle instruction système au milieu d'une conv sans casser le prompt cache. Énorme pour les agents long-running.
→ Fast mode arrive sur 4.8 : 2,5x plus rapide, 3x moins cher qu'avant sur ce mode
→ Dynamic workflows en preview (Enterprise/Team/Max only) : Claude Code peut spawn des centaines de subagents en parallèle. Migrations de codebase massives en une session.
Le prix bouge pas : 5$ input / 25$ output par million de tokens.
Effort param par défaut sur "high" partout.
Next step annoncé : Mythos dans les semaines qui viennent. Cadence x10 par rapport à l'an dernier.