Claude Sonnet 5 erzielt 63,2 % bei SWE-bench Pro zu einem Drittel des Preises von Opus 4.8.

Anthropic hat Claude Sonnet 5 am 30. Juni veröffentlicht, und die Botschaft ist klar: Das ist jetzt die günstigste Möglichkeit, Agenten laufen zu lassen, die nicht zusammenbrechen. Es ist ein Mid-tier-LLM, das für agentische Workflows gebaut wurde – Planung, Aufrufen von Tools, Steuern eines Browsers oder Terminals und das Durcharbeiten langer Codierungsaufgaben, ohne dass ein Mensch jeden Schritt beaufsichtigt.

Warum die Leute aufmerksam werden

Die Zahlen erzählen die Geschichte. Sonnet 5 erreicht 63,2 % bei SWE-bench Pro (gegenüber 58,1 % bei Sonnet 4.6), springt bei Terminal-Bench 2.1 von 67 % auf 80,4 % und erzielt 81,2 % bei OSWorld computer-use. Beim GDPval-AA Knowledge-Work-Test erzielt es 1618 – tatsächlich knapp über den 1615 von Opus 4.8. Sie zahlen also Mid-tier-Geld für fast-Flagship-Ergebnisse. Es ist bereits das Standardmodell auf claude.ai, und HN leuchtete am Tag der Veröffentlichung mit 711 Punkten auf.

Verwendung über die API

Rufen Sie es mit der Modell‑ID claude-sonnet-5-20260401 auf. Die Preisgestaltung beträgt $3/$15 pro Million Eingabe‑/Ausgabetoken, mit einem Einführungstarif von $2/$10 bis zum 31. August. Opus 4.8 kostet $5/$25. Für alle, die Coding‑Agenten oder mehrstufige Tool‑Loops in großem Umfang betreiben, vergrößert sich diese Lücke schnell – gleiche Arbeitslast, etwa die Hälfte der Rechnung.

Claude Sonnet 5 erzielt 63,2 % bei SWE-bench Pro zu einem Drittel des Preises von Opus 4.8.

Warum die Leute aufmerksam werden

Verwendung über die API

Claude Sonnet 5 erzielt 63,2 % bei SWE-bench Pro zu einem Drittel des Preises von Opus 4.8.