Anthropic hat mit Claude 3.7 Sonnet ein neues KI-Modell vorgestellt, das als erstes hybrides Reasoning-Modell sowohl schnelle Antworten als auch ausführliche Analysen ermöglicht. Benutzer können zwischen sofortigen Antworten und gründlicherer Verarbeitung wählen, wobei API-Nutzer die Reasoning-Phase bis zu 128.000 Token präzise steuern können.
Zentrale Eigenschaften und Fähigkeiten
Das neue Modell behält Anthropics bestehende Preisstruktur von 3 Dollar pro Million Input-Token und 15 Dollar pro Million Output-Token bei, einschließlich der Reasoning-Token. Es ist für alle Claude-Pläne verfügbar, wobei die erweiterten Reasoning-Funktionen den kostenpflichtigen Tarifen vorbehalten sind. Das Modell wurde in verschiedene Plattformen wie Amazon Bedrock und Google Cloud’s Vertex AI integriert.
Laut Anthropics internen Tests und externen Evaluierungen zeigt Claude 3.7 Sonnet deutliche Verbesserungen bei Coding- und Softwareentwicklungsaufgaben. Partner wie Cursor, Cognition und Vercel bestätigen dem Modell besondere Effektivität bei praktischen Programmierherausforderungen, einschließlich komplexer Codebase-Verwaltung und Full-Stack-Updates.
Technische Leistung und praktische Anwendungen
Die Benchmark-Ergebnisse zeigen starke Leistungen in mehreren Bereichen:
- 78,2% Genauigkeit bei Denkaufgaben auf Graduiertenniveau
- 81,2% Genauigkeit bei retail-fokussierter Werkzeugnutzung
- 93,2% Verbesserung beim Folgen von Anweisungen
- 62,3% Genauigkeit bei SWE-Bench Coding-Aufgaben, verglichen mit OpenAIs 49,3%
Das Modell stellt einen philosophischen Wandel in der KI-Entwicklung dar, wobei Anthropic argumentiert, dass Reasoning-Fähigkeiten in das Kernmodell integriert sein sollten, anstatt als separater Dienst angeboten zu werden. Dieser Ansatz unterscheidet sich von Wettbewerbern wie OpenAI und DeepSeek, die separate Modelle für verschiedene Fähigkeiten unterhalten.
Das Unternehmen berichtet darüber hinaus von Verbesserungen in der Fähigkeit des Modells, zwischen schädlichen und harmlosen Anfragen zu unterscheiden, mit einer angeblichen Reduzierung unnötiger Verweigerungen um 45% im Vergleich zum Vorgänger.
Parallel zu Claude 3.7 Sonnet hat Anthropic Claude Code eingeführt, ein Command-Line-Tool für Entwickler. Das derzeit als limitierte Forschungsvorschau verfügbare Tool ermöglicht es Entwicklern, Programmieraufgaben direkt an Claude zu delegieren, wobei die menschliche Kontrolle über Codeänderungen gewährleistet bleibt.
Quellen: Anthropic, VentureBeat, TechCrunch