StartseiteArtikel

Gerade jetzt wurde Claude Sonnet 4.5 sensationell veröffentlicht. Der neue König der Programmierung ist da.

新智元2025-09-30 09:27
In der frühen Morgenstunde heute wurde Claude Sonnet 4.5 veröffentlicht! Das neue Modell hat auf allen Ebenen, einschließlich Codierung, Computergebrauch, Inferenz, Fähigkeit bei langen Aufgaben und Sicherheitsausrichtung, erheblich verbessert und sich zum König der neuen Generation von Programmiermodellen entwickelt. Ein neuer Wettlauf um Hunderten von Modellen auf dem Gebiet der Programmierung steht kurz bevor, und Claude Sonnet 4.5 wird bald das neue Referenzobjekt für alle werden.

Um Mitternacht heute, chinesischer Zeit, hat Anthropic offiziell Claude Sonnet 4.5 veröffentlicht.

Diese Version wird von Claude als weltweit stärkstes Code-Modell definiert und zeigt gleichzeitig bemerkenswerte Durchbrüche bei der Agentenbildung, der Computernutzung, der Inferenz und den mathematischen Fähigkeiten.

Code ist überall. Er treibt Anwendungen, Tabellen und verschiedene Tools an.

Das Herzstück der modernen Arbeit besteht darin, diese Tools einzusetzen und komplexe Probleme zu lösen. Sonnet 4.5 macht all dies effizienter und zuverlässiger.

Neue Funktionen und Produkt-Upgrades

Mit Sonnet 4.5 hat Anthropic alle Claude-Produkte umfassend aktualisiert:

Claude Code hat die lang erwartete Funktion "Checkpoints" hinzugefügt, mit der der Fortschritt jederzeit gespeichert und mit einem Klick auf einen früheren Zustand zurückgesetzt werden kann. Gleichzeitig wurde die Terminal-Oberfläche aktualisiert und ein natives VS Code-Plugin eingeführt.

Claude API hat Funktionen für die Bearbeitung des Kontexts und Memory-Tools hinzugefügt, sodass Agenten länger laufen und komplexere Aufgaben bearbeiten können.

Claude apps unterstützen jetzt das direkte Ausführen von Code und das Generieren von Dateien (einschließlich Tabellen, Präsentationen und Dokumenten) in Gesprächen.

Claude for Chrome-Erweiterung ist jetzt für Max-Benutzer aus der Warteliste verfügbar.

Die Entwicklergemeinschaft hat auch neue Kernressourcen erhalten: Claude Agent SDK.

Dieses Toolkit macht die zugrunde liegende Infrastruktur von Claude Code zugänglich und bietet allen die Möglichkeit, Agenten zu entwickeln.

Spitzenleistung und Benchmark-Ergebnisse

Sonnet 4.5 hat in mehreren autoritativen Tests hervorragende Ergebnisse erzielt:

SWE-bench Verified: Es hat im Test der echten Software-Coding-Fähigkeiten das neueste Optimum erreicht und kann in komplexen mehrstufigen Aufgaben über 30 Stunden lang konzentriert arbeiten.

OSWorld: Im Benchmark der Simulation echter Computeraufgaben hat es mit 61,4 % die Spitzenposition erreicht, während Sonnet 4 vor vier Monaten noch bei 42,2 % lag.

Das Video zeigt die Fähigkeit von Claude for Chrome, Computeraufgaben zu simulieren.

Inferenz und Mathematik: Es hat in einer Reihe öffentlicher Bewertungen deutliche Vorsprünge erzielt, insbesondere bei der Wissensverarbeitung und der Inferenz in Fachbereichen wie Finanzen, Recht, Medizin und STEM, weit vor dem früheren Opus 4.1.

Diese Fortschritte werden nicht nur in den Daten sichtbar, sondern auch von Fachanwendern, die eine Vorabversion getestet haben, hoch gelobt:

Claude Code kann über 30 Stunden lang autonom programmieren und hilft Ingenieuren, Architekturarbeiten, die sonst Monate dauern würden, in kürzester Zeit abzuschließen. – Sean Ward, CEO von iGent AI

Im internen Code-Editor-Test von replit ist die Fehlerrate von 9 % bei Sonnet 4 direkt auf 0 % gesunken. – Michele Catasta, Präsident von replit

Bessere Ausrichtung, höhere Sicherheit

Sonnet 4.5 ist das bisher am besten ausgerichtete Claude-Modell.

Durch verbesserte Fähigkeiten und umfassende Sicherheitstraining hat das Modell deutliche Fortschritte bei der Reduzierung von Verhaltensweisen wie Anpassung, Täuschung, Machtstreben und unwürdige Anregungen erzielt.

Im Bereich der Agenten- und Computernutzung hat das Team auch die Abwehr gegen Prompt-Injection-Angriffe besonders verstärkt.

Diese Verbesserungen sind in der Systemkarte in Form einer detaillierten Bewertung veröffentlicht worden, in der erstmals Interpretierbarkeitstechniken zur Sicherheitsüberprüfung eingeführt wurden.

Sonnet 4.5 wird gemäß dem AI Safety Level 3 (ASL-3)-Rahmen veröffentlicht, der eine Reihe von Schutzmaßnahmen enthält, wie z. B. einen Klassifikator-Filter für chemische, biologische, radioaktive und nukleare Inhalte.

Obwohl diese Filter gelegentlich normale Inhalte fehlklassifizieren können, ist die Fehlalarmrate im Vergleich zu Sonnet 4 um den Faktor zehn gesunken und wird in Zukunft weiter optimiert.

Claude Agent SDK

In den letzten sechs Monaten hat das Claude-Team ständig an Claude Code gearbeitet und die zentralen Herausforderungen bei der Agentenentwicklung untersucht, einschließlich der Speicherverwaltung für langfristige Aufgaben, des Gleichgewichts des Berechtigungssystems und der Art der Zusammenarbeit von Subagenten.

Jetzt werden diese Fähigkeiten über das Claude Agent SDK an Entwickler vollständig freigegeben.

Das SDK eignet sich nicht nur für die Programmierung, sondern auch für eine breitere Palette von Anwendungsfällen.

Es bietet die gleiche Infrastruktur wie die internen Anthropic-Tools für die Entwicklung autonomer Agenten für komplexe Aufgaben.

Forschungsvorschau: "Imagine with Claude"

Als zusätzliches Experiment hat Anthropic eine vorläufige Forschungsvorschau namens "Imagine with Claude" veröffentlicht.

Imagine With Claude generiert Softdemonstrationsvideos in Echtzeit.

Bei dieser Erfahrung generiert Claude Software in Echtzeit, ohne vordefinierte Funktionen oder vorgefertigten Code. Die Benutzer können direkt den Prozess der spontanen Schaffung und Anpassung durch Claude während der Interaktion beobachten.

Diese Funktion ist für Max-Abonnenten fünf Tage lang verfügbar und kann auf claude.ai/imagine getestet werden.

Neue API-Features

Sonnet 4.5 bringt auch wichtige Updates auf API-Ebene:

Memory-Tools (Beta): Unterstützt das Speichern und Abrufen von Informationen außerhalb des Kontextfensters, um das Wissen und den Zustand über mehrere Sitzungen hinweg aufrechtzuerhalten.

Kontextbearbeitung: Vermeidet Überläufe des Kontexts durch automatische Bereinigung alter Tool-Aufrufe und -Ergebnisse.

Neue Stop-Gründe: Fügt "model_context_window_exceeded" hinzu, um das Abbrechen der Generierung aufgrund von Kontextbeschränkungen klarer zu kennzeichnen.

Verbesserung der Tool-Parameter: Behebt das Problem, dass Zeilenumbrüche am Ende von Zeichenfolgenparametern abgeschnitten werden, um eine genaue Formatübertragung zu gewährleisten.

Optimierung der Token-Zählung: Das System fügt automatisch optimierte Tokens hinzu, aber die Benutzer zahlen nicht für diese systemseitig eingefügten Teile.

Preisgestaltung und Zugangsmöglichkeiten

Die Preise bleiben gleich wie bei Sonnet 4:

Eingabe: 3 US-Dollar pro Million Tokens

Ausgabe: 15 US-Dollar pro Million Tokens

Sonnet 4.5 kann über die folgenden Kanäle genutzt werden:

Claude API: claude-sonnet-4-5-20250929

Amazon Bedrock: anthropic.claude-sonnet-4-5-20250929-v1:0

Google Cloud Vertex AI: claude-sonnet-4-5@20250929

Es ist auch auf den Plattformen Claude.ai und Claude Code verfügbar.

Upgrade-Anleitung

Entwickler, die derzeit Sonnet 4 verwenden, müssen nur den Modellnamen auf claude-sonnet-4-5-20250929 aktualisieren, um die Migration abzuschließen.

Alle bestehenden API-Aufrufe bleiben gültig. Es wird empfohlen, auch die neuen Funktionen wie Memory-Tools und Kontextbereinigung zu aktivieren, um die volle Leistung des Modells auszuschöpfen.

Es ist zu beachten, dass Sonnet 4.5 nicht mehr die gleichzeitige Angabe der Parameter temperature und top_p erlaubt. Benutzer sollten einen von beiden auswählen.