„Mythische“ KI geht an die Öffentlichkeit: Anthropic hat Sicherheitsventil eingebaut

Halbierter Preis, ständige Kontroversen

Am 9. Juni Ortszeit in den Vereinigten Staaten hat Anthropic offiziell das Spitzenmodell Claude Fable 5 mit der internen Bewertung „Mythos - Klasse“ vorgestellt.

Zusätzlich ist auch sein „Zwillingsbruder“ Claude Mythos 5 aufgetaucht – eine Version, die das gleiche zugrunde liegende Modell teilt, aber die Einschränkungen in bestimmten hochriskanten Bereichen entfernt hat. Diese Version wird nur an überprüfte Partner bereitgestellt.

Die Fähigkeiten von Fable 5 übertreffen umfassend alle bisherigen öffentlichen Modelle von Anthropic. Daher hat Anthropic ihm ein neues Sicherheitssystem installiert: Wenn das Modell auf sensible Fragen in Bereichen wie Netzwerksicherheit und Biochemie stößt, wechselt es automatisch zu einem etwas schwächeren Claude Opus 4.8 - Modell, um die potentiell gefährlichen Fähigkeiten „im Käfig zu halten“.

Die Preise der beiden neuen Modelle sind stark gesenkt worden, weniger als die Hälfte des vorherigen Vorschau - Preises. Entwickler können ab sofort über die API direkt darauf zugreifen. Abonnenten können bis zum 22. Juni kostenlos testen, danach wird es auf eine nutzungsbasierte Abrechnung umgestellt. Anthropic plant, es nach Erreichen der Kapazitätsgrenze wieder als Teil des Standardpakets anzubieten.

01 Ein Modell, zwei Gesichter

Der Unterschied zwischen Fable 5 und Mythos 5 liegt ganz in der Sicherheitseinrichtung.

Man kann es so verstehen: Claude Fable 5 ist die allgemeine Version für alle, während Mythos 5 eine unbeschränkte Version für Fachleute in bestimmten Bereichen ist. Sie haben das gleiche „Gehirn“, aber Fable 5 hat einen äußerst konservativen „Sicherheitsmanager“.

Basierend auf der Funktion des Sicherheitsklassifikators wird, wenn Benutzer über das Fable 5 - Modell Anfragen stellen, die sich auf Netzwerksicherheit, Biologie und Chemie (insbesondere Wissen über gefährliche Stoffe oder Waffen) beziehen oder versuchen, die Modellfähigkeiten zu „destillieren“, um Konkurrenzmodelle zu trainieren, der Klassifikator automatisch die Anfrage blockieren und verhindern, dass Fable 5 direkt antwortet.

Stattdessen wird der etwas schwächere, aber dennoch starke Claude Opus 4.8 antworten.

Die Daten von Anthropic zeigen, dass mehr als 95 % der Gespräche diesen Klassifikator nicht auslösen. In diesen alltäglichen Anwendungen ist die Leistung von Fable 5 identisch mit der unbeschränkten Version Mythos 5.

Mythos 5 geht einen anderen Weg. Es richtet sich an überprüfte Partner und hat die Sicherheitsmaßnahmen in den Bereichen Netzwerksicherheit und Biochemie entfernt. Derzeit ist es hauptsächlich für zwei Arten von Benutzern zugänglich: Netzverteidiger, die über das „Glass Wing - Programm“ mit der US - Regierung zusammenarbeiten, und Biologieforscher, die dem vertrauenswürdigen Zugangsprogramm beitreten werden.

Das Designkonzept von Anthropic ist: In den meisten Szenarien reicht Fable 5 vollkommen aus. Nur wenn es um wirklich gefährliche Fähigkeiten geht, wird Mythos 5 eingesetzt.

Bei über 1000 Stunden externer Sicherheitsbelohnungen und langfristigen Agentenaufgaben wurde keine generelle Methode zur Umgehung der Sicherheitsmaßnahmen gefunden. Anthropic gibt jedoch zu, dass die Sicherheitsmaßnahmen vorsichtig eingestellt sind und manchmal auch unschädliche Anfragen blockieren können.

Dafür hat Anthropic auch eine neue Datenaufbewahrungsrichtlinie eingeführt: Der Datenverkehr aller Mythos - Klassenmodelle muss 30 Tage lang aufbewahrt werden. Die Daten werden nicht für das Training neuer Modelle oder andere nicht - sicherheitsbezogene Zwecke verwendet. Sie haben auch neue Datenschutzmaßnahmen eingeführt, einschließlich der Aufzeichnung aller manuellen Zugriffe auf die Daten und der Sicherstellung der Löschung der Daten nach 30 Tagen.

02 Vom „Kodierhilfe“ zum „unabhängigen Bauarbeiter“

Jetzt, da die Sicherheitsmechanismen erklärt sind, wie sind die Fähigkeiten von Fable 5 selbst?

Das Stärkenmerkmal von Fable 5 ist die Fähigkeit, komplexe Softwareentwicklungsprojekte zu bewältigen, die eine sehr lange Zeit und hohe Konzentration erfordern. Je länger und komplexer die Aufgabe ist, desto größer ist sein Vorsprung gegenüber anderen Modellen.

Das Zahlungsmittelgigant Stripe hat Fable 5 in einer riesigen Code - Bibliothek mit 50 Millionen Zeilen Ruby - Code getestet. Das Modell hat in einem Tag eine Code - Bibliothek - Migration abgeschlossen, die ein gesamtes Team manuell zwei Monate lang benötigt hätte.

Bei den spezifischen Benchmark - Tests hat Fable 5 ebenfalls hervorragend abgeschnitten.

Beim SWE - bench Pro (der die Fähigkeit eines Modells misst, schwierige Softwareentwicklungsprojekte zu bewältigen) hat Fable 5 80,3 % erreicht, während GPT - 5.5 (das neueste allgemeine Flaggschiff von OpenAI) etwa 58 - 60 % und Claude Opus 4.8 (das vorherige Flaggschiff von Anthropic) etwa 50 - 55 % erreicht haben.

Bei der Cognition FrontierCode - Bewertung (die die Fähigkeit eines Modells misst, schwierige Kodieraufgaben unter Einhaltung der Standards für hochwertige Produktionscode - Bibliotheken zu bewältigen) hat Fable 5 selbst bei einem mittleren Anstrengungsniveau die höchsten Punkte unter den Spitzenmodellen erzielt.

Beim strengeren FrontierCode Diamond - Benchmark (der die Fähigkeit eines intelligenten Agenten zur Erstellung von hochwertigem, wartbarem Code misst) hat Fable 5 29,3 % erreicht, während Claude Opus 4.8 13,4 % und GPT - 5.5 nur 5,7 % erreicht haben. Die meisten anderen Spitzenmodelle liegen unter 10 %.

Der angesehene AI - Forscher Andrej Karpathy, der kürzlich Anthropic beigetreten ist, meint, dass Fable 5 genauso wichtig ist wie die große Aktualisierung von Claude Opus 4.8 im November 2025.

Er sagte: „Wenn man es mit einer wirklich schwierigen Aufgabe konfrontiert, die lange Überlegung erfordert, scheint das Modell tatsächlich zu ‚verstehen‘ und setzt sich dann direkt daran. Das Gefühl, einfach die Hände wegzulegen und es allein arbeiten zu lassen, war noch nie so stark. Natürlich fügte er hinzu, dass man das in der Produktionsumgebung nicht tun sollte.“

03 Kann Code verstehen und auch Diagramme ‚lesen‘

Die visuelle Fähigkeit von Fable 5 hat ebenfalls einen großen Schritt vorwärts gemacht.

Es kann jetzt nicht nur beschreiben, was auf einem Bild zu sehen ist, sondern auch die genauen Daten in Diagrammen verstehen und sogar aus einem Screenshot den Quellcode einer ganzen Website rekonstruieren. Für Unternehmen, die täglich eine große Menge an PDF - Dateien, Scans, Berichten und Dashboards verarbeiten müssen, bedeutet diese Fähigkeit, dass die automatisierte Verarbeitung von „unstrukturierten“ und chaotischen Informationen viel praktikabler wird.

Um diese Fähigkeit des „Verstehens und Handelns“ zu demonstrieren, hat Anthropic zwei interessante interne Tests durchgeführt.

Der erste Test bestand darin, dass das Modell das klassische Spiel „Pokémon FireRed“ spielte.

Frühere Claude - Modelle hatten es auch mit einem komplexen Rahmenwerk, das zusätzliche Hilfsmittel bot, schwierig, dieses Spiel erfolgreich zu beenden. Fable 5 hingegen hat mit einem minimalistischen, rein visuellen Rahmenwerk und nur anhand des ursprünglichen Spielscreenshots das Spiel gewonnen.

Der zweite Test bestand darin, dass das Modell das Kartenspiel „Slay the Spire“ spielte.

Durch die Verleihung der Fähigkeit, auf Dateien basiertes dauerhaftes Gedächtnis zu haben, hat sich die Leistung von Fable 5 dreimal stärker verbessert als die des vorherigen Flaggschiffmodells. Die Häufigkeit, mit der das Spiel bis zum letzten Akt gespielt werden konnte, hat sich ebenfalls verdreifacht.

Für Unternehmensbenutzer bedeutet dies, dass Fable 5 in langfristigen Aufgaben mit Millionen von Token konzentriert bleiben kann und seine eigenen Notizen nutzen kann, um die Ausgabe zu verbessern. Dies kann für interne intelligente Agenten, die über mehrere Tage oder sogar Wochen laufen müssen, wichtig sein, wie z. B. Verkaufs - Betriebs - Agenten, die Kundenforschung verfolgen, Ingenieur - Agenten, die Migrationen verwalten, oder Support - Agenten, die sich merken, welche Methoden in mehreren Interaktionen versucht wurden.

Bei dem unbeschränkten Mythos 5 ist das Potenzial in der Wissenschaft noch beeindruckender. Protein - Design - Experten bei Anthropic haben Mythos 5 verwendet, um mehrere Schritte des Medikamenten - Design - Prozesses um etwa das Zehnfache zu beschleunigen.

In einem Beispiel haben sie festgestellt, dass Mythos 5, das mit Protein - Design - und Bioinformatik - Tools ausgestattet war, aber ohne menschliche Hilfe, mit erfahrenen menschlichen Operateuren mithalten konnte oder sogar sie übertreffen konnte. Das Modell hat alle Aufgaben ausgeführt, die normalerweise von Wissenschaftlern erledigt werden: Auswahl der Bindungsstellen, Auswahl und Ausführung von Protein - Design - Tools sowie die Wiederherstellung nach Fehlern. Von den 14 Protein - Zielen in dieser Studie haben 9 vielversprechende Medikamenten - Design - Kandidaten hervorgebracht, die Anthropic derzeit untersucht.

In der Genomik hat Mythos 5 in einer Woche autonom eine neue Studie durchgeführt. Es hat die Einzelzell - Daten von 138 Tierarten und Millionen von Zellen analysiert, ein eigenes maschinelles Lernmodell entworfen und trainiert, um Zellen mit der gleichen Funktion in verschiedenen Arten zu identifizieren, auch wenn diese Arten nur entfernt verwandt sind. Menschen müssen nur eine grobe Richtung vorgeben, und das von Mythos 5 trainierte Modell hat ein kürzlich in der Zeitschrift „Science“ veröffentlichtes Modell übertroffen, obwohl es um das 100 - fache kleiner ist.

Doch diese Fähigkeiten bringen auch Risiken mit sich.

Anthropic hat die Leistung von Mythos 5 beim Design von adenoassoziierten Viren (AAV) getestet. AAV sind Komponenten in der Gentherapie zur Medikamenten - Lieferung, aber die gleiche Technologie kann auch zur Entwicklung gefährlicher Viren verwendet werden. Im Test hat das Mythos - Klassenmodell allein durch biologische Schlussfolgerungen ein komplexes Modell, das speziell für Protein - Aufgaben trainiert wurde, übertroffen. Dies zeigt sowohl das Potenzial in der Gentherapie - Forschung als auch das Risiko der Doppelnutzung.

Anthropic hat das Alignment - Verhalten von Mythos 5 mit einem automatischen Bewertungstool getestet. Es hat sich herausgestellt, dass die Wahrscheinlichkeit, dass das Modell betrügerische oder missbrauchte Verhaltensweisen zeigt, sehr gering ist und ähnlich wie bei Opus 4.8. Fable 5 und das Modell mit demselben zugrunde liegenden Kern haben auch ähnliche Ergebnisse gezeigt.

Bei der automatischen Alignment - Bewertung ist die Wahrscheinlichkeit für Fehlverhalten von Mythos 5 und Opus 4.8 auf einem niedrigen Niveau.

04 Ein „Halsband“ für die starken Fähigkeiten

Die Veröffentlichung von Claude Fable 5 und Mythos 5 zeigt deutlich, wie Anthropic vorhat, Spitzenmodelle mit gefährlichen Doppelnutzungsmöglichkeiten auf den Markt zu bringen. Es öffnet nicht alle Fähigkeiten für alle Benutzer und weist auch nicht einfach risikoreiche Abfragen ab, sondern leitet bestimmte Anfragen an ein schwächeres Modell weiter, während es das stärkste Modell für die meisten alltäglichen Aufgaben behält.

Anthropic hat erklärt, dass die Veröffentlichung eines so starken Modells Risiken mit sich bringt. Ohne Sicherheitsmaßnahmen könnte die starke Leistung von Mythos 5 in Bereichen wie Netzwerksicherheit missbraucht werden und schwere Schäden verursachen.

Im Bereich der Netzwerksicherheit wird Mythos 5 zunächst über das „Glass Wing - Programm“ in Zusammenarbeit mit

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

„Mythische“ KI geht an die Öffentlichkeit, aber Anthropic hat ihr ein Sicherheitsventil eingebaut

01 Ein Modell, zwei Gesichter

02 Vom „Kodierhilfe“ zum „unabhängigen Bauarbeiter“

03 Kann Code verstehen und auch Diagramme ‚lesen‘

04 Ein „Halsband“ für die starken Fähigkeiten