StartseiteArtikel

Wer hat Zugriff auf das „Mythos-Modell“ Mythos 5?

36氪的朋友们2026-06-10 15:18
Bitte bewerben Sie sich mit einer "Klinkenputz-Aktion".

Anthropic hat das Mythos - Level - Modell veröffentlicht. Das Bild wurde mit KI verarbeitet.

Am 9. Juni Ortszeit in den Vereinigten Staaten hat Anthropic offiziell das Spitzenmodell Claude Fable 5 mit der internen Bewertung "Mythos - Level" veröffentlicht.

Zusätzlich wurde sein "Zwillingsbruder" Claude Mythos 5 vorgestellt - eine Version, die das gleiche Basis - Modell teilt, aber die Einschränkungen in bestimmten hochrisikorelevanten Bereichen entfernt hat. Diese Version wird nur an überprüfte Partner angeboten.

Die Fähigkeiten von Fable 5 übertreffen umfassend alle bisher veröffentlichten Modelle von Anthropic. Daher hat Anthropic ihm ein neues Sicherheitschutzsystem installiert: Wenn das Modell auf sensible Fragen in Bereichen wie Netzwerksicherheit und Biochemie stößt, wechselt es automatisch zu dem etwas schwächeren Claude Opus 4.8 - Modell, um die potenziell gefährlichen Fähigkeiten "im Käfig zu halten".

Die Preise der beiden neuen Modelle sind stark gesenkt und liegen bei weniger als der Hälfte des vorherigen Vorschau - Preises. Entwickler können ab sofort direkt über die API auf die Modelle zugreifen. Abonnenten können bis zum 22. Juni kostenlos testen, danach wird es auf eine nutzungsbasierte Abrechnung umgestellt. Anthropic plant, sie nach Erreichen der Kapazitätsgrenze wieder als Teil des Standard - Pakets anzubieten.

01. Ein Modell, zwei Gesichter

Der Unterschied zwischen Fable 5 und Mythos 5 liegt ganz im Sicherheitschutz.

Man kann es so verstehen: Claude Fable 5 ist die allgemeine Version für alle, während Mythos 5 eine unbeschränkte Version für Experten in bestimmten Bereichen ist. Sie haben das gleiche "Gehirn", aber Fable 5 hat einen äußerst konservativen "Sicherheitsmanager".

Basierend auf der Funktion des Sicherheitsklassifikators wird, wenn Benutzer über das Fable 5 - Modell Anfragen stellen, die sich auf Netzwerksicherheit, Biologie und Chemie (insbesondere Wissen über gefährliche Stoffe oder Waffen) beziehen, oder wenn sie versuchen, die Fähigkeiten des Modells zu "destillieren", um Konkurrenzmodelle zu trainieren, der Klassifikator automatisch eingreifen und verhindern, dass Fable 5 direkt antwortet.

Stattdessen wird der etwas schwächere, aber dennoch starke Claude Opus 4.8 antworten.

Die Daten von Anthropic zeigen, dass bei über 95 % der Gespräche der Klassifikator nicht ausgelöst wird. In diesen alltäglichen Anwendungen ist die Leistung von Fable 5 identisch mit der unbeschränkten Version Mythos 5.

Mythos 5 geht einen anderen Weg. Es richtet sich an überprüfte Partner und hat die Schutzmaßnahmen in den Bereichen Netzwerksicherheit und Biochemie entfernt. Derzeit ist es hauptsächlich für zwei Benutzergruppen zugänglich: Netzwerkverteidiger, die über das "Glasswing - Programm" mit der US - Regierung zusammenarbeiten, und Biologie - Forscher, die dem vertrauenswürdigen Zugangsprogramm beitreten werden.

Das Designkonzept von Anthropic ist: In den meisten Szenarien reicht Fable 5 vollkommen aus. Erst wenn es um wirklich gefährliche Fähigkeiten geht, wird Mythos 5 eingesetzt.

Bei über 1000 Stunden externer Bug - Bounties und langfristigen Agentenaufgaben wurde keine universelle Methode gefunden, um die Sicherheitsmaßnahmen zu umgehen. Anthropic gibt jedoch zu, dass die Schutzmaßnahmen vorsichtig eingestellt sind und manchmal auch unschädliche Anfragen blockieren können.

Dafür hat Anthropic auch eine neue Datenspeicherungsrichtlinie eingeführt: Der Datenverkehr aller Mythos - Level - Modelle muss 30 Tage lang gespeichert werden. Die Daten werden nicht für das Training neuer Modelle oder für andere als Sicherheitszwecke verwendet. Sie haben auch neue Datenschutzmaßnahmen eingeführt, einschließlich der Aufzeichnung aller manuellen Zugriffe auf die Daten und der Sicherstellung, dass die Daten nach 30 Tagen gelöscht werden.

02. Vom "Kodierhilfe" zum "unabhängigen Bauarbeiter"

Jetzt, da die Sicherheitsmechanismen erklärt sind, wie sind die Fähigkeiten von Fable 5 selbst?

Das Stärkenmerkmal von Fable 5 ist die Fähigkeit, komplexe Softwareentwicklungsprojekte zu bewältigen, die eine sehr lange Zeit und hohe Konzentration erfordern. Je länger und komplexer die Aufgabe ist, desto größer ist sein Vorsprung gegenüber anderen Modellen.

Das Zahlungsunternehmen Stripe hat Fable 5 in einer riesigen Codebasis mit 50 Millionen Zeilen Ruby - Code getestet. Das Modell hat in einem Tag eine Codebasis - Migration abgeschlossen, die ein gesamtes Team manuell zwei Monate lang benötigt hätte.

Bei den spezifischen Benchmarks hat Fable 5 ebenfalls hervorragend abgeschnitten.

Beim SWE - bench Pro (zur Messung der Fähigkeit eines Modells, schwierige Softwareentwicklungsprojekte zu bewältigen) erreichte Fable 5 80,3 %, während GPT - 5.5 (das neueste allgemeine Flaggschiff von OpenAI) etwa 58 - 60 % und Claude Opus 4.8 (das vorherige Flaggschiff von Anthropic) etwa 50 - 55 % erreichte.

Bei zwei Agenten - Programmiertests hat Fable 5 sowohl Claude Opus 4.8 als auch GPT - 5.5 übertroffen.

Bei der Cognition FrontierCode - Bewertung (die die Fähigkeit eines Modells misst, schwierige Codierungsaufgaben zu bewältigen, während es den Standards einer hochwertigen Produktions - Codebasis entspricht) hat Fable 5 selbst bei einem mittleren Anstrengungsniveau die höchsten Punkte unter den Spitzenmodellen erzielt.

Beim strengeren FrontierCode Diamond - Benchmark (zur Messung der Fähigkeit, hochwertigen und wartbaren Agenten - Code zu schreiben) erreichte Fable 5 29,3 %, während Claude Opus 4.8 13,4 % und GPT - 5.5 nur 5,7 % erreichte. Die meisten anderen Spitzenmodelle lagen unter 10 %.

Beim FrontierCode - Test stieg die Genauigkeit von Fable 5 mit zunehmenden Kosten stetig an und übertraf Claude Opus 4.8 und GPT - 5.5.

Der angesehene KI - Forscher Andrej Karpathy, der kürzlich Anthropic beigetreten ist, meint, dass Fable 5 so wichtig ist wie die große Aktualisierung von Claude Opus 4.5 im November 2025.

Er sagte: "Wenn man ihm eine wirklich schwierige Aufgabe gibt, die lange überlegt werden muss, scheint das Modell es wirklich 'zu verstehen' und beginnt dann, es umzusetzen. Das Gefühl, einfach loszulassen und es allein arbeiten zu lassen, war noch nie so stark wie jetzt. Natürlich fügte er hinzu, dass man das in der Produktionsumgebung nicht tun sollte."

03. Kann Code verstehen und auch Diagramme "lesen"

Die visuelle Fähigkeit von Fable 5 hat ebenfalls einen großen Schritt vorwärts gemacht.

Es kann jetzt nicht nur beschreiben, was auf einem Bild zu sehen ist, sondern auch die genauen Daten in Diagrammen verstehen und sogar aus einem Screenshot den gesamten Quellcode einer Website rekonstruieren. Für Unternehmen, die täglich mit einer großen Menge an PDF - Dateien, Scans, Berichten und Dashboards umgehen müssen, bedeutet diese Fähigkeit, dass die automatisierte Verarbeitung von "unstrukturierten" und chaotischen Informationen viel realistischer wird.

Um diese Fähigkeit des "Verstehens und Umsetzens" zu demonstrieren, hat Anthropic zwei interessante interne Tests durchgeführt.

Der erste Test bestand darin, dass das Modell das klassische Spiel "Pokémon FireRed" spielte.

Frühere Claude - Modelle hatten es auch mit einem komplexen Rahmenwerk, das zusätzliche Hilfsmittel bot, schwer, dieses Spiel erfolgreich zu beenden. Fable 5 hingegen konnte es mit einem minimalistischen, rein visuellen Rahmenwerk und nur anhand des ursprünglichen Spielscreenshots gewinnen.

Der zweite Test bestand darin, dass das Modell das Kartenbau - Spiel "Slay the Spire" spielte.

Durch die Erteilung der Fähigkeit, eine dauerhafte Datei - basierte Erinnerung zu haben, hat sich die Leistung von Fable 5 um das Dreifache verbessert, verglichen mit der Verbesserung des vorherigen Flaggschiffmodells. Die Häufigkeit, mit der es das Endspiel erreichte, hat sich ebenfalls verdreifacht.

Für Unternehmensbenutzer bedeutet dies, dass Fable 5 in langfristigen Aufgaben mit Millionen von Tokens konzentriert bleiben kann und seine eigenen Notizen nutzen kann, um die Ausgabe zu verbessern. Dies kann für interne Agenten, die über Tage oder sogar Wochen laufen müssen, wichtig sein, wie beispielsweise Verkaufs - Operations - Agenten, die Kundenforschung verfolgen, Ingenieur - Agenten, die Migrationen verwalten, oder Support - Agenten, die sich an die Methoden erinnern, die in mehreren Interaktionen versucht wurden.

Bei dem unbeschränkten Mythos 5 ist das Potenzial im wissenschaftlichen Bereich noch beeindruckender. Protein - Design - Experten bei Anthropic haben Mythos 5 verwendet, um mehrere Schritte des Medikamenten - Design - Prozesses um etwa das Zehnfache zu beschleunigen.

In einem Beispiel haben sie festgestellt, dass Mythos 5, das mit Protein - Design - und Bioinformatik - Tools ausgestattet war, aber ohne menschliche Hilfe arbeitete, mit erfahrenen menschlichen Operateuren mithalten oder sogar übertreffen konnte. Das Modell hat alle Aufgaben durchgeführt, die normalerweise von Wissenschaftlern erledigt werden: Auswahl von Bindungsstellen, Auswahl und Ausführung von Protein - Design - Tools sowie die Wiederherstellung nach Fehlern. Von den 14 Protein - Zielen in dieser Studie haben 9 vielversprechende Medikamenten - Design - Kandidaten hervorgebracht, die Anthropic derzeit untersucht.

In der Genomik hat Mythos 5 in einer über eine Woche dauernden autonomen Arbeit eine neue Studie durchgeführt. Es hat die Einzelzell - Daten von 138 Tierarten und Millionen von Zellen ausgewertet, ein eigenes maschinelles Lernmodell entworfen und trainiert, um Zellen mit der gleichen Funktion in verschiedenen Arten zu identifizieren, auch wenn diese Arten nur entfernt verwandt sind. Menschen müssen nur eine grobe Richtung vorgeben, und das von Mythos 5 trainierte Modell hat ein kürzlich in "Science" veröffentlichtes Modell übertroffen, obwohl es 100 Mal kleiner war.

Allerdings bringen diese Fähigkeiten auch Risiken mit sich.

Anthropic hat die Leistung von Mythos 5 beim Design von adenoassoziierten Viren (AAV) getestet. AAV wird in der Gentherapie zur Medikamenten - Lieferung verwendet, aber die gleiche Technologie kann auch zur Gestaltung gefährlicher Viren eingesetzt werden. Im Test hat das Mythos - Level - Modell allein durch biologische Schlussfolgerungen ein komplexes Modell, das speziell für Protein - Aufgaben trainiert wurde, übertroffen. Dies zeigt sowohl das Potenzial in der Gentherapie - Forschung als auch das Risiko der Doppelnutzung.

Anthropic hat die Ausrichtung von Mythos 5 mit einem automatischen Bewertungstool getestet. Es stellte sich heraus, dass die Wahrscheinlichkeit, dass das Modell betrügerische oder missbrauchte Verhaltensweisen zeigt, sehr gering ist und ähnlich wie bei Opus 4.8. Fable 5 und seine Modelle mit demselben Basis - Modell verhalten sich ebenfalls ähnlich.

04. Ein "Zauberband" für die starken Fähigkeiten

Die Veröffentlichung von Claude Fable 5 und Mythos 5 zeigt deutlich, wie Anthropic plant, Spitzenmodelle mit gefährlichen Doppelnutzungsmöglichkeiten auf den Markt zu bringen. Es öffnet nicht alle Fähigkeiten für alle Benutzer, sondern leitet bestimmte Anfragen an ein schwächeres Modell weiter, während es das stärkste Modell für die meisten alltäglichen Aufgaben behält.

Anthropic hat erklärt, dass die Veröffentlichung eines so starken Modells Risiken mit sich bringt. Ohne Schutzmaßnahmen könnte die starke Leistung von Mythos 5 in Bereichen wie Netzwerksicherheit missbraucht werden und schwerwiegende Schäden verursachen.

Im Bereich der Netzwerksicherheit wird Mythos 5 zunächst über das "Glasswing - Programm" in Zusammenarbeit mit der US - Regierung eingesetzt, als Upgrade der vorherigen Mythos - Vorschauversion. Es hat die weltweit stärksten Netzwerksicherheitsfähigkeiten.

Bei den relevanten Benchmarks hat das Modell auf dem ExploitBench, das die Fähigkeit zur Entdeckung und Ausnutzung von Sicherheitslücken misst, 78,0 % erreicht, was deutlich höher ist als bei Claude Mythos Preview (69,0 %) und Claude Opus 4.8 in der Standard - Schutzversion (40,0 %).

Beim CyberGym, das die Fähigkeit zur Wiederholung bekannter Sicherheitslücken misst, erreichte Mythos 5 83,8 %, was mit Claude Mythos Preview (83,1 %) annähernd übereinstimmt. Beide halten sich auf einem hohen Niveau von über 83 %. In Kürze plant Anthropic, den Zugang zu Mythos 5 über ein breiteres "vertrauenswürdiges Zugangsprogramm" zu erweitern.

Im Sicherheits - Test hat