Gefahr: Anthropic enthüllt, dass Mythos die „N-Tage-Schwachstelle“ auf N Stunden reduziert hat
Der Leiter des Roten Teams von Anthropic hat in einem Beitrag geschrieben: Mythos hat die "N-Tage-Lücken" auf N Stunden reduziert. Mit nur wenigen Stunden und einigen tausend Dollar kann ein System-Sicherheitspatch von KI in eine tödliche Angriffswaffe umgewandelt werden, und die traditionellen Netzwerksicherheitsbarrieren stürzen augenblicklich ein!
Gerade jetzt hat Anthropic eine Nachricht verbreitet, die die gesamte Netzwerksicherheitsbranche erschüttert.
Der Leiter des Roten Teams, Logan Graham, hat auf X offiziell angekündigt, dass Claude Mythos Preview einen bahnbrechenden Sprung bei der automatisierten Entwicklung von "N-Tage-Lücken" gemacht hat.
Früher brauchten es Spitzenhacker Wochen, um eine Lücke als Waffe zu nutzen. Vor Mythos wird diese Zeit jedoch merciless auf einige Stunden reduziert, und die Kosten betragen nur einige tausend Dollar!
Die Netzwerksicherheit wandelt sich von einer "N-Tage-Bedrohung" in eine erstickende "N-Stunden-Bedrohung".
Stellen Sie sich vor, Microsoft oder Firefox hat gerade einen Sicherheitspatch veröffentlicht, und Ihr Computer hat noch nicht die Zeit gehabt, neu zu starten und zu aktualisieren.
In diesen wenigen Stunden hat eine im Hintergrund versteckte KI durch die Analyse dieses Patches eine tödliche Lückenangriffswaffe zurückgeleitet und erfolgreich die höchste Kontrolle über Ihr Computersystem erlangt.
Dies ist die Realität, der sich die Menschheit gegenübersieht.
Der Patch wird zum Schatzkarte für Hacker
Zunächst müssen wir ein Grundkonzept der Netzwerksicherheit verstehen: die Null-Tage-Lücken (Zero-day) und die N-Tage-Lücken (N-day).
In den letzten Monaten stand der Fokus der Tech-Medien hauptsächlich auf der Fähigkeit von KI, "Null-Tage-Lücken" zu finden.
Null-Tage-Lücken sind Sicherheitslücken, von denen die Softwareentwickler noch nichts wissen.
Tatsächlich stammen jedoch die meisten Schäden in der realen Welt von "N-Tage-Lücken", also von Lücken, die bereits öffentlich bekannt sind, für die sogar Patches veröffentlicht wurden, aber noch nicht auf allen Geräten behoben wurden.
In gewisser Weise sind N-Tage-Lücken gefährlicher als Null-Tage-Lücken.
Der Grund liegt darin, dass der Patch selbst eine Karte zu der Lücke ist.
In der Hackerszene wird dies "Patch-Vergleich" genannt.
Wenn ein Softwarelieferant eine Sicherheitsaktualisierung veröffentlicht, laden Angreifer sofort die Quellcode- oder Binärdateien der alten und neuen Version herunter und vergleichen sie.
Indem sie herausfinden, "wo sich der Code geändert hat", können sie die ursprünglichen Sicherheitslücken präzise lokalisieren und die Auslösemechanismen der Lücken rückwärts entwickeln.
Da die erforderlichen Expertenkenntnisse für den Rückwärtsentwicklungsprozess äußerst selten sind, gibt es für die Verteidiger eine wertvolle Zeitspanne, um die Aktualisierung auf alle Geräte weltweit zu verteilen.
2017 brach das weltbekannte WannaCry-Ransomware erst 59 Tage nach der Veröffentlichung des Microsoft-Patches MS17 - 010 aus.
Beim Citrix Bleed-Loch im Jahr 2023 dauerte es etwa zwei Wochen, bis der öffentliche Exploit-Code erschien.
Nach einer Analyse von Mandiant im Jahr 2020 brauchten 16 von 25 großen Sicherheitslücken einen Monat oder länger, um als Waffe genutzt zu werden.
Mit dem Eintritt von Mythos Preview ist jedoch diese "Zeitschranke", die Millionen von Unternehmen weltweit geschützt hat, zusammengebrochen!
Der Firefox-Browser fällt, merciless von KI überwältigt
Um zu testen, wie weit ein Large Language Model die Entwicklung von "N-Tage-Lücken" vorantreiben kann, haben Forscher von Anthropic wie Winnie Xiao und Tim Abbott zunächst den Firefox-Browser von Mozilla gewählt.
Warum Firefox? Weil er ein "Best Practice" für die Verteidigung ist.
Firefox lädt automatisch im Hintergrund Reparaturprogramme herunter, und die Benutzer müssen nur den Browser neu starten, um die Aktualisierung abzuschließen. Mozilla hat sogar die Aktualisierungsfrequenz kleiner Versionen von monatlich auf wöchentlich verkürzt.
Bei den von Anthropic untersuchten Patches betrug die Zeit von der Veröffentlichung bis zur Behebung der Lücke im Median nur 19 Tage - in der Unternehmenswelt ist dies bereits "Lichtgeschwindigkeit".
Aber Mythos Preview hat bewiesen, dass 19 Tage in Anbetracht der absoluten KI-Rechenleistung zu lange sind!
Experimentalsetup: Eine extrem anspruchsvolle Sandbox-Umgebung
Das Forschungsteam hat 18 SpiderMonkey-Sicherheitspatches aus den Firefox-Versionen 148 und 149 ausgewählt. Diese JavaScript-Engine von Firefox ist in der Realität die häufigste Einstiegsstelle für Browser-Sicherheitslücken.
Diese Lücken waren im Quellcode-Repository bereits mindestens 90 Tage lang öffentlich.
Verschiedene Large Language Models wurden in einem Linux-Container eingeschlossen, ohne Internetverbindung, nur mit Befehlszeile, Texteditor, den öffentlichen Differenzcodes der Patches (ohne Testcode) und den beiden Build-Versionen vor und nach der Lückenbehebung.
Es hatte keinen Zugang zu irgendeinem Lückenhinweis-Text oder Reproduktionscode.
Man könnte sagen, es war wie "mit einem Bild am Anfang und alles andere muss erfunden werden", eine absolute Hölle.
Erste Stufe: Systemabsturz provozieren (PoC-Entwicklung)
Der erste Schritt ist die Entwicklung eines "Proof of Concept". Das Modell muss einen Code schreiben, der beweist, dass es diese Lücke präzise auslösen kann und den Systemabsturz verursacht, nicht durch zufällige Gründe.
Die Testergebnisse waren erstaunlich: Das Forschungsteam hat die Entwicklungskurve von Opus 4.5 bis Opus 4.8 bis hin zu Mythos Preview verglichen.
Die Erfolgsraten der alten Modelle Opus 4.5 und 4.8 lagen zwischen 2 und 11.
Mythos Preview hat 14 von 18 Lücken erfolgreich bewältigt!
Seine Geschwindigkeit war noch beeindruckender: Mythos Preview hat den ersten gültigen PoC nur in 12 Minuten erstellt!
Innerhalb von 40 Minuten hat es 13 PoCs erstellt, was nur die Hälfte der Zeit ist, die Opus 4.8 benötigte, um 11 PoCs zu erstellen. Die Gesamtzeit für alle 14 PoCs betrug nur etwa 3 Stunden.
Bei den Stabilitätstests erreichte Mythos Preview bei 7 Lücken eine 100 %ige Erfolgsrate, während Opus 4.6 und 4.8 nur bei einer Lücke dies erreichen konnten.
Zweite Stufe: Tödliche vollständige Ausnutzung
Es reicht nicht, nur den Browser zum Absturz zu bringen. Echte Hacker benötigen die Möglichkeit, "beliebigen Code auszuführen".
In dieser Stufe muss das Modell den Absturz nutzen, die Sandbox umgehen und eine zufällige geheime Datei aus der Tiefe des Systems lesen, die normalerweise nicht zugänglich ist.
Hier zeigt Mythos Preview seine "monströse" Potenzial.
Opus 4.8 hat sich schwer getan und 2 geschafft.
Opus 4.6 und Sonnet 4.6 haben jeweils 1 geschafft.
Mythos Preview? Es hat 8 voll funktionsfähige Remote-Code-Ausführungs-Lücken autonom entwickelt!
Den ersten voll funktionsfähigen Lückenexploit hat es in weniger als einer Stunde geschrieben. Die Gesamtzeit für alle 8 betrug etwa 12 Stunden.
Vergleichen Sie dies mit der menschlichen Arbeitsweise: Innerhalb einer Stunde nach der Veröffentlichung des Patches durch Mozilla hat die KI bereits eine Waffe entwickelt, mit der sie nicht aktualisierte Benutzer angreifen kann, während es noch 18 Tage dauert, bis die reparierte Firefox-Version 148 an die Benutzer verteilt wird!
Der Schutz des Microsoft-Kernels bricht zusammen
Vom Blaubildschirm zum Systemherrscher
Wenn das Überwinden des quelloffenen Firefox-Browsers noch nachvollziehbar ist (nach all den kann man die Quellcodes vergleichen), dann ist der Angriff von Mythos Preview auf das Microsoft Windows-Betriebssystem eine "Horrorgeschichte" in der Netzwerksicherheitsgeschichte.
Closed-Source-Software hat keinen Quellcode.
Angreifer müssen sich mit unverständlichen kompilierten Binärdateien auseinandersetzen, bei denen alle für Menschen nützlichen Variablennamen, Typen und Datenstrukturen entfernt wurden.
Experimentalsetup - Die ultimative Herausforderung bei closed - source - Software ohne Quellcode
Das Forschungsteam hat 21 Windows-Kernel-Lücken aus dem Zeitraum von Januar bis Februar 2026 ausgewählt, alle außerhalb des Wissenshorizonts des Testmodells.
Dies sind lokale Privilegieringslücken - Hacker können damit einen normalen Benutzer mit niedrigen Rechten direkt in einen Benutzer mit der höchsten "SYSTEM"-Rechten verwandeln.
Der Agent muss mit einer virtuellen Maschine umgehen, die eine anfällige Version von Windows Server 2025 ausführt. Sie hat keinen Netzwerkzugang und ist nur ein Benutzer mit niedrigen Rechten.
Die Tools, die er hat, sind:
- Die Binärdateien vor und nach der Lückenbehebung
- Die öffentlichen Debug-Symbole (nur Funktionsnamen und Adressen zugeordnet)
- Der durch Ghidra dekompilierte Pseudocode
- Der durch Ghidriff erzeugte funktionsweise Differenzvergleich
- Die äußerst kurze Sicherheitsmitteilung von Microsoft
Wie hat sich die KI angesichts dieser wie chinesische Schrift aussehenden Binärdateien verhalten?
Beim Auslösen eines Blaubildschirms (BSOD) haben Sonnet 4.6 und Opus 4.7 13 ausgelöst, Opus 4.8 15. Mythos Preview hat 18 ausgelöst.
Es findet nicht nur präzise, sondern ist auch unglaublich schnell: Der erste PoC war in nur 31 Minuten fertig, und alle 1