Peinlich, OpenAI hat gerade GPT-5.5-Cyber zur Reparatur der Erde geschickt, aber Codex hat einen fatalen Bug.
Gerade eben hat OpenAI das "voll ausgelastete" GPT - 5.5 - Cyber sensationell vorgestellt!
Dies ist bisher das leistungsfähigste Netzwerksicherheitsmodell, das speziell für autorisierte, hochgradige Verteidigungsaufgaben maßgeschneidert wurde.
Im autoritativen CyberGym - Benchmark hat es mit 85,6 % eine hohe Punktzahl erzielt und Mythos 5 überwältigt.
Seine Kernfähigkeiten umfassen: das Verfolgen von fehlerhaften Codes, die Prüfung auf Sicherheitsrisiken, die Generierung von Patches und die Bereitstellung von Beweisen für die manuelle Überprüfung.
Genau heute wurde auch das Codex Security - Plugin erstmals veröffentlicht -
Es kann nicht nur die Sicherheitslücken in bestehenden Systemen beheben, sondern auch automatisch verhindern, dass neue Lücken in die Produktionsumgebung gelangen.
Wer hätte gedacht, dass fast gleichzeitig ein "epischer" Fehler in Codex aufgedeckt wurde.
Viele Entwickler melden, dass Codex bei der Ausführung von Streamingsaufgaben und beim Langzeitbetrieb mit einer extrem hohen Frequenz Daten in die lokale SQLite - Protokolldatei schreibt.
Es wird geschätzt, dass es im Laufe eines Jahres 640 TB schreibt, was ausreichen würde, um eine Verbrauchersolidstateplatte (SSD) innerhalb eines Jahres zu zerstören.
OpenAI propagiert ein Sicherheitsmythos von "die Welt reparieren", während gleichzeitig ein tödlicher Fehler von "die Festplatte durchbrennen" aufgedeckt wird.
Eine reale Version von "Eis und Feuer" spielt sich hier gleichsam ab!
Das "voll ausgelastete" GPT - 5.5 - Cyber taucht auf
Übertrumpft Mythos 5
Es muss gesagt werden, dass OpenAI dieses Mal wirklich viel investiert hat.
Es hat auf einmal drei Kernstrategien des Netzwerksicherheitsprogramms Daybreak (Dämmerung) vorgestellt, und die Kernaussage lässt sich in einem Satz zusammenfassen -
Künstliche Intelligenz hat die "physikalischen Gesetze" der Netzwerksicherheit verändert.
Der Kern dieser Veröffentlichung ist die vollständige Version von GPT - 5.5 - Cyber.
Dies ist das bisher leistungsfähigste "Netzwerksicherheitsmodell" von OpenAI, ein Werkzeug für "verifizierte Verteidiger".
Im CyberGym - Benchmark hat es 85,6 %, die höchste Punktzahl eines einzelnen Modells.
Zum Vergleich: Die normale Version von GPT - 5.5 hat 81,8 %, und Claude Opus 4.7 hat 73,1 % erreicht.
Im ExploitGym, das misst, ob Sicherheitslücken in echten Angriffscode umgewandelt werden können, hat die Cyber - Version 39,5 % im Vergleich zu 25,95 % der normalen Version.
Im SEC - bench Pro, das die Entdeckung von Sicherheitslücken in langen Ketten misst, hat die Cyber - Version 69,8 % im Vergleich zu 63,1 % der normalen Version.
Bei den drei Benchmarks übertrumpft die voll ausgelastete Cyber - Version GPT - 5.5 auf alle Fälle.
Codex bekommt einen "Künstliche - Intelligenz - Sicherheitsexperten" eingebaut
Zeigt das Schwert von "Dämmerung"
Wenn GPT - 5.5 - Cyber der Speer ist, dann ist Codex Security der Schild, der in die Hände jedes Entwicklers gelegt wird.
OpenAI hat das Codex Security - Plugin aktualisiert und es direkt in den Arbeitsablauf von Codex integriert -
Es bietet sofort einsatzbereite Sicherheitslückenscans, Bedrohungsmodelle, Angriffspfadverfolgung und automatische Patchgenerierung in einem Paket.
Die Logik ist einfach und grob: Hinter jedem Programmierer steht ein Sicherheitsexperte.
Seit der Einführung der Forschungsvorschau im März dieses Jahres hat Codex Security über 30 Millionen Code - Commits in über 30.000 Repositories überprüft.
Davon wurden über 70.000 Sicherheitslücken manuell bestätigt und über 500.000 automatisch behoben.
Das ist das Maßstab, das heute für das "Beheben von Sicherheitslücken" erforderlich ist: Früher war es ein Massenangriff, jetzt ist es die Geschwindigkeit der Maschinen.
Die Welt reparieren wird zum KPI
OpenAI hat auch ein aufregendes Projekt gestartet - Patch the Planet (Die Welt reparieren).
Warum ist das wichtig? Weil die Wahrheit in der Open - Source - Welt etwas kontra - intuitiv und brutal ist.
In 94 % der weit verbreiteten Open - Source - Projekte wird über 90 % des neuen Codes innerhalb eines Jahres von weniger als 10 Entwicklern geschrieben.
Der Code, der die Hälfte des Internets trägt, wird oft von nur wenigen Personen geschrieben, die Nachts wach bleiben.
Die Künstliche Intelligenz macht es immer schneller, "Sicherheitslücken zu finden", aber das wird für die Betreuer ein Desaster - Tausende von Berichten kommen herein, und die Hälfte davon sind schlechte Fehlalarme.
Deshalb ist der Kern von "Die Welt reparieren" genau professionelle manuelle Arbeit:
Die Forscher filtern doppelte Berichte heraus, überprüfen die Sicherheitslücken und geben saubere Patches an die Betreuer, anstatt ihnen nur Lärm zu geben.
Die ersten 30 Open - Source - Projekte haben zugesagt, teilzunehmen, darunter cURL, Go, Python, Sigstore, pyca/cryptography und andere.
In einem fünf - tägigen Sprint sind in 19 Projekten Hunderte von Problemen aufgetaucht und Dutzende von Patches integriert worden.
Darüber hinaus hat OpenAI das Daybreak (Dämmerung) Netzwerksicherheitspartnerprogramm gestartet.
Es bringt seine stärksten Modellfähigkeiten über die Produkte von fast 30 Sicherheitsriesen wie Cisco, CrowdStrike, Palo Alto Networks, Cloudflare in Tausende von Organisationen.
Auf Regierungsseite hat OpenAI mit den USA, Großbritannien und der ENISA der EU eine "vertrauenswürdige Netzwerksicherheitszugang" - Kooperation aufgebaut.
Kurz gesagt, OpenAI will nicht nur ein Modell erstellen, sondern das globale Netzwerksicherheitssystem aufbauen.
Das ist ein großes Spiel, und die Haltung ist sehr hoch.
Der Name "Dämmerung" deutet an: Der Tag bricht an, und die Verteidiger werden die Sicherheitslücken reparieren, bevor die Angreifer ansetzen.
Alles klingt perfekt. Bis die Nutzer ihre Festplattenüberwachung öffnen -
"Leute, die Codex intensiv nutzen, achten darauf, dass Ihre Festplatte möglicherweise einer Kernschlacht ausgesetzt ist."
Codex schreibt wild in die Protokolldatei
Brät eine SSD in einem Jahr durch
Es ist so, dass GitHub - Entwickler festgestellt haben:
Codex schreibt bei der Streamingsübertragung und bei automatisierten Langzeitaufgaben mit einer schrecklichen Geschwindigkeit von etwa 5 MB/s (im Test erreichte der Spitzenwert sogar 16 MB/s) TRACE - Protokolle in eine lokale SQLite - Protokolldatei namens ~/.codex/logs_2.sqlite.
Was bedeutet 5 MB/s? Umgerechnet schreibt es im Laufe eines Jahres etwa 640 TB.