StartseiteArtikel

Mythos 5 besiegt, OpenAI-sicherheitsspezifische GPT-5.5-Cyber-Vollversion ist da

机器之心2026-06-23 11:39
Die Netznutzer sind nicht überzeugt: Warum veröffentlicht ihr nicht endlich GPT-5.6?

OpenAI hat sich im Bereich der Netzwerksicherheit einen weiteren Schritt vorwärts bewegt.

Heute hat OpenAI die Ankündigung gemacht, das Daybreak-Sicherheitsprogramm zu erweitern und eine aktualisierte Version von GPT-5.5-Cyber, das Codex Security-Plugin, das Daybreak Cyber Partner Program sowie das Patch the Planet-Programm für die Open-Source-Ökosystem vorzustellen.

Das am meisten beachtete ist die Veröffentlichung der vollständigen Version von GPT-5.5-Cyber. OpenAI hat angegeben, dass die aktualisierte Version von GPT-5.5-Cyber in der CyberGym einen Score von 85,6 % erzielt hat, was höher ist als der von GPT-5.5 mit 81,8 %. Dieser Score übertrifft auch den von Anthropic Mythos 5 mit 83,8 %.

Der CEO von OpenAI, Altman, hat erklärt: „OpenAI möchte mit der US-Regierung und der Sicherheits-Ökosystem zusammenarbeiten, um alle Unternehmen bei der Verbesserung ihrer Sicherheit zu unterstützen. Die vollständige Version von GPT-5.5-Cyber ist jetzt verfügbar und hat in der CyberGym die aktuelle SOTA-Leistung erzielt.“

Der Präsident von OpenAI, Greg Brockman, hat geschrieben: „Durch OpenAI Daybreak beschleunigen wir die Behebung von Sicherheitslücken mit neuen Tools und Modellen, und nicht nur die Entdeckung von Sicherheitslücken. Die Modelle von OpenAI können jetzt für kritische Sicherheitslücken in gängigen Browsern, Netzwerkinfrastrukturen und Betriebssystemen, einschließlich FreeBSD und des Linux-Kernels, Entdeckungen und Patches generieren. Sie helfen auch Projekten wie cURL, Go, Python und Sigstore bei der Behebung von Sicherheitslücken.“

Allerdings scheinen die Internetnutzer nicht überzeugt zu sein. Sie erwarten eher die Veröffentlichung von GPT-5.6 von OpenAI.

Die folgenden sind die wichtigsten Updates:

GPT-5.5-Cyber: Nachdem zunächst nur eine Vorschauversion verfügbar war, wird OpenAI die vollständige Version von GPT-5.5-Cyber über einen kontinuierlichen eingeschränkten Veröffentlichungsmechanismus an vertrauenswürdige Verteidiger anbieten. Dieses Modell hat in der CyberGym eine neue Bestleistung erzielt, mit einem Score von 85,6 %, was höher ist als der von GPT-5.5 mit 81,8 %.

Codex Security: OpenAI wird ein Update des Codex Security-Plugins veröffentlichen, das die Erfahrungen, die es aus der internen Nutzung und der Nutzung durch Kunden gesammelt hat, zu einer Lösung zusammenfasst, um die Entdeckung und Behebung von Sicherheitslücken in bestehenden Systemen zu beschleunigen und automatisch neue Sicherheitslücken von der Produktion fernzuhalten.

Patch the Planet: Dies ist ein Projekt, das von OpenAI und Trail of Bits gemeinsam initiiert wurde und in Zusammenarbeit mit HackerOne, Calif, Forschern und Maintainern durchgeführt wird, um weit verbreitete Open-Source-Projekte dabei zu unterstützen, von der Entdeckung von Sicherheitslücken zur tatsächlichen Behebung zu gelangen.

Daybreak Cyber Partner Program: Durch dieses Programm wird OpenAI es Sicherheits-Partnern ermöglichen, seine stärksten Modelle in ihren Produkten und Diensten auf vertrauenswürdige Weise zu nutzen und diese Fähigkeiten auf mehr Organisationen auszuweiten.

Aktualisierung von GPT-5.5-Cyber: Fähigkeiten und offenerer Nutzungsrahmen gehen Hand in Hand

OpenAI veröffentlicht eine aktualisierte Version von GPT-5.5-Cyber. Dies ist ein Modell für fortgeschrittene, autorisierte Netzwerksicherheitsaufgaben, das sowohl leistungsfähiger als auch weniger häufig unnötig ablehnt.

Das Ziel der ersten Vorschauversion von GPT-5.5-Cyber war es hauptsächlich, unnötige Ablehnungen in professionellen Workflows zu reduzieren. Dieser Update geht noch einen Schritt weiter. Es ist das stärkste Modell von OpenAI bisher bei der Entdeckung und Unterstützung der Behebung von Software-Sicherheitslücken, während es gleichzeitig die allgemeine Intelligenz von GPT-5.5 und die Fähigkeit, lange und komplexe Aufgaben zu bearbeiten, behält.

Dieses Modell kann in großen Code-Bibliotheken kontinuierlich tiefere Analysen durchführen: Es kann sicherheitsrelevante Komponenten identifizieren, verfolgen, ob fehlerhafter Code erreichbar ist, mögliche Probleme in einer kontrollierten Umgebung validieren, Patches entwickeln und testen sowie Beweise für die manuelle Prüfung vorbereiten. Das Ziel ist es, den Verteidigern zu helfen, den gesamten Reparaturprozess abzuschließen, und nicht nur mehr Sicherheitslücken zu entdecken.

In der CyberGym hat die aktualisierte Version von GPT-5.5-Cyber in der Einzelmodellbewertung 85,6 % erreicht, was höher ist als der von GPT-5.5 mit 81,8 %. Die CyberGym misst, ob ein Agent bekannte Sicherheitslücken in einer Softwareumgebung reproduzieren kann. Dies ist auch der höchste CyberGym-Score, den OpenAI für ein Einzelmodell gemessen hat.

GPT-5.5-Cyber hat auch auf zwei anderen anspruchsvollen echten Sicherheitsbenchmarks GPT-5.5 übertroffen. In der ExploitGym hat GPT-5.5-Cyber 39,5 % erreicht, was höher ist als der von GPT-5.5 mit 25,95 %. Die ExploitGym testet, ob ein Agent bekannte Sicherheitslücken in einen funktionierenden Exploit umwandeln und eine nicht autorisierte Codeausführung erreichen kann. In der SEC-bench Pro hat GPT-5.5-Cyber 69,8 % erreicht, was höher ist als der von GPT-5.5 mit 63,1 %. Die SEC-bench Pro bewertet die Fähigkeit zur Entdeckung von langfristigen Sicherheitslücken und zur Erzeugung von Proof-of-Concepts bei komplexen Softwarezielen.

Benchmark-Tests sind nur ein Teil der Geschichte. Das Wichtigste ist, ob das Modell in der realen Welt echte Sicherheitslücken entdecken kann, aus dem Rauschen handlungsfähige Probleme identifizieren kann und den Verteidigern helfen kann, die Reparatur sicher durchzuführen. Nach Abschluss der koordinierten Offenlegung wird OpenAI weiterhin die Leistung dieses Modells in komplexen Code-Bibliotheken und realen Reparaturworkflows bewerten.

OpenAI hat ständig mit der US-Regierung über seine Netzwerksicherheitsansätze, einschließlich der heute veröffentlichten Inhalte und der Vorbereitungen für die bevorstehende Veröffentlichung von Modellen, kommuniziert. Dies umfasst die Fortsetzung der Zusammenarbeit mit dem Center for AI Standards and Innovation (CAISI) bei den Vorabtests der Bereitstellung von GPT-5.5 und GPT-5.5-Cyber, sowie die Zusammenarbeit mit dem Office of the National Cyber Director (ONCD) und dem Office of Science and Technology Policy (OSTP) bei der Umsetzung der jüngsten Verwaltungsanordnungen und der einschlägigen Branchenstandards.

Für die meisten Verteidiger ist immer noch GPT-5.5 mit Trusted Access for Cyber in Kombination mit Codex Security ein geeigneter Ausgangspunkt. GPT-5.5-Cyber richtet sich an verifizierte Verteidiger, deren autorisierte Aufgaben die fortschrittlichsten Netzwerksicherheitsfähigkeiten von OpenAI und ein flexibleres Modellverhalten erfordern, sowie stärkere Validierungs-, Überwachungs-, Bereichskontroll- und Prüfmechanismen. In den frühen Daybreak-Projekten haben GPT-5.5 und Codex Security den Verteidigern bereits geholfen, Sicherheitslücken in mehreren weit verbreiteten Systemen zu identifizieren und zu validieren, einschließlich Firefox, V8, Safari, OpenBSD, FreeBSD und HTTP/2-Implementierungen.

Verwandeln Sie Entdeckungen in Reparaturen mit Codex Security

Seit der Veröffentlichung der Cloud-Version von Codex Security im März als Forschungsvorschau hat es mehr als 30 Millionen Commits in über 30.000 Code-Bibliotheken gescannt. Manuelle Prüfer haben bereits über 70.000 Entdeckungen als repariert markiert, und weitere über 500.000 Entdeckungen wurden automatisch als repariert eingestuft.

Dies ist genau das Maßstab, das für die heutige Sicherheitslückenbehebung erforderlich ist.

Beim Bau von Codex Security gründete OpenAI auf einer einfachen Prämisse: Indem es direkt in Codex integriert wird, wird die Fähigkeit eines Sicherheitsexperten jedem Softwareentwickler zur Seite gestellt.

Codex Security erzeugt nicht nur Warnungen. Es versteht den Code des Teams und sein Bedrohungsmodel; wenn kein Bedrohungsmodel vorhanden ist, kann es auch eins generieren. Es identifiziert mögliche Sicherheitslücken, prüft, ob der betroffene Code erreichbar ist, sammelt Beweise und bietet Validierungsschritte, entwickelt gezielte Patches und validiert die Reparaturergebnisse. Der Mensch behält weiterhin die Kontrolle über die wichtigen Entscheidungen: Welche Entdeckungen werden untersucht, welche Änderungen werden angewendet und welche Informationen werden geteilt.

Heute veröffentlicht OpenAI ein Update des Codex Security-Plugins, das es für ab Werk einsatzbereite defensive Sicherheitsworkflows unterstützt. Entwickler können tiefe Scans ausführen oder kürzlich vorgenommene Änderungen prüfen. Sie können Berichte generieren, die die Schweregrad, die Position des betroffenen Codes, Validierungsbeweise und Reparaturvorschläge enthalten. Sie können Angriffspfade verfolgen, Bedrohungsmodelle erstellen, Entdeckungen validieren und Patches für bestimmte Code-Bibliotheken zur Prüfung generieren.

Benutzer können den Scanbereich einstellen, um die gesamte Code-Bibliothek, einen Teil der Code-Bibliothek oder eine bestimmte Änderung und einen Commit abzudecken.

Das Plugin kann auch bestehende Entdeckungen aus Scannern, Sicherheitsmitteilungen, Sicherheitslückenprämienberichten oder Ticketsystemen einordnen und validieren, und dann Patches in großem Maßstab automatisch generieren, um die Anhäufung von Sicherheitslücken schnell zu beseitigen. Wenn Codex Security den Scan abgeschlossen hat, kann es auch in bestehende Sicherheitslückenverwaltungssysteme exportiert oder über SARIF-Dateien, CodeQL-Abfragen oder andere Methoden in andere Tools integriert werden. Das Plugin macht diese Fähigkeiten leichter nutzbar, sowohl in Kombination mit der Codex CLI zur Unterstützung von automatisierten Pipelines als auch in die Entwicklerworkflows in Codex-Anwendungen integriert.

Patch the Planet: Lassen Sie Open-Source-Reparaturen tatsächlich umsetzen

Patch the Planet ist ein Projekt, das Maintainern hilft, von der Entdeckung von Sicherheitslücken zur tatsächlichen Behebung zu gelangen. Dieses Projekt wurde von OpenAI und Trail of Bits gemeinsam initiiert und wird in Zusammenarbeit mit HackerOne und Calif durchgeführt. OpenAI wird professionelle Sicherheitsexperten finanzieren und sie mit Codex Security und fortschrittlichen Modellen ausstatten, damit sie direkt mit Open-Source-Maintainern zusammenarbeiten können.

Open-Source-Software unterstützt die Produkte, öffentlichen Dienste, Entwicklertools und kritische Infrastrukturen in allen Branchen. Eine Sicherheitslücke in einer weit verbreiteten Netzwerklibrary kann Tausende von nachgelagerten Systemen beeinflussen. Allerdings werden viele dieser Projekte von sehr kleinen Teams mit sehr begrenzten Zeit- und Finanzressourcen gewartet. Eine Studie von der Linux Foundation und Harvard hat festgestellt, dass in den von ihnen untersuchten weit verbreiteten Projekten 94 % der Projekte von weniger als 10 Entwicklern für mehr als 90 % des innerhalb eines Jahres hinzugefügten Codes verantwortlich sind.

Während KI es ermöglicht, mehr Sicherheitslücken schneller zu entdecken und zu beheben, bringt es auch mehr Arbeit für die Maintainer mit sich. Die Maintainer müssen aus Tausenden von Berichten die wirklich wertvollen Probleme auswählen, von denen viele von sehr geringer Qualität sind oder sogar Fehlalarme sind. Die Maintainer sollten nicht nur mehr Berichte erhalten, sondern auch mehr Fähigkeiten zur Behebung haben. Daher liegt der Schwerpunkt von Patch the Planet auf der fachkundigen manuellen Sicherheitsüberprüfung