Ist die KI schon so stark? Veröffentlicht und online gestellt, aber Zugang für normale Menschen verweigert

Möglicherweise ist es das stärkste KI-Modell in der Geschichte der Menschheit.

Ich denke, dass die Menschheit möglicherweise von KI mit einer Geschwindigkeit eingeholt wird, die über unseren herkömmlichen Vorstellungskraft hinausgeht.

Ich weiß nicht, wie es euch geht, aber ich bin inzwischen so sehr von KI abhängig, dass mindestens 50 % meiner täglichen Arbeit mit KI-Unterstützung erledigt werden.

Und dieser Anteil steigt stetig.

Zugleich steigen mit der Veröffentlichung neuer Modelle in schneller Folge sowohl meine Arbeitsleistung und -qualität als auch meine monatlichen Ausgaben für Token rapide an.

Letzte Nacht habe ich eine Nachricht gelesen: Anthropic hat ein Modell entwickelt, das selbst sie nicht allen Menschen zur Verfügung stellen wollen, weil es einfach zu stark ist.

Der Name dieses neuen Modells lautet "Mythos", was auf Deutsch "Mythos" oder "Sage" bedeutet.

Derzeit ist es in der Vorschauversion, daher nennt das Unternehmen es "Mythos Preview". Es wurde jedoch im Rahmen eines Projekts namens "Project Glasswing" vorgestellt.

Ich werde später noch mehr über dieses Projekt erzählen.

Letzten Monat wurde versehentlich ein internes Dokument von Anthropic preisgegeben, in dem erwähnt wurde, dass ein stärkeres und größeres Modell als Opus in Entwicklung sei, das unter dem Codename Mythos arbeitet.

Anschließend hat Anthropic diesen Vorfall auf "menschliches Versagen" zurückgeführt und keine weiteren Erklärungen gegeben.

Jetzt hat Anthropic offiziell das Modell mit dem Codename Mythos angekündigt.

Obwohl die Ankündigung erfolgt ist, ist das Modell noch nicht öffentlich zugänglich. Das bedeutet, dass normale Benutzer es noch nicht nutzen können.

Der Grund ist einfach: Anthropic hält das Modell für zu stark und für ungeeignet, bis die Sicherheitsmechanismen ausreichend entwickelt sind.

Ich denke, dass diese Aussage einen Moment der Überlegung wert ist.

Normalerweise versuchen KI-Unternehmen, neue Modelle so schnell wie möglich auf den Markt zu bringen, um Marktanteile zu erwerben. Aber Anthropics Vorgehen ist hier offensichtlich ungewöhnlich.

Nach meiner Meinung ist es nicht so, dass sie es nicht wollten, sondern dass sie es nicht wagten.

Das Modell Mythos ist tatsächlich sehr leistungsfähig.

Schauen wir uns zunächst einige von der Firma veröffentlichte Testdaten an.

Was die Codierungsfähigkeit betrifft, besteht ein deutlicher Abstand zwischen Mythos und dem derzeit stärksten öffentlichen Modell, Claude Opus 4.6. In verschiedenen Benchmark-Tests schlägt Mythos Opus 4.6 grundsätzlich.

Bei der Inferenzfähigkeit hat Mythos im GPQA Diamond-Test (wissenschaftliche Fragestellungen auf Graduiertenebene) mit 94,6 % gegen 91,3 % gewonnen.

In den Tests "Humanity's Last Exam" mit und ohne Werkzeuge schlägt Mythos ebenfalls.

Was die computerbezogenen Fähigkeiten im Zusammenhang mit Agenten betrifft (OSWorld-Verified, d.h. autonom ausgeführte Computeraufgaben), schlägt Mythos mit 79,6 % Opus 4.6 mit 72,7 %.

In jeder Kategorie ist Mythos stärker als Opus 4.6, in einigen Fällen sogar um ein Vielfaches.

Bei einigen Aufgaben stellt sich der Unterschied nicht als kleiner Schritt, sondern als großer Sprung dar. Beispielsweise hat die Leistung im SWE-bench Multimodal von 27,1 % auf 59 % zugenommen, fast verdoppelt.

Der wichtigste Grund, warum Anthropic Mythos noch nicht veröffentlichen will, ist, dass es die Fähigkeiten hat, die Sicherheitsbarrieren der Softwarewelt zu durchbrechen.

Einfach ausgedrückt: Alle Systeme und Software haben Schwachstellen, und Mythos kann diese Schwachstellen besser als Menschen entdecken und angreifen.

Stell dir vor, dass Hacker diese Fähigkeiten erlangen. Dann wären alle Betriebssysteme und Software auf der Welt in Gefahr, insbesondere kritische Infrastrukturen und nationale Sicherheit.

In einer Ankündigung von Anthropic steht ein Satz, der mich nachdenklich gemacht hat.

Übersetzt heißt es: "Die Codierungsfähigkeiten von KI-Modellen haben ein so hohes Niveau erreicht, dass sie in Bezug auf die Entdeckung und Ausnutzung von Software-Schwachstellen fast alle Menschen außer den erfahrensten übertreffen können."

Ich möchte diesen Satz etwas ausführlicher erläutern.

Als ehemaliger Programmierer weiß ich, wie Software aufgebaut wird und wie unterschiedlich der Code von verschiedenen Personen sein kann.

Außerdem gibt es keine Software, die behaupten kann, keine Schwachstellen zu haben, auch wenn diese noch nie entdeckt wurden.

Der Grund, warum alte Schwachstellen jahrelang unbehelligt in Systemen lagen, ist nicht, dass die Systeme sicher waren, sondern dass das Finden von Schwachstellen hohe Fachkenntnisse, Geduld, Energie und Zeit erfordert.

Nur wenige Menschen haben diese Fähigkeiten, und noch weniger sind bereit, sich darauf zu konzentrieren.

Diese "Knappheit an Fähigkeiten" ist die verborgene Voraussetzung für die Sicherheit der gesamten Softwarewelt. Mit der Einbeziehung von KI beginnt diese Voraussetzung zu wackeln.

KI kann Aufgaben besser als die meisten Menschen erledigen. Wir können sie also nutzen, um Schwachstellen zu finden und zu schließen.

Um dieses Problem zu lösen, möchte ich nun erklären, was das Project Glasswing von Anthropic ist.

Einfach ausgedrückt: Es ist ein Projekt, das die Fähigkeiten von Mythos nutzt, um Schwachstellen in globalen Infrastruktur-Systemen zu finden.

An diesem Projekt beteiligen sich 12 Organisationen, darunter AWS, Apple, Microsoft, Google, Nvidia, Cisco und die Linux Foundation.

Dieses Team repräsentiert die Cloud-Computing-, Betriebssystem-, Chip-, Browser-, Finanzinfrastruktur-, Netzwerksicherheits- und Open-Source-Branche.

Mit anderen Worten: Fast alle zentralen Akteure in der globalen digitalen Infrastruktur sind an diesem Projekt beteiligt.

Die Kernidee dieses Projekts ist, dass die Verteidiger diese Spitzen-KI-Fähigkeiten zuerst nutzen können.

Wenn die Angreifer zuerst Zugang zu diesen Werkzeugen hätten, wäre es schwer, die Tür wieder zu schließen. Anthropic hat sich verpflichtet, einen Budgetbetrag von 100 Millionen US-Dollar für die Testphase bereitzustellen.

Außer den 12 Kernorganisationen haben mehr als 40 Organisationen, die kritische Software-Infrastrukturen warten, Zugang zu Mythos und können damit ihre eigenen Systeme und Open-Source-Projekte scannen.

Zusätzlich hat Anthropic der Linux Foundation 2,5 Millionen US-Dollar und der Apache Software Foundation 1,5 Millionen US-Dollar gespendet. Beide sind die Grundlage der Softwarewelt.

Die meisten Apps, Websites und Systeme, die wir heute nutzen, basieren auf diesen Infrastrukturen.

Meiner Meinung nach hat Anthropic mit diesem Schritt etwas Gutes getan. Sie haben nicht nur ein stärkeres Modell entwickelt, sondern auch Geld in die globale Informationsinfrastruktur investiert, um diese zu verbessern.

Letztendlich ist es für niemanden von Vorteil, wenn man sich ungeschützt der Gefahr aussetzt.

Vielleicht können Sie sich noch nicht vorstellen, wie stark Mythos wirklich ist. Ich habe in den offiziellen Dokumenten drei konkrete Beispiele gefunden, die meiner Meinung nach besser als Zahlen die Stärke von Mythos verdeutlichen.

Erstes Beispiel: OpenBSD.

Dieses Betriebssystem gilt als sehr sicher. Viele kritische Infrastrukturen laufen darauf, darunter das iOS-System auf unseren Apple - Smartphones, Android - Systeme und sogar interne Systeme von Unternehmen und Organisationen.

Mythos hat eine Schwachstelle entdeckt, die 27 Jahre lang unbehelligt in OpenBSD gelegen hat. Ein Angreifer kann damit ein Zielsystem über das Netzwerk abstürzen lassen.

27 Jahre! Es war nicht so, dass niemand sich darum gekümmert hat, sondern dass niemand diese Schwachstelle gefunden hat.

Zweites Beispiel: FFmpeg.

Fast alle Software, die Videos verarbeiten muss, ist von FFmpeg abhängig. Sie finden es in fast allen Videowiedergabeprogrammen.

Es gibt eine Schwachstelle in einer Codezeile, die vor 16 Jahren geschrieben wurde. Automatisierte Testwerkzeuge haben diese Stelle 5 Millionen Mal getestet, ohne die Schwachstelle zu finden.

Mythos hat sie jedoch entdeckt.

Drittes Beispiel: Der Linux - Kern.

Das muss ich nicht weiter erläutern. Der Linux - Kern ist die Grundlage des Internets und daher besonders wichtig zu schützen.

Mythos hat nicht nur einzelne Schwachstellen entdeckt, sondern auch mehrere Schwachstellen zu einer Angriffskette verbunden.

Von der normalen Benutzerrechten ausgehend, kann es die Rechte erhöhen und schließlich das gesamte System kontrollieren.

Dieser Fall unterscheidet sich von den ersten beiden Fällen grundlegend.

Das Finden von Schwachstellen erfordert analytische Fähigkeiten.

Das Verbinden von Schwachstellen erfordert strategische Fähigkeiten.

Viele Produktmanager können Prototypen erstellen, Dokumente schreiben und Daten analysieren. Das sind Einzelkompetenzen. Aber das Verbinden von Geschäft, Produkt und Marketing erfordert strategisches Denken.

Ein Modell, das Angriffspfade planen kann, ist nicht nur ein Prüfwerkzeug, sondern eher ein intelligentes Agens, das in der digitalen Welt aktiv handeln kann.

Bei diesen drei Fällen hat Anthropic die Schwachstellen zuerst entdeckt, dann gemeldet, repariert und erst danach veröffentlicht. Alle Schwachstellen sind inzwischen behoben.

Nach diesen Beispielen können Sie sich vorstellen, wie stark Mythos ist. Es ist wie ein wilder Tier, das man noch nicht aus dem Käfig lassen will. Die reale Welt muss sich erst an seine Stärke gewöhnen.

Ich möchte hier einige Beobachtungen machen, die vielleicht der Anfang der echten Veränderungen sind.

Erstens: Die Annahmen über die Sicherheit der Softwarewelt verlieren an Gültigkeit.

Die Stabilität von Software, die wir heute als selbstverständlich ansehen, kommt nicht nur von gutem Design. In hohem Maße hängt sie von der Knappheit an Angriffsfähigkeiten ab.

Einfach ausgedrückt: Es ist nicht, dass die Software stark ist, sondern dass die Menschen nicht stark genug sind.

Das Finden von Schwachstellen kostet Zeit und Geld, das Erstellen von Angriffsketten erfordert Ressourcen. Deshalb bleiben viele technische Schulden, alte Bugs und veraltete Systeme unberührt.

Genauso wie bei der Produktentwicklung: Wenn wir denken, dass alles in Ordnung ist, bedeutet das nicht, dass es wirklich so ist. Vielleicht haben wir einfach unsere Grenzen erreicht.

Mythos hat gezeigt, dass die Zeit zwischen der Entdeckung und der Ausnutzung von Schwachstellen von Monaten auf Minuten reduziert werden kann.

Was bedeutet das?

Das bedeutet, dass die Zeit, die man für Patches und Reparaturen benötigt, nicht mehr mit der Angriffsgeschwindigkeit Schritt halten kann.

Zweitens: Die Open - Source - Welt wird zuerst unter Druck geraten.

Die meisten modernen Software - Anwendungen basieren auf Open - Source - Komponenten. Normalerweise bemerken wir das nicht, aber wenn diese Komponenten angegriffen werden, wird die gesamte Branche betroffen.

Vielleicht verstehen einige Leser diesen Mechanismus nicht so gut. Einfach ausgedrückt: Alle Software, die wir heute nutzen, basiert auf Open - Source - Projekten, deren Quellcode für alle sichtbar ist.

In Zukunft, wenn Modelle Open - Source - Projekte ständig und in großem Maßstab scannen können, werden die Betreuer der Open - Source - Gemeinschaften unter einem ganz anderen Druck stehen.

Darum hat Anthropic der Linux Foundation und der Apache Foundation Geld gespendet.

Es ist keine Wohltätigkeit, sondern die Anerkennung, dass die Open - Source - Infrastruktur in der KI - Ära die empfindlichste und zugleich unwiederbringliche Grundlage der digitalen Welt ist. Sie wollen einfach nicht als Bösewichte dargestellt werden.

Drittens: Die Rolle des Menschen wird abnehmen, und KI wird mit KI spielen.

Bisher war der Wert der Sicherheitsteams von Internet - Produkten in der menschlichen Urteilsfähigkeit, Erfahrung und dem tiefen Verständnis von

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Ist die KI schon so stark? Sie wird veröffentlicht und online gestellt, aber man traut sich nicht, sie den normalen Menschen zu ermöglichen, sie zu nutzen.