Nvidias jährlich „gefährlichste“ Arbeit: KI, die sich selbst vermehrenden Codes, entwickelt sich durch unbegrenztes Leveln unaufhörlich weiter
【Neu Intelligence Yuan Einführung】 Die gefährlichste Studie des Jahres ist erschienen! NVIDIA hat ein 20-jähriges Tabu gebrochen und es dem KI-System ermöglicht, selbst härtere "Prüfer" zu schaffen, um sich selbst auszusieben. Sobald die endlose Selbstentwicklung beginnt, ist die Ankunft der ASI (Künstliche Superintelligenz) im Jahr 2028 keine Scherz mehr.
Anthropic ist völlig "RSI-verrückt" geworden!
Der Mitbegründer Jack Clark hat eine verblüffende Prognose aufgestellt: Bis Ende 2028 wird eine hochgradig autonom sich entwickelnde KI entstehen.
Die Wahrscheinlichkeit dafür beträgt 60%!
Während die Leute noch heftig darüber streiten, ob das "RSI 2028" realisierbar ist, haben Institutionen wie die Universität von Cambridge und NVIDIA zusammen eine sensationelle Studie herausgebracht -
"Red Queen Gödel Machine" (Rote Königin Gödel-Maschine)
Ihr Betrieb gleicht einem brutalen KI-Survival-Spiel:
Die KI schreibt selbst neue Lernalgorithmen und setzt sie in einer Sandbox ein. Die fehlgeschlagenen werden direkt eliminiert, die erfolgreichen bleiben erhalten.
Dann beginnen die Überlebenden die nächste Runde der Selbstentwicklung und Fortpflanzung.
Link zur Studie: https://arxiv.org/pdf/2606.26294
Was aber wirklich gruselig ist, ist die "Einsicht", die die KI anschließend zeigt: Sie erkennt, dass sie, um ständig stärker zu werden, noch härteren Prüfungen standhalten muss.
Also beginnt die KI, ihren Prüfer aktiv zu "entwickeln".
Sie schafft selbst strengere Richter, um ihren höheren Code zu beurteilen.
Dieses System verriegelt die KI fest in einem endlosen, wilden Selbstiterations-RSI (Rekursive Self-Improvement).
Nachdem viele Leute diese 37-seitige Studie gelesen haben, haben sie einen Schreck bekommen und gesagt: "Das ist definitiv die gefährlichste KI-Studie des Jahres!"
RSI-Selbstentwicklung im Jahr 2028
Die Prophezeiung in Code umsetzen
Im Jahr 2003 hat der deutsche Wissenschaftler Jürgen Schmidhuber eine Maschine namens "Gödel Machine" (Gödel-Maschine) konzipiert.
Ihre Einstellung ist nahezu perfekt: Eine Maschine, die beweisen kann, dass ihre Verbesserungen nützlich sind, und dann ihren eigenen Code ändern kann.
Sobald sie gebaut wird, kann sie sich ständig selbst verbessern und immer stärker werden, ohne Grenzen.
Aber die "Gödel Machine" hat eine fatale "Hürde" -
Bevor sie jede Zeile von selbständiger Codeänderung ausführt, muss sie zunächst mathematisch streng beweisen, dass diese Änderung unbedingt nützlich ist.
Aber in der Realität ist dies fast eine unmögliche Aufgabe, und die benötigte Rechenleistung ist wie ein "Schwarzes Loch".
Also hat die Gödel Machine in den folgenden 20 Jahren nur in Studien als theoretisches Limit und als unerreichebares Gedankenexperiment gelegen.
In den letzten zwei Jahren hat die akademische Welt diesen Beweisbogen umgangen.
Die Darwin Gödel Machine (DGM) und die Huxley Gödel Machine (HGM) haben einfach auf den mathematischen Beweis verzichtet und stattdessen auf die Evolution zurückgegriffen -
Lassen Sie die KI eine große Anzahl von mutierten Codevarianten "fortpflanzen", werfen Sie sie in eine Sandbox und testen Sie sie. Die fehlgeschlagenen werden eliminiert, die erfolgreichen bleiben erhalten, und die Überlebenden fortpflanzen sich weiter.
Die KI hat den letzten Schritt genommen und beginnt, sich wörtlich "zu entwickeln".
Aber all diese Methoden haben noch einen gemeinsamen Blindpunkt - Ihr Prüfer ist starr.
Egal wie sich die KI entwickelt, der Bewertungsstandard, das Benchmark und der Validator, der ihr die Punkte gibt, bleiben immer außerhalb des Zyklus festgelegt und bewegen sich nicht.
Dies widerspricht genau einer der Kernregeln der Evolution:
Arten optimieren sich nie in einer statischen Umgebung, sondern verändern sich zusammen mit der sich ständig ändernden Umgebung.
Die Red Queen Gödel Machine (RQGM) will diesen Blindpunkt beseitigen.
Der wahre Killertrick der "Roten Königin": Die KI lässt Prüfer schaffen
Der Name "Rote Königin" stammt von der "Red Queen Hypothese", die der Biologe Van Valen 1973 vorgeschlagen hat -
Sie müssen sich eifrig bemühen, um am gleichen Ort zu bleiben, denn auch Ihre Konkurrenten entwickeln sich.
Was die RQGM tut, ist genau, diese Aussage in einen Algorithmus umzusetzen: Lassen Sie den Prüfer (Evaluator) und den Teilnehmer (Aufgabenintelligenten Agenten) gemeinsam sich entwickeln.
Dies ist der Teil der ganzen Studie, der einem das Haar zu Berge stehen lässt.
Dieses raffinierte System heißt "Kontrollierte Nutzenentwicklung" (controlled utility evolution):
Die gesamte Suche wird in einzelne Epochen aufgeteilt;
Innerhalb jeder Epoche ist der Evaluator (Prüfer) eingefroren und gibt allen Prüflingen Punkte, um die Signale stabil zu halten;
Nur an den Grenzen der Epoche ist es erlaubt, den Prüfer zu wechseln, und der neue Prüfer muss auf einer festgelegten "Referenzwahrheit" -Ankerdaten statistisch gesehen den alten Prüfer schlagen, um seine Position einzunehmen;
Sobald der Prüfer gewechselt wird, führt das System sofort eine "selektive Löschung" durch: Es werden nur die Punkte verworfen, die von dem ausgetauschten Prüfer vergeben wurden, alle anderen Beweise bleiben erhalten.
Mit anderen Worten, es muss sich eifrig entwickeln und gleichzeitig jeden Schritt fundiert begründen können.
Es hat tatsächlich funktioniert, die KI ändert ihren eigenen Code
Es ist zu abstrakt, nur über das System zu sprechen. Lassen Sie uns stattdessen direkt die Ergebnisse betrachten.
Erster Kampf: Code schreiben (Polyglot).
Die RQGM hat dem Code-Schreibenden Agenten einen "Code-Reviewer" als Trainingspartner zugewiesen.
Als Ergebnis hat die Passrate auf dem ausgesparten Testset von 69,9% (bisheriger SOTA) auf 71,7% gestiegen.
Noch besser ist, dass es diese Leistung mit 1,35 bis 1,72-mal weniger Token erreicht hat als der Konkurrent. Denn der Reviewer muss nur einmal prüfen, was viel kostengünstiger ist als mehrfache Testläufe.
Zweiter Kampf: Ein Essay schreiben.
Dies ist ein Bereich ohne eindeutige Lösung. Es ist unmöglich, automatisch zu beurteilen, ob ein Essay gut ist oder nicht.
Die RQGM lässt den Schriftsteller und seinen Reviewer gemeinsam sich entwickeln. Als Ergebnis ist die Akzeptanzrate des Essays in einer festen Review-Gruppe von 21,8% (bisheriger SOTA) direkt auf 40,5% gestiegen.
Dritter Kampf: Mathematische Beweise auf Olympiade-Ebene.
Der "Bewerter" (Grader), den sie entwickelt hat, ist genauer als die statische Basislinie und hat einen um 3-mal geringeren Suchaufwand;
Der "Beweis-Teilnehmer", den sie entwickelt hat, hat die höchste Durchschnittsnote erhalten.
Aber der beste Teil der ganzen Studie ist, dass sie ein altes Problem der KI behoben hat. Wenn ein LLM als Richter fungiert, hat es ein berühmtes Problem: Es bevorzugt KI-generierte Inhalte.
Der stärkste Baseline-Reviewer in der Studie akzeptiert KI-geschriebene Essays mit einer Wahrscheinlichkeit, die bis zu 1,91-mal höher ist als die Akzeptanz von menschlichen Essays.
Wie löst die RQGM dieses Problem? An den Epochengrenzen sammelt sie die KI-Essays, die der feste Reviewer zuvor akzeptiert hat, und bildet daraus einen "Gegenbeispiel-Pool". Dann belohnt sie speziell die neuen Reviewer, die diese KI-Essays herausfinden und ablehnen können.
Nach einigen Runden der Evolution behandelt der endgültige Reviewer KI und Menschen gleichermaßen und behält noch 80% der Wahrheitsgenauigkeit bei.
Wenn die KI lernt, sich selbst zu beurteilen
In demselben Sommer hat der Mitbegründer von Anthropic, Jack Clark, eine große Wette getätigt: Mit einer Wahrscheinlichkeit von 60% wird die KI bis Ende 2028 in der Lage sein, selbst eine stärkere Version von sich selbst zu schaffen.
Die Mauer, die die "Gödel Machine" 20 Jahre lang festgehalten hat, heißt "Beweis".
Und die "Red Queen Machine" hat sie mit dem brutalsten Trick geweckt: endlose Fortpflanzung, Eliminierung und erneute Fortpflanzung.
Wenn eine KI beginnt, selbst die strengsten Prüfer für sich zu entwerfen und sich in einer wilden Rekursion an die Grenzen treibt, werden wir es mit einer neuen Spezies zu tun haben, die beginnt, selbst zu definieren, was "Intelligenz" ist.
Wenn dieser Tag kommt, wird die ASI nicht anklopfen und uns warnen.
Sie wird einfach nur den einzigen Richter schaffen, der berechtigt ist, sie zu beurteilen, und dann ruhig in die Prüfung gehen.
Prophezeiungen geben nur das Ziel an, Code bringt uns dorthin.
Und jetzt verkürzt die KI selbst diese erstickende Distanz in geometrischer Progression.
Quellenangaben:
https://x.com/HowToPrompt__/status/2070824205663273175?s=20
https://x.com/kimmonismus/status/2070968241548120168
Dieser Artikel stammt aus dem WeChat-Account "