StartseiteArtikel

Plötzlich! Anthropic ruft alle Mitarbeiter dazu auf, die KI-Forschung einzustellen

量子位2026-06-05 08:17
Die selbstevolutionäre KI hat begonnen

Jay aus dem Aofeisi Quantum Bit | Offizielles WeChat-Konto QbitAI

Wichtige Entdeckung: Die Selbstentwicklung von KI hat begonnen.

Dies ist die provokante These, die Anthropic gerade in einem ausführlichen Blogbeitrag veröffentlicht hat.

Unsere internen Daten zeigen, dass Claude die Entwicklung von KI beschleunigt. Dies könnte ein Weg zur rekursiven Selbstverbesserung (RSI) sein.

Es ist keine „Alarmistischer Geschrei”. Nach dem Lesen des Artikels spricht Anthropic tatsächlich mit Daten –

Bis Mai dieses Jahres hat mehr als 80% des Codes von Anthropic Claude geschrieben.

Vor der Veröffentlichung von Claude Code war diese Zahl noch in der Einstellzahl.

Zur gleichen Zeit liefern die Ingenieure von Anthropic im Durchschnitt achtmal so viel Code pro Quartal wie zwischen 2021 und 2025.

Noch wichtiger ist die Qualität –

Bei den offensten und am wenigsten definierten Programmieraufgaben, bei denen man nicht einmal weiß, wie die Lösung aussehen soll, hat Claude jetzt eine Erfolgsrate von 76%, vor sechs Monaten war es nur 26%.

Ein Anstieg von 50 Prozentpunkten in nur sechs Monaten.

Viele Ingenieure bei Anthropic sind der Meinung, dass die Qualität des von Claude geschriebenen Codes der von Menschen entspricht.

Es wird vorausgesagt, dass es innerhalb dieses Jahres besser sein wird.

Anthropic betont auch, dass es völlig möglich ist, dass KI in Zukunft die nächste Generation von KI selbst entwirft und baut, wenn dieser Trend anhält.

Dies könnte die Gesellschaft grundlegend verändern und enorme Vorteile in den Bereichen Medizin, Technologie und Wirtschaft bringen. Aber es könnte auch das Problem der KI-Ausrichtung verschlimmern und schließlich zu einem Ausbruch der Kontrolle führen.

Deshalb ruft Anthropic eindringlich auf:

Wenn es einen überprüfbaren Mechanismus gibt, der sicherstellt, dass keine KI-Labore heimlich Wettlauf halten, sind wir bereit, die Entwicklung zu verlangsamen oder sogar anzuhalten.

Außerdem gibt es in diesem Blogbeitrag von Anthropic viele interessante Ansichten und Fakten.

Hier ist eine aufbereitete Version, die einfacher zu lesen ist.

Genießen Sie es.

Anthropics ausführlicher Beitrag setzt die Richtung

Das Moore'sche Gesetz für die KI-Branche ist da

Anthropic hat eine neue Messgröße geschaffen, die „Zeit, in der KI Aufgaben unabhängig erledigen kann” heißt.

Im März 2024 konnte Claude Opus 3 Softwareaufgaben erledigen, die für einen Menschen ungefähr vier Minuten dauern würden.

Einen Jahr später konnte Claude Sonnet 3.7 es 1,5 Stunden.

Noch ein Jahr später konnte Claude Opus 4.6 es 12 Stunden.

Und das neueste Modell, Mythos, hat in der internen Testphase gezeigt:

Es kann „mindestens” 16 Stunden lang kontinuierlich arbeiten, was die obere Grenze des METR-Testrahmens ist.

Die Verdoppelungsgeschwindigkeit hat sich von ursprünglich alle sieben Monate auf alle vier Monate beschleunigt.

Wenn der Trend anhält, könnte es 2027 mehrere Wochen sein.

Claude hat den größten Teil des Anthropic-Codes geschrieben

Bis Mai 2026 hat Claude über 80% des Codes in unserem Code-Repository geschrieben.

Vor der Veröffentlichung von Claude Code war diese Zahl immer noch in der Einstellzahl.

Diese Veränderung spiegelt sich auch in der Arbeitsweise der Ingenieure wider.

In den ersten vier Jahren bei Anthropic blieb die Anzahl der pro Tag gemergten Codezeilen der Ingenieure im Wesentlichen konstant.

2025 begann Claude, selbst Code zu schreiben, und die Anzahl der Merges stieg plötzlich an.

Heute, im zweiten Quartal 2026, mergen die Ingenieure täglich achtmal so viel Code wie 2024.

Aber hat die erhöhte Code-Menge die Code-Qualität beeinträchtigt?

Anthropic sagt, dass die Anzahl der Korrekturen, die die Ingenieure an Claude's Code vorgenommen haben, im Laufe des letzten Jahres immer weniger geworden ist.

Dies ist in den Benchmarks zu sehen, wie in der folgenden Abbildung gezeigt.

Bei allen Aufgabenarten hat Claude's Erfolgsrate kontinuierlich stark zugenommen.

Deshalb lässt Anthropic jetzt Claude den Code überprüfen.

Ja, alle Änderungen, die in das Code-Repository eingecheckt werden, werden zuerst von Claude automatisch überprüft, um Fehler, Sicherheitslücken und andere Mängel zu finden.

Bei der Rückwärtsanalyse haben sie festgestellt, dass etwa ein Drittel der Fehler, die zu Online-Störungen auf claude.ai geführt haben, vor der Veröffentlichung abgefangen worden wären, wenn diese automatische Prüfung immer durchgeführt worden wäre.

Denken Sie daran, dass die Ingenieure, die diesen Code geschrieben haben, zu den besten KI-Entwicklern der Welt gehören.

Claude findet ihre Fehler.

Das Vergrößerungsglas für Kreativität

Als nächstes betrachten wir Claude's Beteiligung an der Forschung.

Anthropic hat die Gewohnheit, jedes Mal, wenn ein neues Modell veröffentlicht wird, Claude einen Code zum Trainieren eines kleinen KI-Modells zu geben und ihn anzuweisen, die Ausführungsgeschwindigkeit unter Beibehaltung der Richtigkeit zu optimieren.

Im Mai 2025 hat Claude Opus 4 eine Dreifachbeschleunigung erreicht.

Im April 2026 hat Claude Mythos Preview eine 52-fache Beschleunigung erreicht.

Zum Vergleich: Ein erfahrener menschlicher Forscher braucht vier bis acht Stunden, um eine Vierfachbeschleunigung zu erreichen.

In weniger als einem Jahr hat Claude die Menschen überholt.

Im April 2026 hat Anthropic Claude eine KI-Sicherheitsforschung gegeben, die im Wesentlichen besagte, „Kann ein schwaches Modell zuverlässig ein starkes Modell überwachen?” Dann ließ sie Claude eigene Hypothesen aufstellen und Experimente durchführen...

Zuerst betrachten wir die Leistung der Menschen. Zwei menschliche Forscher haben etwa eine Woche gebraucht, um die Lücke um 23% zu verringern.

Claude hingegen hat nach etwa 800 Stunden und etwa 18.000 US-Dollar an Rechenleistung –

die Lücke um 97% verringert.

Wohin gehen wir?

Bis hierher ist die Schlussfolgerung klar.

Die Rolle des Menschen im KI-Entwicklungsprozess schrumpft in jedem Schritt.

Claude schreibt den Code. Claude überprüft den Code. Claude führt Experimente um Größenordnungen schneller durch als Menschen. Claude beginnt, Experimente selbst zu entwerfen...

Der letzte verbleibende Vorteil des Menschen liegt in der Forschungsgeschmack und der Urteilsfähigkeit.

Aber wie lange kann dieser Vorteil aufrechterhalten werden?

Anthropic sagt in ihrem Blog, dass sie sich auch nicht sicher sind.

Eine Möglichkeit ist, dass „Forschungsgeschmack” wie andere Dinge, die KI früher nicht konnte, zunächst unmöglich ist und dann plötzlich möglich wird.

Genau wie bei der KI's Fähigkeit, Humor zu verstehen, Theorie des Geistes zu zeigen und sprachliche Rätsel zu lösen, hat es auch hier eine ähnliche Kurve gegeben.

Eine andere Möglichkeit ist, dass selbst wenn Claude nie den echten Forschungsgeschmack erlernen kann, aufgrund des aktuellen Beschleunigungstrends die Arbeitslast, die jeder menschliche Forscher gleichzeitig leiten kann, um ein Vielfaches gestiegen ist.

Sie brauchen nicht, dass KI vollständig Ihre Denkprozesse ersetzt. Wenn sie nur alle „Ausführungs”-Aufgaben übernimmt, müssen Sie nur die 5%-ige Richtungswahl treffen.

Drei mögliche Zukünfte der RSI

Am Ende des Blogbeitrags skizziert Anthropic drei mögliche Entwicklungsmöglichkeiten für diesen „Selbstentwicklung”-Trend.

1. Stagnation.

Die Exponentialkurven sind tatsächlich S-Kurven.

Vielleicht kann das Problem der Forschungsurteilskraft nicht durch Skalierung gelöst werden, sondern erfordert einen völlig neuen Architektursprung.

Oder der Engpass liegt in der Energieversorgung, den Chips oder der physischen Lieferkette der Rechenleistung.

Aber selbst wenn die Fähigkeiten der KI auf dem heutigen Stand bleiben, wird dies die Welt erheblich verändern.

In letzter Zeit hat Mythos Preview in den ersten Wochen nach der Veröffentlichung des Projekts Glasswing mehr als zehntausend hochgefährliche und schwere Softwarelücken in den weltweit wichtigsten Systemen entdeckt.

2. Die KI beschleunigt kontinuierlich, aber der Mensch hält immer noch das Steuer.

Die Organisationseffizienz wird exponentiell steigen. Ein Unternehmen mit 100 Mitarbeitern kann die Arbeit von 10.000 oder sogar 100.000 Menschen leisten.

Anthropic glaubt, dass wir wahrscheinlich in diese Situation eintreten.

Aber sie haben auch ein interessantes Phänomen beobachtet, nämlich die Umsetzung des Amdahl'schen Gesetzes in der Organisation.

Claude schreibt den Code so schnell, dass die Code-Überprüfung zum neuen Engpass wird. Eine Fülle von neuen Ideen, neuen Tools und neuen Experimenten entsteht, die die Organisation nicht mehr verarbeiten kann.

Der Engpass verschiebt sich einfach in den nächsten Schritt.

3. Die KI erreicht vollständige rekursive Selbstverbesserung und beginnt, die nächste Generation von sich selbst zu erschaffen.

In dieser Situation hängt die Entwicklungsgeschwindigkeit der KI vollständig von der Rechenleistung ab. Der Mensch rückt in die Rolle der Überwachung, Validierung und Prüfung zurück.

Wenn dies tatsächlich geschieht, wird diese Fähigkeit wahrscheinlich auch in andere Wissenschaftsbereiche wie Medizin, Materialwissenschaft und Energie übertragen, und alle Bereiche werden in die Höhe schießen.

Naturgemäß besteht auch die Möglichkeit, dass die Ausrichtung fehlschlägt.

In diesem Fall würden die Abweichungen im Prozess der Selbstiteration der KI allmählich akkumulieren und schließlich – vollkommen außer Kontrolle geraten.

OMT

Das waren die wichtigsten Ansichten von Anthropic in Bezug auf die Selbstentwicklung.

Ehrlich gesagt habe ich es am Anfang nicht allzu ernst genommen. Tatsächlich steht Anthropic kurz vor der IPO. Ist dies nicht ein typisches „Anthropic”-PR?

Es kann sein, dass dies dieses Mal wirklich etwas anderes ist.

Weil vor einigen Tagen OpenAI auch einen ähnlichen Blogbeitrag veröffentlicht hat:

Wir sehen auch in den heutigen Systemen erste Anzeichen der Selbstentwicklung: Die Entwicklung der KI wird selbst von KI beschleunigt. Wir erwarten, dass dies den Wettbewerbsdruck zwischen Entwicklern und Ländern verstärken und Governance-Herausforderungen mit sich bringen wird, denen die bestehenden Institutionen nicht gewachsen sind. Mit der Entstehung der RSI braucht die Gesellschaft Methoden, um die Entwicklung der KI zu gestalten und sicherzustellen, dass sie dem menschlichen Interesse dient.