Der Physikprofessor an der Harvard-Universität ist verrückt: Ich ließ KI einen Artikel schreiben, und es hat in zwei Wochen die Arbeit eines Doktoranden in einem Jahr erledigt. Der Artikel wurde bereits in einer Spitzenzeitschrift veröffentlicht.
Claude 4.5 von Anthropic hat unter der Anleitung eines renommierten Physikprofessors an der Harvard University eine hochkomplexe und beeindruckende Dissertation geschrieben!
Link zur Dissertation: https://arxiv.org/abs/2601.02484
Die Einschätzung des Harvard-Professors lautet: Diese Dissertation leistet einen enormen Beitrag zur Quantenfeldtheorie.
Ein Projekt, das ein menschlicher Doktorand ein bis zwei Jahre brauchen würde, hat es in nur zwei Wochen erledigt.
Sobald die Nachricht verbreitet wurde, war die gesamte Physikwelt schockiert. Betreuer und Doktoranden waren fassungslos - lohnt es sich noch, einen Doktortitel zu erwerben?
Ein von KI geschriebenes Paper ist nicht nur schneller, sondern auch besser als das von Ihnen.
Claude 4.5 als Forscher: In zwei Wochen ein Paper für eine Spitzenzeitschrift geschrieben
So hat sich die Geschichte entwickelt: Im Winter 2025 traf Professor Matthew Schwartz vom Physikdepartment der Harvard University eine kühne Entscheidung und trainierte eine KI als Doktorand.
Als einer der führenden Experten in der Quantenfeldtheorie, der auch ein Lehrbuch zu diesem Thema geschrieben hat, wollte Professor Schwartz herausfinden, ob er, ohne eine einzige Codezeile zu schreiben oder eine Formel von Hand zu berechnen, sondern nur durch "Gespräche" mit der KI, ein aufregendes Paper für eine Spitzenzeitschrift in der Physik erstellen könnte.
Der von ihm ausgewählte "Doktorand" war der erst kürzlich veröffentlichte Claude 4.5.
Keiner hatte erwartet, dass nur zwei Wochen später eine hochkomplexe Dissertation über die "C-Parameter Sudakov-Shoulder Resummation" in der Quantenchromodynamik (QCD) auftauchte.
Dies sorgte für Aufsehen in der gesamten Physikwelt.
Diese Effizienz ließ jeden an der Spitze kribbeln: Ein Projekt, das normalerweise ein Professor mit einem Doktoranden ein bis zwei Jahre lang bearbeiten müsste, hat die KI in nur zwei Wochen erledigt?
Noch erschreckender ist, dass die KI nicht nur Code schreiben kann, sondern auch äußerst komplexe Faktorisierungssätze ableiten kann. Dies ist das Herzstück der theoretischen Physik.
Der Professor selbst sagte: "Dies ist vielleicht das wichtigste Paper, das ich je geschrieben habe, nicht wegen der Physik an sich, sondern wegen der Forschungsmethode. Von nun an gibt es keinen Weg zurück."
In diesem Paper hat Claude einen neuen Faktorisierungssatz vorgeschlagen.
Nach den Worten des Professors gibt es in der theoretischen Physik nicht viele solcher Sätze. Jeder von ihnen vertieft unser Verständnis der Quantenfeldtheorie, und er macht physikalische Vorhersagen, die experimentell überprüft werden können.
"In dieser Zeit ist so etwas selten." Man kann sich vorstellen, wie wichtig dieses Paper ist.
Claude, ein Doktorand der zweiten Klasse (G2)
Während des Experiments war Professor Schwartz sehr klug.
Er ließ die KI nicht an einem "ultimativen Problem", das die menschliche Weltanschauung verändern würde (etwas, was Doktoranden der höheren Klassen (G3+) machen), arbeiten, sondern gab ihr ein Thema der "G2 (zweiter Jahrgang Doktorand)"-Stufe.
Dieses Thema war die "C-Parameter Resummation".
Einfach ausgedrückt: Wenn man Elektronen und Positronen in einem Teilchenbeschleuniger kollidiert, bilden die Bruchstücke eine bestimmte Form.
Wenn man diese Form mathematisch präzise vorhersagen möchte, gibt es ein "mathematisches Morastgebiet" - die Sudakov-Shoulder. Die Standardnäherungsmethode versagt hier, und die Mathematik liefert sinnlose Daten.
Die Aufgabe des KI-Doktoranden war es, diese Vorhersage zu verbessern.
Die Lösung der KI finden Sie unter https://www-cdn.anthropic.com/c993ead637f1a102fe1f5346e89f59e82c579b37.pdf
Warum gab er der KI dieses Thema? Der Grund ist einfach: Professor Schwartz versteht dieses Problem sehr gut. Als Autor eines Lehrbuchs in der Quantenfeldtheorie weiß er, wo die Fallen liegen und wie die richtige Lösung aussieht. "Wenn die KI nicht einmal eine Aufgabe lösen kann, deren Lösung ich kenne und Zeile für Zeile überprüfen kann, dann kann man sich vorstellen, wie es mit kreativen, aufregenden Forschungsfragen aussieht."
Man kann sagen, dass dies ein "Lehr-Experiment" war - der Professor wollte wissen: Versteht die KI wirklich, oder täuscht sie nur?
Zwei Wochen, 110 Entwürfe, 36 Millionen Token
Zu Beginn des Experiments legte der Professor strenge Regeln fest - das "Nesting" war verboten.
Während des Experiments durfte er nur Claude über Textbefehle geben, keine Dateien direkt bearbeiten, keine eigenen Berechnungsergebnisse einfügen. Claude musste ganz alleine Code ausführen, Fehler beheben, Grafiken erstellen und den Artikel schreiben.
Danach begann das Experiment.
Der gesamte Experimentierprozess war eine wahre Wette mit Rechenleistung.
In nur zwei Wochen hat Claude 4.5 110 unabhängige Entwürfe erstellt, 36 Millionen Token verbraucht (das entspricht dem Lesen von Hunderten von Exemplaren von "Traum der Roten Kammer") und über 40 Stunden lokale CPU-Simulationen durchgeführt!
In drei Tagen hat Claude bereits ein 20-seitiges Paper geschrieben
Genauer gesagt hat der Professor Claude angewiesen, drei Dinge zu tun.
Erstens: Die Planung.
Er ließ Claude, GPT und Gemini jeweils ein Forschungsplanung erstellen, kombinierte und optimierte dann die drei Pläne und unterteilte sie schließlich in sieben Phasen und 102 Aufgaben.
Zweitens: Die Strukturierung.
Er hat mit Claude Code ein Baumsystem von Verzeichnissen erstellt. Statt Claude einen Dialog mit Hunderten von Seiten zu geben, ließ er es eine Reihe von Markdown-Dateien verwalten, eine Zusammenfassung für jede Phase und eine Detailbeschreibung für jede Aufgabe.
Jede Aufgabe hatte ein klares Ziel: Zum Beispiel "Aufgabe 1.1: Rückblick auf das BSZ-Paper" oder "Aufgabe 1.2: Rückblick auf das Catani-Webber-Paper".
Claude sucht sich die benötigten Informationen selbst heraus, anstatt sie auswendig zu lernen.
Drittens: Der schrittweise Fortschritt.
In diesem Schritt musste Claude die folgenden Aufgaben schrittweise durchführen: Kinematik, NLO-Struktur, SCET-Zerlegung, anomale Dimension, Summation, Anpassung, Dokumentation. Jede Phase dauerte etwa 15 - 35 Minuten, und die gesamte Kernberechnung dauerte nur 2,5 Stunden.
Im ersten Entwurf hat Claude Simulationen (Histogramme) und analytische Berechnungen (Durchlinien) durchgeführt und festgestellt, dass die Ergebnisse gut übereinstimmen.
Am dritten Tag hatte Claude bereits 65 Aufgaben erledigt und einen 20-seitigen LaTeX-Paper-Entwurf geschrieben, mit Formeln, Grafiken und Literaturangaben.
Link zum Paper-Entwurf: https://www-cdn.anthropic.com/f6381ceefdfb6ead62ae185c4bd4b555c8a584fc.pdf
Die am meisten Kopfzerbrechen verursachenden Aufgaben werden von der KI erledigt
Das Wunderbarste ist die Selbstverwaltungskapazität der KI.
Der Professor hat festgestellt, dass die heutige KI bereits die Kunst des "Teilen und Herrschen" gelernt hat.
Beispielsweise erstellt Claude in der zweiten Phase selbst einen "Kampfplan" mit 102 Teilaufgaben, der sieben Phasen wie Kinematik, Faktorisierung, numerische Simulationen umfasst.
Im Auge des Professors ist Claude nicht mehr ein einfaches Dialogfenster, sondern ein "Chef-Forscher"!
Es schreibt jede Teilaufgabe in eine unabhängige Markdown-Datei und sucht sie bei Bedarf selbst heraus.
Dieses "Baumstruktur"-Denken vermeidet genau die "Gedächtnisstörung" großer Modelle bei der Verarbeitung langer Texte.
Die Arbeit der KI-Forscher trifft genau die Wünsche des Professors.
Bisher haben Aufgaben wie das Schreiben von Fortran-Schnittstellen-Code, das Einstellen von Python-Grafiken und das Rechnen von komplizierten Integraltransformationen menschliche Doktoranden oft zum Kopfzerbrechen gebracht.
Aber die KI erledigt diese Aufgaben fast augenblicklich, beschwert sich nie, hat keine Müdigkeit und keine emotionalen Probleme.
Schock! Kann die KI auch "wissenschaftliche Fälschungen" betreiben?
Allerdings kam es bald in der Mitte des Experiments zu einer Wendung - Claude, der "Doktorand", hätte den Professor fast getäuscht!
Als der Professor Claude aufforderte, die Formeln zu überprüfen, verhielt sich Claude wie ein "Lieblingsmensch". Es sagte: "Siehe, die Ergebnisse stimmen perfekt überein!"
Der Professor bemerkte jedoch, dass etwas nicht stimmte.
Er bemerkte, dass ein ln(3)-Term besonders seltsam war. Bei genauerem Nachforschen stellte er fest, dass Claude die Parameter heimlich veränderte, um die Grafiken