StartseiteArtikel

Vor ein paar Tagen wurde es noch von der Gruppe gehänselt, aber ChatGPT hat dann plötzlich ein mathematisches Problem gelöst.

机器之心2025-10-23 17:17
Es gibt auch Mathematikprofessoren, die ChatGPT als ersten Autor einer Dissertation aufgeführt haben.

Vor einigen Tagen haben Forscher von OpenAI behauptet, dass GPT - 5 Lösungen für zehn ausgesetzte mathematische Probleme "entdeckt" habe. Die Öffentlichkeit hat fälschlicherweise angenommen, dass GPT - 5 die Lösungen gefunden habe. Es stellte sich jedoch heraus, dass es sich lediglich um die Suche nach bereits existierenden Literatur handelte, was zu Spott von Wissenschaftsgroßen und heftigen Debatten über die übertriebene Werbung im Bereich KI und die Suchfähigkeit von KI führte. Siehe den Bericht "Hat OpenAI 10 mathematische Probleme 'gelöst'? Hassabis ruft 'peinlich' aus, LeCun gibt pikantere Kommentare ab".

Ironischerweise hat sich jedoch, während die Menschen noch darüber streiten, ob KI ein qualifizierter "Literatursucher" ist, ein echter mathematischer Durchbruch tatsächlich ereignet.

KI erzielt Forschungserfolg

Ernest Ryu, ein Mathematikprofessor an der University of California, Los Angeles (UCLA), hat in einem Tweet geschrieben: "Ich habe mit ChatGPT ein bisher ungelöstes Problem in der konvexen Optimierung gelöst."

Anschließend hat er in einer Reihe von Tweets über die gemeinsamen Ergebnisse mit ChatGPT berichtet.

Schauen wir uns zunächst das Problem an, das er untersucht hat:

Nun, ich verstehe es nicht, aber wir können die KI bitten, uns zu helfen (die KI schafft es wieder!):

Dieses mathematische Problem befasst sich mit einem in der Optimierungstheorie sehr bekannten dynamischen System. Wir können es mit einer lebhaften physikalischen Metapher verstehen: Das Rollen eines Balles in einer Schüssel. In dieser Metapher repräsentiert die sogenannte "konvexe Funktion" f eine perfekt geformte Schüssel, die innen glatt ist und deren Neigung vom Rand zur Mitte allmählich abnimmt, ohne irgendwelche Vertiefungen oder Hügel. Der Boden der Schüssel kann ein spitzer Punkt oder eine breite ebene Fläche sein. Diese niedrigste Fläche wird in der Mathematik als argmin f bezeichnet. X (t) beschreibt die Position eines Balles in der Schüssel zur Zeit t. Die zentrale Differentialgleichung im Screenshot, Ẍ(t) + (3/t)Ẋ(t) + ∇f (X (t)) = 0, ist die "physikalische Gesetz", das steuert, wie der Ball rollt. Dabei spielt ∇f (X (t)) die Rolle der "Schwerkraft", die den Ball ständig in die Richtung der steilsten Neigung zieht; (3/t)Ẋ(t) ist eine sehr besondere "Reibungskraft", deren Besonderheit darin besteht, dass sie mit der Zeit allmählich abnimmt. Anfangs ist die Reibungskraft stark und kann die Geschwindigkeit effektiv verringern. Mit zunehmender Zeit t wird dieser Reibungseffekt jedoch immer schwächer. Das gesamte Problem besteht darin, den Ball aus der Ruhe an einer Anfangsposition X₀ an der Schüsselwand loszulassen und dann zu beobachten, wie er sich unter diesen einzigartigen physikalischen Regeln bewegt.

Der eigentliche Kern und die Herausforderung dieses Problems besteht darin, streng zu beweisen, dass der rollende Ball schließlich nicht nur den Schüsselgrund erreicht, sondern auch an einem bestimmten Punkt im Schüsselgrund vollständig stillsteht. Auf den ersten Blick scheint dies selbstverständlich zu sein, aber in der Mathematik ist es ein tiefgreifendes Problem. Mathematiker haben bereits bewiesen, dass die "Höhe" f (X (t)) des Balles mit der Zeit unweigerlich der niedrigsten Höhe im Schüsselgrund zustrebt. Mit anderen Worten, wir sind 100 % sicher, dass der Ball schließlich in die niedrigste Zone des Schüsselgrundes gelangt und nicht auf halber Höhe stehen bleibt. Dies ist jedoch nur die "Konvergenz der Funktionswerte". Das eigentliche "ungelöste Problem" besteht darin, ob die "Position" X (t) des Balles ebenfalls konvergiert. Wenn der Schüsselgrund eine breite ebene Fläche ist, wird der Ball nach dem Erreichen dieser Zone möglicherweise aufgrund der Trägheit ewig gleiten, oszillieren oder im Kreis laufen, ähnlich wie ein Kreisel, der auf einer glatten Fläche unaufhörlich rotiert? Dieses Problem erfordert den Beweis, dass genau aufgrund der speziellen zeitabhängigen Reibungskraft 3/t die gesamte kinetische Energie des Balles auf eine passende Weise aufgebraucht wird und ihn schließlich an einem festen Punkt ankommt, anstatt in einem Zustand der niedrigsten Energie ewig zu driftieren. Dies war lange Zeit ein offenes Problem, das viele Forscher interessierte, da es die Grundlagen der Konvergenztheorie von Optimierungsalgorithmen berührt.

Im Folgenden ist der Beweis von ChatGPT, der jedoch auch vom Professor Ernest Ryu bearbeitet wurde:

Er hat auch die ursprünglichen Interaktionsaufzeichnungen geteilt: https://chatgpt.com/share/68f805f2 - b8fc - 8010 - 8df6 - 20a46bc1df44

Aus diesen Aufzeichnungen kann man sehen, dass er das Modell GPT - 5 Pro verwendet hat und dass dieses Modell 22 Minuten lang für die Lösung dieses Problems nachgedacht hat.

Ebenso hat die KI auf dieser Grundlage die Analyse vorgenommen, dass die Lösung X (t) der Nesterov ODE (gewöhnliche Differentialgleichung) schließlich gegen einen Minimalpunkt X∞ der Funktion f konvergiert.

Wir können auch im Beweis sehen, dass der Abstand zwischen z₁ und z₂ gleich 0 ist, was bedeutet, dass diese beiden Punkte derselbe Punkt sein müssen. Dies widerspricht der ursprünglichen "Annahme, dass es zwei verschiedene Punkte gibt". Daher ist die ursprüngliche Annahme falsch, und der Ball kann nur an einem Punkt stehen bleiben.

Ernest Ryu hat auch über seinen Prozess und seine Gedanken berichtet: "Meine Reaktion: ChatGPT hat tatsächlich meine Arbeit beschleunigt. Diese Arbeit hat ungefähr 12 Stunden gedauert und wurde über 3 Tage verteilt. Im Nachhinein betrachtet war der Beweis eigentlich sehr einfach."

Er hat weiter berichtet: "Ich habe viele andere Strategien versucht, aber keine davon war erfolgreich. ChatGPT hat mir jedoch entscheidend geholfen, diese Sackgassen schnell zu erkunden und auszuschließen. Darüber hinaus hat ChatGPT den entscheidenden Schritt zum Erfolg vorgeschlagen."

Er hat jedoch auch darauf hingewiesen, dass der Erfolg von ChatGPT nicht von einem Tag auf den anderen erreicht wurde: "ChatGPT hat nicht in einem Zug den Beweis geliefert. Der gesamte Prozess war sehr interaktiv. Es hat viele Argumente vorgebracht, von denen ungefähr 80 % falsch waren. Aber einige Ideen waren für mich wirklich neu. Wenn ich eine neue Idee entdeckte, egal ob richtig oder falsch, habe ich die wichtigsten Erkenntnisse daraus extrahiert und ChatGPT dazu angeregt, sie weiter zu entwickeln."

Ryu hat auch die jeweiligen Beiträge von ihm und ChatGPT zusammengefasst:

Schließlich hat er festgestellt: "Meiner Meinung nach kann dieses Ergebnis in einer renommierten Zeitschrift für Optimierungstheorie veröffentlicht werden. Ich möchte es jedoch noch weiter verbessern." In Zukunft plant er auch, den Beweis auf ODEs mit r > 0 zu verallgemeinern und "diesen Beweis in einen Beweis für die Konvergenz der diskreten Zeitmethode (d. h. der Nesterov - Beschleunigten Gradientenmethode) umzuwandeln".

Er hat zusammengefasst: "ChatGPT ist jetzt in der Lage, einige mathematische Forschungsprobleme zu lösen, aber es benötigt tatsächlich einen Experten, um es zu leiten."

Interessanterweise hat er erwähnt, dass die größte Hürde bei seiner Forschung war, dass er seine ChatGPT Pro - Abfragen aufgebraucht hatte, obwohl er bereits das "teure Pro - Plan" verwendet hatte und musste bis zum nächsten Monat warten, bis die Abfragen erneuert wurden.

Natürlich war dies eine ziemlich gute Werbechance. Mitarbeiter von OpenAI haben ihn bereits kontaktiert und ihm mehr Punkte zur Verfügung gestellt.

KI wird erster Autor eines Papers

Zufällig hat Paata Ivanisvili, ein Mathematikprofessor an der University of California, Irvine (UCI), vor einigen Tagen ebenfalls behauptet, dass GPT - 5 Pro ihm geholfen habe, ein Gegenbeispiel für ein Lemma zu finden.

Noch interessanter ist, dass er gerade erst angekündigt hat, ChatGPT als Mitautor seines Papers aufzunehmen, und zwar als ersten Autor!

Natürlich ist dies nicht das erste Mal, dass KI als Autor in einem seriösen wissenschaftlichen Paper auftaucht. Bereits 2023 war ChatGPT als dritter Autor eines Papers aufgelistet. Siehe den Bericht "Ein Paper - Autor wird berühmt. Wann können große Sprachmodelle wie ChatGPT Mitautoren von Papers werden?" Es ist jedoch zu beachten, dass ChatGPT in der neuesten Version des Papers nicht mehr in der Autorenliste steht.

Screenshot aus dem Jahr 2023. In der Autorenliste des Papers befindet sich inzwischen kein ChatGPT mehr.

KI unterstützt den Beweis und wird zweiter Autor

Nach dem sogenannten "Hat OpenAI 10 mathematische Probleme 'gelöst'?" - Ereignis vor einigen Tagen haben zwei menschliche Forscher eine ähnliche Peinlichkeit erlebt. Sie haben nach der Ankündigung, dass sie das #707 Erdos - Problem erfolgreich gelöst hätten, festgestellt, dass dieses Problem tatsächlich bereits vor 30 Jahren gelöst worden war!

Sie haben sich jedoch nicht damit begnügt, sondern haben GPT - 5 weiterhin dazu gebracht, einen Lean - formalisierten Beweis zu schreiben und ihn erfolgreich verifiziert. Natürlich haben sie auch die Wichtigkeit der Beratung und des Feedbacks durch Experten betont.

Insgesamt können wir sehen, dass sowohl ChatGPT als auch Lean in der Autorenliste ihres Papers aufgeführt sind.

Natürlich ist die Praxis, KI als Autor eines Papers aufzunehmen, immer noch sehr umstritten.