StartseiteArtikel

OpenAI hat sich selbst den Goldmedaillenbesitzer bei den Olympischen Mathematikwettbewerben (IMO) tituliert und dafür heftige Kritik im gesamten Netz bekommen. Internetnutzer haben es scharf wegen Aufhebens kritisiert, und Mathematikexperten haben es öffentlich in Zweifel gezogen. Ist es eine Legitimation oder eine Absicht, sich an berühmte Namen zu hängen?

爱范儿2025-07-21 15:43
Was hat OpenAI in dieser Angelegenheit bloß nicht alles zerstört! Nicht nur die Herzen der Kinder!

Neuerdings hat eine große Neuigkeit in der Tech- und Mathematikszene für Aufsehen gesorgt.

OpenAI hat angekündigt, dass ihr Künstlicher Intelligenzalgorithmus in dem weltweit renommiertesten Mathematikwettbewerb (IMO) eine Leistung erzielt hat, die einem Goldmedaillengewinner entspricht.

Einfach ausgedrückt: Die KI kann jetzt Mathematik-Olympiade-Aufgaben lösen, und zwar auf Weltmeisterebene.

Dies hätte eigentlich ein Höhepunkt für die KI-Technologie sein sollen. Doch kaum war die Nachricht bekannt, begannen die heftigen Debatten im Internet, noch bevor die Champagnerflaschen geöffnet wurden.

Eine technologische Erfolgsmeldung hat sich schnell in eine große Kontroverse verwandelt, die sich hauptsächlich um drei Fragen dreht:

War der Zeitpunkt richtig? Im Gegensatz zu anderen KI-Unternehmen, die vom IMO aufgefordert wurden, hat OpenAI die Ergebnisse nicht eine Woche nach der Abschlussfeier bekannt gegeben. Stehlen sie den Highschool-Schülern damit die Show und verlieren an Anstand?

Ist die Goldmedaille echt? Das "geheime Modell" von OpenAI hat an einem Wettbewerb teilgenommen, der nicht offiziell vom IMO eingeladen war, und die Gutachter wurden von OpenAI selbst ernannt. Wie viel Wert hat diese "Goldmedaille" wirklich?

War der Wettbewerb fair? Einer KI, die sofort Zugang zu einer riesigen Datenbank hat, gegenüber menschlichen Kindern, die Jahrzehnte lang hart gelernt haben, zu vergleichen - ist das nicht unfair?

Was steckt hinter all dem? Lassen Sie uns Schritt für Schritt nachforschen.

IMO (International Mathematical Olympiad) - Internationaler Mathematik-Olympiade

Was hat OpenAI getan und warum hat es zu Kontroversen geführt?

Der erste Auslöser der Kontroverse war der Veröffentlichungszeitpunkt.

Am 19. Juli hat der OpenAI-Forscher Alex Wei in einem Beitrag auf der Plattform X angekündigt, dass ihr experimentelles Großmodell in der IMO-Mathematik-Olympiade eine Leistung erzielt hat, die einem Goldmedaillengewinner entspricht.

Das Modell hat 5 von 6 Aufgaben richtig gelöst und 35 von 42 Punkten erreicht. Der Mindestpunktestand für eine Goldmedaille beträgt 35 Punkte, für eine Silbermedaille 28 Punkte.

Das Modell hat den Test in einer standardisierten Prüfumgebung ohne externe Hilfsmittel absolviert, ohne Internetzugang, unter denselben Zeitbeschränkungen und mit nur einer Einreichungsmöglichkeit.

Die Bewertungskriterien wurden von drei ehemaligen Goldmedaillengewinern festgelegt und vereinbart. Alex hat die Antworttexte des Modells auf seinem GitHub-Repository veröffentlicht.

Es wurde kein zukünftiges GPT-5-Modell verwendet, sondern ein internes, noch unbenanntes experimentelles Modell. Ein Modell mit dieser Fähigkeit wird in den nächsten Monaten nicht veröffentlicht.

Scrollen Sie nach oben und unten, um mehr Inhalte anzuzeigen; Die Aufgaben der aktuellen IMO-Olympiade und die klaren, in natürlicher Sprache verfassten Antworten von OpenAI.

Alex Wei hat dies als "einen großen Sprung in der KI-Fähigkeit zum logischen Denken" bezeichnet und betont, dass das Modell universell einsetzbar ist. Das heißt, das verwendete Modell wurde nicht speziell für Mathematik-Olympiaden trainiert, sondern seine hervorragende Leistung basiert auf einer universellen Fähigkeit zum logischen Denken. Er hat besonders darauf hingewiesen, warum dies ein "großer Vorfall" ist:

Die IMO-Aufgaben erfordern im Vergleich zu früheren Tests einen neuen, anhaltenden Grad an kreativem Denken. In Bezug auf die Denkzeit haben wir jetzt von GSM8K (etwa 0,1 Minuten für Spitzenmenschliche) → MATH-Test (etwa 1 Minute) → AIME (etwa 10 Minuten) → IMO (etwa 100 Minuten) vorgegangen.

Die Kontroverse hat jedoch genau mit dem "Veröffentlichungszeitpunkt" von Alex Weis Beitrag über OpenAIs Goldmedaille in der IMO begonnen.

Populärer Beitrag, Original-Link: https://x.com/Mihonarium/status/1946880931723194389

Jemand auf X hat ein Bild mit einem Kommentar von Joseph Myers, einem ehemaligen Goldmedaillengewinner der IMO, gepostet.

Der Internationale Mathematik-Olympiade hat KI-Unternehmen gebeten, den Schülern nicht die Show zu stehlen und die Ergebnisse erst eine Woche nach der Abschlussfeier zu veröffentlichen. OpenAI hat jedoch die Ergebnisse vor der Abschlussfeier bekannt gegeben.

Ein Screenshot von Joseph Myers Kommentar, in dem er sagt, dass alle mit dem IMO verbundenen Personen der Meinung sind, dass OpenAIs Vorgehen unangemessen war.

Joseph Myers hat auch in seinem Kommentar gesagt:

Bei der IMO 2025 war es allgemein anerkannt, dass es unangemessen ist, dass KI-Entwickler Ergebnisse in Verbindung mit der IMO vor oder nach dem Wettbewerb (z. B. vor der Abschlussfeier) veröffentlichen. Üblicherweise sollten die Ankündigungen erst eine Woche nach der Abschlussfeier erfolgen, da der Schwerpunkt des Wettbewerbs auf den Errungenschaften der menschlichen Teilnehmer liegen sollte, und die Berichte über KI sollten nicht von diesem ablenken.

Der Blogger hat auch einen Beitrag von Harmonic, einem anderen KI-Unternehmen, das an der IMO teilgenommen hat, zitiert, um die Regeln der IMO zu bestätigen.

Um die Heiligkeit des Schülerwettbewerbs zu wahren, hat der IMO-Rat uns und andere beteiligte KI-Unternehmen gebeten, bis zum 28. Juli keine Ergebnisse zu veröffentlichen.

OpenAI wurde damit in die Kritik geraten, dass sie den Wettbewerb nicht respektieren. Die Internet-Nutzer haben sie beschuldigt, dass sie aus Gründen der Schlagzeilen die Ritualität des Wettbewerbs zerstört und die Errungenschaften der jungen Teilnehmer, die unter großem Druck angetreten sind, in den Schatten gestellt haben.

Ein Internet-Nutzer hat direkt kommentiert: "Die Jugendlichen, die an diesem Jahr am echten Wettbewerb teilgenommen haben, haben unter extremem Druck die Aufgaben gelöst, sich echten Gutachtern gestellt und die Ehre der Platzierungen übernommen. Ihre Errungenschaften sollten voll und ganz respektiert werden und nicht von OpenAI in den Hintergrund gedrängt werden."

Der OpenAI-Forscher Noam Brown hat jedoch später erklärt:

1. Wir haben die Nachricht erst nach der Abschlussfeier veröffentlicht. Die Abschlussfeier war live gestreamt, was den Veröffentlichungszeitpunkt bestätigen kann. 2. Er hat einem IMO-Organisator vor dem Posten bescheid gegeben, der darum gebeten hat, die Veröffentlichung erst nach der Abschlussfeier vorzunehmen. OpenAI hat diesem Wunsch auch tatsächlich gefolgt.

Trotzdem sind die Schlagworte "Voreilnehmer" und "unangemessen" an OpenAI geklebt. Wenn dies noch eine Fehlkommunikation oder ein Missverständnis in Bezug auf die Prozedur war, so zielt die nächste Kontroverse direkt auf den Wert dieser "Goldmedaille".

Wessen Bühne? Wessen Regeln? Wer hat das Sagen?

Die größere Frage ist: Wer hat diese "Goldmedaille" zertifiziert?

Obwohl Alex Wei in seinem Beitrag und auch OpenAI später bei der Weitergabe vorsichtig gesagt haben, dass das Modell eine "Goldmedaille-ähnliche Leistung" (gold medal - level performance) erreicht hat, und nicht, dass es "eine Goldmedaille gewonnen" oder "den Wettbewerb gewonnen" hat, wurde dies in den sozialen Medien dennoch zu "KI gewinnt Goldmedaille" vereinfacht.

Der IMO lädt spezielle KI-Unternehmen ein, an dem Wettbewerb teilzunehmen, wie z. B. das oben erwähnte Unternehmen Harmonic. OpenAI war jedoch nicht auf der offiziellen Einladungsliste.

Das heißt, OpenAI hat sich nicht offiziell für den Wettbewerb angemeldet und die Ergebnisse auch nicht an die offizielle Bewertungsstelle des IMO zur Bewertung gesendet. Stattdessen haben sie drei ehemalige Goldmedaillengewinner gebeten, die Antworten zu bewerten.

Einige Kritiker haben darauf hingewiesen, dass die drei ehemaligen Goldmedaillengewinner keine offiziellen Koordinatoren sind und der Testprozess von OpenAI nicht öffentlich war, sondern nur intern validiert wurde. Es wurde nicht wie bei anderen KI-Herausforderungen (z. B. dem Programmierwettbewerb mit Psyho vor ein paar Tagen) von einer unabhängigen dritten Partei validiert.

Eigentlich handelt es sich eher um einen internen Test als um eine öffentliche Herausforderung. Obwohl das Modell möglicherweise tatsächlich die Aufgaben gelöst hat, wirkt die nicht öffentliche und undurchsichtige Vorgehensweise wie eine Art "Selbstverherrlichung" der "Goldmedaille-ähnlichen Leistung".