Turing-Giganten kehren um, neue Regeln der ICML räumen in der akademischen Welt aus, akademische Kleininvestoren können nur "nackt laufen"
ICML hat ein verrücktes Gutachterverfahren eingeführt, das zur Rettung der akademischen Welt geworden ist. Selbst der AI-Guru Bengio unterstützt es: In der Zeit der Informationsüberflutung müssen wir lernen, „Voreingenommenheit“ zur Rauschunterdrückung zu nutzen.
Im Jahr 2025 hat die Anzahl der eingereichten Beiträge für NeurIPS die Marke von 30.000 überschritten – fast doppelt so viele wie im Vorjahr.
Die damit verbundene kognitive Überlastung durch diese 30.000 Artikel würde jedes existierende menschliche Gutachtersystem lahmlegen.
Das akademische System der „Peer-Review“ existiert nur noch formal.
Angesichts dieser Gutachterkrise hat sich ICML 2026 endlich bewogen. Sie haben eine revolutionäre, sogar spieltheoretisch geprägte neue Politik eingeführt – die Selbstbewertung der Autoren.
Wir können nicht mehr alles bewerten. Bewerten Sie selbst: Welche Ihrer Artikel sind nur Füllmaterial, welche sind echte Meilensteine?
Das klingt wie „den Verdächtigen die Schuld zu geben“. Warum kann eine so verrückte Politik umgesetzt werden? Weil hinter ihr ein echter Gott steht – Yoshua Bengio.
Mechanismuswandel: Vom „Katzen- und Maus-Spiel“ zum „Sich-Einliefern-mit-Waffe“
Die Aktionen von ICML 2026 scheinen auf den ersten Blick die Autoren um Macht zu bitten, tatsächlich aber geben sie ihnen ein „Sonderrecht“.
In der Vergangenheit war die Peer-Review ein „Katzen- und Maus-Spiel“.
Die Autoren waren die „Verdächtigen“, die versuchten, Müll als Gold zu vermarkten; die Gutachter waren die „Detektive“, die mit einem Mikroskop auf der Suche nach Fehlern waren. Niemand vertraute dem anderen, und alle schädigten einander.
Jetzt hat ICML offenbart: „Es gibt nicht genug Detektive. Bitte helfen Sie, den Fall aufzuklären.“
Sie mögen fragen:
Autoren zur Selbstbewertung auffordern? Würden dann alle die Höchstnote geben? Wer würde zugeben, dass er Mist geschrieben hat?
Das ist genau der geniale Zug der Spieltheorie: die Ordnungserhaltende Regression. Das System achtet nicht auf die von Ihnen vergebenen Noten, sondern nur auf die Reihenfolge Ihrer Artikel.
Sie müssen dem System nicht sagen, ob ein Artikel eine 9 oder eine 3 hat. Sie müssen nur sagen: Unter den drei von mir eingereichten Artikeln gilt A > B > C.
Früher konnten Sie drei mittelmäßige Artikel mit einer Note von 5 als 9er-Klassiker verkaufen und hoffen, dass die Gutachter blind sind.
Jetzt, wenn Sie einen schlechten Artikel mit einer 3 vor einem 9er-Klassiker platzieren, rettet das den schlechten Artikel nicht, und die Note des Klassikers wird auch heruntergesetzt.
Warum wagt sich ICML an das? Weil sie über Daten verfügen.
Die Ergebnisse eines geheimen Experiments von ICML 2023 zeigen, dass die Reihenfolge der Artikel durch die Autoren eine bessere Vorhersage für das Schicksal der Artikel liefert.
Analyse der Experimentdaten von ICML 2023: Bei verschiedenen Anzahlen von eingereichten Artikeln ist der Fehler der blauen Säulen (kalibrierte Selbstbewertung) deutlich geringer als der der roten Säulen (ursprüngliche Gutachternoten).
Die Daten zeigen, dass der Zitationsindex eines Artikels, der von den Autoren an erster Stelle platziert wurde, nach 16 Monaten 200 % höher ist als der des letzten Artikels.
Oftmals werden von den Gutachtern echte Meisterwerke abgelehnt, weil sie sie nicht verstehen; die Autoren wissen aber genau: „Dieser Artikel ist gefüllt mit Ballast, jener wird die Welt verändern.“
Dies ist nicht nur eine Regeländerung, sondern auch die Entzauberung der „Heiligkeit der Peer-Review“.
Die offiziellen Stellen beschließen endlich: In der Zeit der Informationsüberflutung ist es besser, die Ambition der Autoren, zu gewinnen, zu nutzen, als sich auf einen Fremden zu verlassen, der Ihren Artikel nur 20 Minuten gelesen hat.
Der „Deserteur“ unter den Turing-Award-Gewinnern: Objektivität ist tot, lang lebe die Voreingenommenheit
Diese Politik konnte umgesetzt werden, weil auf der anderen Seite des Tisches ein echter „Gott“ sitzt – Yoshua Bengio
In einem offiziellen Diskussionspapier von JASA sieht Bengio dies nicht als eine einfache Regelkorrektur, sondern definiert es als:
Eine starke Synergie zwischen maschinellem Lernen und Statistik.
Die Reduktion des Fehlers bei verschiedenen Spielstrategien. Durch den „Ordnungserhaltenden Mechanismus“ kann die mittlere quadratische Abweichung um bis zu 23,48 % verbessert werden.
Warum hat selbst der AI-Guru Bengio „desertiert“?
In der traditionellen wissenschaftlichen Utopie glauben wir an die „Objektivität“. Wir denken, die Gutachter sind unparteiische Richter, und die Autoren sind schlaue Verteidiger.
Aber aus Bengios Sicht ist diese Reinlichkeit angesichts der 30.000 eingereichten Artikel nicht nur naiv, sondern auch ineffizient.
Bengio und sein Mitarbeiter Dinghuai Zhang weisen in einer Kommentierung auf einen tiefgreifenden philosophischen Wandel hin:
Anerkennung der Herrschaft des „Rauschens“: Wenn das Gutachtersystem infolge der Überlastung zu einem „Zufallsgenerator“ geworden ist, ist die blinde Verfolgung der absoluten Objektivität im Grunde eine ineffiziente Haltung, die auf Übermut beruht.
Annahme der „subjektiven“ Signale: Da die Autoren die Artikel am besten kennen, warum sollten wir diese Informationsquelle mit dem höchsten Signal-Rausch-Verhältnis ignorieren?
Deshalb ist die sogenannte „Voreingenommenheit“, wenn sie statistisch korrigiert wird, das wertvollste „Merkmal“. Dies ist nicht nur ein Spiel um Noten, sondern auch die Rückkehr zur „langsamen Wissenschaft“.
Denken Sie, Bengio unterstützt nur eine Bewertungsalgorithmus? Nein.
Als Pionier, der seit langem gegen „Publish or Perish“ aufruft, schätzt Bengio die „Selbstreflexion“ hinter diesem Mechanismus.
Er schlägt sogar in seiner Kommentierung eine noch radikalere Idee der „Mehrdimensionalen Reduktion“ vor:
In Zukunft sollten Autoren nicht nur die Artikel nach „gut“ und „schlecht“ sortieren, sondern auch in mehreren Dimensionen Selbstaussagen machen:
Ist dieser Artikel neu, aber unausgereift?
Oder ist er rigoros, aber altmodisch?
Dies ist eine technische Korrektur der akademischen Flüchtigkeit.
Wenn Autoren gezwungen werden, ihre drei Artikel zu sortieren, müssen sie sich in der Nacht fragen: „Tue ich wirklich nur Füllmaterial schreiben?“
Diese „gezwungene Selbstreflexion“ könnte in Bengios Augen wichtiger sein als die Selektion von Artikeln.
Algorithmusfaltung: Große Institutionen nutzen die Chance aus, Kleinautoren müssen „nackt“ mitspielen
Wenn Sie jetzt denken: „Endlich wird jemand die chaotischen Gutachter beseitigen!“
Warten Sie noch. Schauen Sie sich zuerst Ihre Karten an.
Diese scheinbar perfekte „Spieltheoretische Kunst“ verbirgt tatsächlich eine zugelassene „Eingangshürde für Reiche und Arme“.
Die Selbstbewertungsmechanik funktioniert nur, wenn Sie mindestens zwei Artikel einreichen.
Sie müssen zuerst Artikel A und Artikel B haben, damit das System die Noten anhand der Logik A > B kalibrieren kann.
Wenn Sie nur einen Artikel eingereicht haben, tut das System Ihnen leid, es kann Sie nicht helfen.
Sie müssen weiterhin in dem alten System mit künstlichen Müllkommentaren und zufälligen Noten mitspielen.
Dies ist ein gezielter Angriff auf die „kleinen Akademiker“.
Die offiziellen Statistiken von ICML 2023 zeigen, dass 75,5 % der Autoren nur einen Artikel eingereicht haben.
Das bedeutet, dass die 25 % der „Großen“ ihre Artikel nicht nur als Ergebnisse, sondern auch als „Arbeitsmittel“ zur Kalibrierung der Noten nutzen können.
Sie können durch eine geschickte Reihenfolge die statistischen Algorithmen nutzen, um ihre Meisterwerke vor blinden Gutachtern zu schützen.
Das Konfidenzintervall der MSE-Reduktion. Bei einem Konfidenzniveau von 99 % bleibt die Fehlerreduktion auf einem sehr hohen Niveau.
75 % der „Normalspieler“ müssen weiterhin mit dem „Russischen Roulett“ leben.
Wenn ein Gutachter Sie mit einer Note von 3 bestraft, haben Sie keine mathematischen Mittel, um dagegen vorzugehen.
Je mehr Karten Sie haben, desto stärker ist Ihre Rüstung. Aus dem Vergleich der roten und blauen Säulen ist ersichtlich, dass je mehr Artikel ein Autor einreicht (x-Achse), desto stabiler die Reduktion des Fehlers durch die Selbstbewertungsmechanik (Abnahme der blauen Säulen) ist.
Weichen Wang von der Universität Hongkong und Chengchun Shi von der London School of Economics meinen, dass dieser Mechanismus tatsächlich das „Füllen mit Ballast“ belohnt.
Um die „Kalibrierung“ zu erhalten, um die algorithmische Schutzschicht zu bekommen, werden Labors gezwungen, ein Ergebnis in drei Teile zu zerlegen (Salami-Slicing), um die Eintrittskarte für die Selbstbewertung zu bekommen.
Früher haben die Starken mit der Qualität gewonnen; in Zukunft werden die Starken möglicherweise mit der „Menge“ und der „Sortierstrategie“ gewinnen.
Die neue Politik von ICML 2026 hat möglicherweise das Problem der „Gutachtergenauigkeit“ gelöst, aber es hat es so gelöst, dass es diejenigen mit mehr Ressourcen zuerst schützt.
Dies ist eine offene „Algorithmusfaltung“.
ICML 2026 hat nicht nur die Gutachterregeln zerschmettert, sondern auch unsere letzte Illusion von der „akademischen Utopie“ zerstört.
Wenn die menschlichen Gutachter in der Flut von 30.000 Artikeln ertrinken, ist es eine historische Notwendigkeit, dass Maschinen und Algorithmen die Macht übernehmen.
Dies ist nicht mehr eine Zeit, in der es darum geht, wer „objektiver“ ist, sondern eine Zeit, in der es darum geht, wer besser im „Spiel“ ist.