Yao Shunyu, die Legende von Tsinghua-Universität, hat Verdienste erbracht. Das neue Gemini hat in einer Nacht die Programmierwelt überrannt. Nur 7 Personen weltweit können es besiegen.
Gerade jetzt hat Google's Gemini 3 Deep Think eine Evolution erfahren! Es belegte Platz 7 weltweit bei der Codeforces-Wettbewerbs und schlug damit menschliche Teilnehmer. Innerhalb von nur drei Monaten hat es die SOTA (State of the Art) in allen Bereichen übertroffen.
Unerwartet hat Google DeepMind in der Nacht wieder eine sensationelle Neuheit vorgestellt!
Heute hat Gemini 3 Deep Think eine bahnbrechende Aktualisierung erhalten und fast alle SOTA-Werte in allen Bereichen überboten, was ein neues Zeitalter für die KI-Schlussfolgerungsfähigkeit einläutet.
Der chinesische Wissenschaftler Yao Shunyu, der von Anthropic zu Google gewechselt ist, war an der Entwicklung von Gemini 3 Deep Think beteiligt.
Diesmal ist Deep Think in den Bereichen Wissenschaftsforschung und anspruchsvoller Ingenieurarbeit ein echtes "Superhirn".
Es kann Skizzen in hochauflösende und praktische 3D-Zeichnungen eines Laptop-Ständers umwandeln und diese direkt drucken lassen.
Der Google-VP hat dieses Nebenprojekt gezeigt, und das fertige Produkt sieht so aus.
Wie stark ist eigentlich die neue Version von Deep Think?
In der Programmierwelt hat es eine erstaunliche Elo-Punktzahl von 3455 erreicht, was der Weltmeisterschaftsniveau entspricht, und es hat sich in die Top 10 der menschlichen Teilnehmer bei der Codeforces-Wettbewerbs geschafft!
Das heißt, nur sieben Personen weltweit haben Gemini 3 Deep Think geschlagen. Vor einem Jahr erreichte der stärkste o3 nur 2727 Elo.
Bei der "Human Last Exam" (HLE) hat Gemini 3 Deep Think die SOTA-Werte verbessert und eine Leistung von 48,4 % erreicht.
Sogar den schwierigsten ARC-AGI-2-Benchmark hat es binnen einer Nacht gesättigt und mit 84,6 % als neue SOTA weit vorne gelaufen.
Im Vergleich zu Gemini 3 Pro hat Deep Think in allen Bereichen überholt und Claude Opus 4.6 und GTP-5.2 hinter sich gelassen.
Noch beeindruckender ist die praktische Leistung von Gemini 3 Deep Think.
Die Mathematikerin Lisa Carbone von der Rutgers University ließ es bei ihrer Forschung einen hochschwierigen physikalisch-mathematischen Artikel begutachten.
Das Ergebnis war, dass Deep Think eine feine logische Lücke entdeckte, die selbst die menschlichen Gutachter übersehen hatten.
Diese epische Evolution von Gemini 3 Deep Think lässt wieder einige Menschen schlaflos liegen.
Derzeit können Abonnenten von Google AI Ultra die neue Version von Deep Think in Gemini testen. Gleichzeitig wird es erstmals über die API für einige Forscher, Ingenieure und Unternehmen freigegeben.
Leistung übertrifft SOTA, Goldmedaille in Olympiaden
Letztes Jahr hat die spezielle Version von Deep Think die schwierigsten Aufgaben im Bereich der Schlussfolgerung erfolgreich gelöst und Goldmedaillen bei den Weltmeisterschaften in Mathematik und Programmierung gewonnen.
Gerade gestern hat Google DeepMind eine Vorstellung gemacht.
Der "KI-Mathematiker" Aletheia, der auf der ersten Version von Deep Think basiert, kann unabhängig Artikel schreiben und hat mehrere Probleme in der "Erdős-Vermutung" bewiesen.
Darüber hinaus hat Deep Think eine zehnjährige Vermutung widerlegt und 18 Forschungsschwierigkeiten überwunden.
Jetzt hat die aktualisierte Version von Deep Think in mehreren anspruchsvollen Benchmark-Tests die SOTA-Werte verbessert:
- Human Last Exam (HLE): Es hat einen neuen Standard gesetzt und eine Genauigkeit von 48,4 % ohne Verwendung von Werkzeugen erreicht;
- ARC-AGI-2: Es hat eine beispiellose Leistung von 84,6 % erreicht und wurde von der ARC Awards Foundation verifiziert;
- Algorithmenwettbewerbsplattform Codeforces: Es hat eine Elo-Punktzahl von erstaunlichen 3455 Punkten erreicht;
- IMO 2025: Es hat das Niveau einer Goldmedaille erreicht.
Außer in Mathematik und Algorithmenwettbewerben zeigt Gemini 3 Deep Think jetzt auch in breiten wissenschaftlichen Bereichen wie Chemie und Physik hervorragende Leistungen.
Bei den schriftlichen Teilen der Internationalen Physik-Olympiade und der Internationalen Chemie-Olympiade 2025 hat die neue Version von Deep Think ebenfalls die Leistung für eine Goldmedaille.
Darüber hinaus ist es auch in der fortschrittlichen theoretischen Physik sehr kompetent und hat bei dem CMT-Benchmark-Test eine Leistung von 50,5 % erreicht.
Außerdem hat Gemini 3 Deep Think bei ARC-AGI-1 die maximale Leistung erreicht.
Bei der offiziellen Demonstration kann Gemini 3 Deep Think basierend auf einem Artikel ein Visualisierungskonzept für die Architektur eines "Spatio-Temporal Cyclic Video Transformer" erstellen.