首页文章详情

Weltweit exklusive Ersttestung von Genie 3: Die Details des Labors werden preisgegeben und sind überwältigend. Das letzte Puzzlestück der AGI ist erreicht.

新智元2025-08-06 18:11
Wie wurde Genie 3 von Google DeepMind entwickelt? Dieser Moderator hat sich in das Innere des Labors verirrt und erstmals weltweit Genie 3 getestet, dabei zahlreiche verblüffende Details aufgedeckt. Gleichzeitig enthüllten die Notizen eines ehemaligen Google-Forschers auch die ersten Eindrücke bei der Nutzung. Er sagte direkt: "Es ist atemberaubend! Genie 3 lässt mich das Ende der nächsten fünf Jahre des Spiels erkennen!"

Letzte Nacht hat der „Dritte Weltkrieg“ endgültig begonnen.

Vor der Veröffentlichung von GPT-5 sind drei führende Modellhersteller in Aktion getreten. Der 5. August 2025 wird vermutlich als ein historischer Tag in der Geschichte der Künstlichen Intelligenz eingehen.

Im Herd der Aktion hat Google DeepMind mit seinem Weltmodell Genie 3 eine wahre Bombe geworfen, das die neueste Spitze der Weltmodelle repräsentiert.

Man kann sagen, dass der Sprung von statischen Videos zu interaktiven Welten einen Wendepunkt in der Entwicklung von Weltmodellen und AGI markiert.

Man muss bedenken, dass Genie 2 vor einem Jahr noch so aussah, und nur ein Jahr später hat Genie 3 sich in das auf der rechten Seite gezeigte gewandelt...

Man muss wissen, dass Genie 2 nicht in Echtzeit arbeitet und man noch einige Sekunden warten muss, während Genie 3 vollkommen Echtzeit-fähig ist.

Außerdem kann Genie etwa 10 Sekunden lang generieren, Genie 2 kann 20 Sekunden unterstützen, und Genie 3 kann sogar interaktive Umgebungen über mehrere Minuten hinweg simulieren.

Man kann sagen, dass Genie 3 alles verändert hat.

Ein Youtuber besuchte vorab das Londoner Hauptquartier von Google DeepMind und führte die weltweit exklusive Ersttestung von Genie 3 durch. In seinem 30-minütigen Video enthüllte er noch mehr spektakuläre Details.

Ersttest eines ehemaligen Google-Mitarbeiters: Es wird die Spielebranche für immer verändern!

Ohne vorherige Erstellung von 3D-Modellen kann Genie 3 auf der Grundlage von Textbeschreibungen mehrere Minuten lange konsistente Videos in 720p-Auflösung generieren.

Die Funktion der „hinweisbaren Weltereignisse“ ist noch spektakulärer. Mit einfachen Textbefehlen können neue Objekte hinzugefügt und Charaktere generiert werden, was völlig neue Möglichkeiten für das Training von KI-Agenten eröffnet.

Gerade jetzt hat der ehemalige Google DeepMind-Mitarbeiter Tejas Kulkarni seine ersten Erfahrungen mit Genie 3 geteilt.

Nachfolgend ist seine exklusive Test-Demo.

Seine Einschätzung lässt sich in vier Worten zusammenfassen: „Unglaublich!“

Zusammenfassend ist dies das erste neurale Spiele-Engine oder Weltmodell, das er ausprobiert hat, das so gut funktioniert und eine langfristige Weltskonsistenz aufweist.

Er glaubt, dass die Entstehung von Genie 3 die Spielebranche grundlegend verändern wird. Man kann sagen, dass es das letzte Puzzlestück vor der vollständigen Realisierung von AGI ist.

In vielerlei Hinsicht ist es eher wie eine ASI als wie eine AGI. Da die Wiedergabetreue und die Generalisierungsfähigkeit bereits menschliche Level erreicht haben und bald den Menschen übertreffen werden, kann es mit 3D-Künstlicher Intelligenz und LLMs kombiniert werden und die 3A-Spiele grundlegend verändern.

Laut dem ehemaligen Mitarbeiter lassen sich die Stärken von Genie 3 wie folgt zusammenfassen.

Wirklich universell, mit schneller Startzeit und anwendbar auf andere industrielle und reale Szenarien.

Es lernt physikalische Zusammenhänge. Ohne eine zugrunde liegende Engine lernt es Spiele-Engine- und nicht-starre Physik. Es ist besonders effektiv für stilisierte Umgebungen, in denen Charaktere laufen.

Es ist viel interessanter als herkömmliche Videomodelle.

Realistische Rundgänge und hervorragende Drohnenaufnahmen.

Das globale Beleuchtungs- und Lichtdesign ist ausgezeichnet.

Die visuelle Gedächtnisleistung ist sehr stark.

Natürlich gibt es auch noch einige ungelöste Probleme.

Die Physik ist schwierig. (Beim Versuch des klassischen intuitiven Physik-Experiments mit einem Turm aus Bausteinen ist es gescheitert.)

Soziale Interaktionen und Multi-Agenten-Interaktionen sind schwierig. 1vs1-Kampfspiele funktionieren nicht.

Die Befolgung von langfristigen Anweisungen und einfache kombinierte Spiellogiken scheitern (z.B. das Sammeln von Punkten/Schlüsseln, das Gehen zur Tür und das Entsperren etc.).

Der Handlungsraum ist begrenzt.

Es ist noch lange keine echte Spiele-Engine, aber es lässt uns einen Blick in die Zukunft werfen.

Außerdem hat Kulkarni besonders auf die von der offiziellen Seite genannte Stärke von Genie 3 hingewiesen - die Gedächtnisfunktion.

Selbst nach 20 - 30 Sekunden bleibt ein gesehenes Objekt unverändert.

Entlarvung der Entstehung von Genie 3: Weltweite exklusive Ersttestung, die Labordetails sind überwältigend

Sofort nach der Veröffentlichung von Genie 3 hat der Youtuber „Machine Learning Street Talk“ ein Interviewvideo mit dem hintergründigen Team herausgebracht.

Sie haben den Laborbetrieb vor Ort untersucht und die Entstehung von Genie 3 enthüllt.

Während des Interviews rief der Moderator ständig aus: „Dies ist die beeindruckendste Technologie, die ich je gesehen habe!“

Nachdem er Genie 3 im Londoner Hauptquartier von Google DeepMind getestet hat, sagte er: „Diese Technologie wird die nächste Billionen-Dollar-Branche werden und möglicherweise sogar ein Killer-Use-Case für VR sein.“

Die Gäste in dieser Sendung sind die Macher hinter Genie 3 - die beiden Google DeepMind-Forscher Shlomi Fuchter und Jack Parker Holder.

Interessanterweise waren sie diesmal bei den technischen Schlüsseldetails der Genie 3-Architektur sehr verschwiegen, im Gegensatz zu früheren Interviews.

Der Moderator kommentierte: „Das ist verständlich, schließlich jagt Zuckerberg wie ein Trüffelschwein herum. Aber ich rate ihm, das aufzugeben, denn diese Forscher machen eine ‚göttliche Arbeit‘. Wenn er es wirklich will, soll er es selber machen.“ (mit Augenzwinkern)

Weltweite exklusive Ersttestung

Man kann sagen, dass die Konsistenz einer der beeindruckendsten Aspekte von Genie 3 ist.

Die von ihm geschaffene Welt hat ein zuverlässiges Gedächtnis. Wenn man den Blick von einem Objekt wegwendet und dann wieder darauf schaut, ist es immer noch dort.

Überraschenderweise erklärten die beiden Forscher, dass diese Konsistenz nicht explizit programmiert wurde, sondern eine überraschende „spontane“ Fähigkeit eines starken KI-Modells ist.

Außerdem stellt es einen riesigen Sprung dar. Genie 2 war bereits ein großer Fortschritt, aber seine Geschwindigkeit war nicht ausreichend für Echtzeit-Interaktionen und die Auflösung war viel geringer.

Im Gegensatz dazu bietet Genie 3 eine Auflösung von 720p, Interaktivität und fotorealistische Qualität und kann mehrere Minuten lang reibungslos laufen.

Außerdem ist Genie 3 ein Killer-Use-Case für das Training von Robotern.

Das Team glaubt, dass Genie 3 das Training von KI grundlegend verändern wird. Anstatt Autos oder Roboter in der realen Welt zu trainieren (was langsam und gefährlich ist), können unendliche Simulationsumgebungen erstellt werden.

Man kann sogar seltene Ereignisse auslösen, wie z.B. ein Hirsch, der die Straße überquert, um der KI zu beibringen, wie man mit plötzlichen Situationen sicher umgeht.

Genie 3 unterscheidet sich von herkömmlichen Spiele-Engines oder Simulatoren und ist auch kein klassisches Video-Generierungsmodell, aber es vereint die Eigenschaften aller drei.

Im Wesentlichen ist es ein interaktives Weltmodell und ein Videogenerator.

Dies ist ein großer technologischer Schritt vorwärts. Man muss bedenken, dass in der Earthquake-Engine von 1996 die Physik, Regeln und Interaktionen explizit programmiert werden mussten.