Der Vater von AlphaGo: KI in der künstlichen Gesellschaft der letzten 23 Jahre

Von Atari bis AlphaGo, von AlphaStar bis SIMA: DeepMind hat bereits seit über zehn Jahren mit Spielen an künstlicher Intelligenz geforscht. Bei jedem Wechsel des Schlachtfelds steigt die Komplexität der zu untersuchenden Probleme um eine Stufe. Diesmal ist das Schlachtfeld EVE Online: ein lebendiges Universum, das seit 23 Jahren existiert und nie zurückgesetzt wurde.

Der CEO von DeepMind und der Vater von AlphaGo, Demis Hassabis, hat bereits über zehn Jahre lang mit Spielen an künstlicher Intelligenz (KI) geforscht.

Diesmal hat er die KI in ein 23 Jahre altes "lebendiges Universum" geworfen: das Weltraum-MMORPG EVE Online, ein Spiel, dessen Einführungssequenz schon Neulinge abschrecken kann.

Ein Schachspiel hat ein Ende, EVE nicht.

Anfang Mai kündigte DeepMind eine Forschungs Kooperation mit EVE Online an. Der Grund ist einfach: Das komplexe und von Spielern getriebene Universum von EVE ist ein perfekter sicherer Sandkasten, um die Gedächtnisleistung, kontinuierliches Lernen und langfristige Planung von KI zu testen.

Die Zusammenarbeit zwischen DeepMind und EVE Online zielt nicht auf ein interessantes Spielerlebnis oder die Verbesserung des Spielmechanismus ab, sondern auf das Lösen von drei der schwierigsten Probleme in der aktuellen Forschung zu KI-Agenten. Hassabis setzt auf ein 23 Jahre altes Spiel.

Fenris Creations (ehemals CCP Games) kündigt die Zusammenarbeit mit DeepMind an

Das Unternehmen hinter EVE Online kündigte am 6. Mai am selben Tag vier Dinge an:

Die Wiedervereinigung als unabhängiges Unternehmen aus dem Mutterunternehmen Pearl Abyss;
Die Umbenennung in Fenris Creations;
Der Abschluss eines 120-Millionen-Dollar-Handels;
Google erwarb als Teil dieser Unabhängigkeit einen Minoritätseigentum an Fenris Creations und startete gleichzeitig eine Forschungs Kooperation mit Google DeepMind.

Der CEO von Fenris Creations, Hilmar Veigar Pétursson, erklärte in einer Ankündigung:

Diese Umstellung beinhaltet keine Entlassungen oder Umstrukturierungen. Das Team, die Produkte und die Entwicklungspläne bleiben unverändert. EVE geht weiter.

Aus betrieblicher Sicht kommt dieses Unternehmen mit "echten Munitionen" an die Verhandlungstafel, nicht um Vermögenswerte zu verkaufen, um am Leben zu bleiben.

EVE Online erzielte 2025 einen Umsatz von über 70 Millionen US-Dollar. Im November 2025 wurde ein Rekordumsatz erzielt, und das vierte Quartal war das zweitbestverkaufte Quartal in den 20 Jahren Geschichte des Spiels.

Die Unabhängigkeit von Fenris Creations bedeutet, dass EVE nun ein Mutterunternehmen hat, das eigenständig über Forschungs Kooperationen entscheiden kann, und nicht mehr an die strategischen Ziele eines größeren Spieleverlegers gebunden ist.

Die Verpackung eines Brettspiels von Fenris aus dem Jahr 1997. Der Name "Fenris" ist sechs Jahre älter als EVE Online. Die Umbenennung in Fenris Creations ist eher eine Rückkehr als eine Neuanfang.

Warum hat DeepMind EVE ausgewählt?

23 Jahre "künstliche Gesellschaft"

KI-Benchmarks sind schwer zu reproduzieren

Viele Menschen denken bei "Spiele + KI-Forschung" sofort an AlphaGo oder AlphaStar. EVE ist jedoch anders.

Schach und StarCraft haben eine gemeinsame Eigenschaft: Ein Spiel hat einen Anfang, ein Ende und klare Sieges- und Niederlagenregeln.

Das Ziel von AlphaGo ist es, ein Schachspiel zu gewinnen, und das Ziel von AlphaStar ist es, ein StarCraft-Match zu gewinnen. Beide sind Beispiele für die Forschungsparameter von "Einzelspiel-Intelligenz", aber EVE hat kein Ende.

EVE Online ist bekannt für sein "einheitliches geteiltes Universum" (single-shard / single shared universe). Viele Spieler konkurrieren, handeln, bilden Allianzen und führen Kriege in derselben dauerhaften Welt.

Die Spieler haben hier ein echtes Wirtschaftssystem, politische Allianzen, militärische Gruppen, Handelsrouten, historische Fehden und jahrelange Kriegspläne aufgebaut.

Manche Schlachten dauern von der Planung bis zum Ende ein ganzes Jahr. Die Entstehung und der Untergang mancher Allianzen werden von späteren Spielern als echte Geschichte studiert.

Hilmar sagte in der Ankündigung: "EVE ist einer der wenigen Orte, an denen man intelligente Probleme in einer Umgebung erforschen kann, die wie die reale Welt funktioniert."

Hassabis sagte, dass er seit seiner Kindheit Spiele spielt und seine Karriere mit der Entwicklung von KI-Simulationsspielen begann. Die Forschungen zu AlphaGo, AlphaStar und SIMA waren alle eng mit Spielen verbunden, und EVE ist die Wahl für die nächste Phase:

Ich freue mich sehr, mit Fenris Creations zusammenzuarbeiten, um in diesem von Spielern geschaffenen, unübertroffenen komplexen Universum neue Spielerelebnisse sicher zu erkunden und die KI-Forschung voranzutreiben.

Die meisten KI-Benchmarks sind wie ein Gesundheitstest, während EVE eher wie das Eintauchen einer KI in eine 23 Jahre alte "künstliche Gesellschaft" ist.

Die drei härtesten Nüsse in der KI-Agenten-Forschung

Genau das, was EVE-Spieler täglich tun

Bei dieser Kooperation wurden offiziell drei Forschungsrichtungen festgelegt: Langfristige Planung (long-horizon planning), Gedächtnis (memory) und kontinuierliches Lernen (continual learning).

Diese drei Bereiche gelten als die schwierigsten Probleme in der aktuellen Forschung zu KI-Agenten.

Wenn Sie jemanden kennen, der schon über zehn Jahre EVE Online spielt, lassen Sie ihn sein Benutzerkonto öffnen und schauen Sie sich seine Freundesliste an. Sie werden wahrscheinlich Dutzende von Gruppen und Hunderte von Namen sehen, und in den Notizfeldern steht etwas wie "Schulden aus der Delve-Schlacht 2018", "Verräter in der Goonswarm-Allianz, keine Zusammenarbeit", "Dieser Typ ist ein Spion, das weiß die ganze Organisation".

Dies ist kein Kontextfenster, sondern ein langfristiges Gedächtnis, das über Jahre hinweg akkumuliert wurde.

EVE-Spieler bestehen jeden Tag die Prüfung des Gedächtnisses, und dasselbe gilt für das kontinuierliche Lernen.

Im Januar 2014 dauerte die Schlacht von B-R5RB etwa 21 Stunden. Über 7.500 Charaktere nahmen teil, 75 Titanen wurden zerstört, und die Verluste beliefen sich auf etwa 300.000 US-Dollar in realen Werten. Der Auslöser für diese Schlacht war die fehlende automatische Zahlung einer Souveränitätsrechnung.

Nach dieser Schlacht wurden alle Flottentaktiken im Spiel neu geschrieben. Die Flottenkonfigurationen und Taktiksysteme der Allianzen wurden in den folgenden Jahren anhand der Schlachtanalyse weiterentwickelt. Monatlich wurden Änderungen vorgenommen, und jede Niederlage wurde in ausführbare Strategien umgewandelt.

Was die langfristige Planung betrifft, so ist die Standardzeitspanne für Allianzkriege in EVE nicht Stunden, sondern Monate. Von der Planung bis zum Beginn eines interstellaren Krieges, bei dem Schiffbau, Transport, Diplomatie, Spionage und Gegenspionage involviert sind, arbeiten hunderte von Spielern ohne jegliche Aufgabe spontan zusammen, um ein gemeinsames Ziel über Monate hinweg zu verfolgen.

Dieses Kooperationssystem hat sich in 23 Jahren von den Spielern selbst entwickelt.

Die drei schwierigsten Probleme in der aktuellen Bewertung von KI-Agenten sind genau das, was EVE-Spieler täglich tun.

Die 23-jährige Entwicklung in EVE, die von den Spielern getrieben wird, hat eine ständig sich ändernde, komplexe Umgebung geschaffen, die keine Abkürzungen bietet. Diese Komplexität kann nicht in einem Labor synthetisiert werden.

Das SIMA 2, das DeepMind im November 2025 veröffentlichte, hat sich von der "Befehlsausführung" zu "Zielverstehen, Prozessableitung und Lernen während des Spiels" entwickelt.

Betrachtet man die Forschungsfragen, so gehört das EVE-Projekt wie SIMA 2 der Linie "Spiele als Trainingsumgebung für KI-Agenten" an. Der Unterschied ist, dass diesmal die Trainingsumgebung ein 23 Jahre lang kontinuierlich funktionierendes echtes Universum ist.

Ein Bild einer Schlacht in EVE Online. Diese von Spielern spontan organisierten, oft mehrere Stunden dauernden großen Schlachten sind der Hauptgrund, warum DeepMind EVE als Forschungsumgebung für langfristige Planung und kontinuierliches Lernen ausgewählt hat.

DeepMind arbeitet in einem Offline-Sandkasten

Nicht im Spieleruniversum

Die Art der Zusammenarbeit zwischen DeepMind und Fenris ist konservativer als erwartet. DeepMind hat keine direkte Zugangsberechtigung zum aktiven Spieler-Server.

DeepMind erklärte in einer Ankündigung: Die erste Phase der Forschung wird in einer Offline-Version von EVE Online durchgeführt. Es werden lokale Server verwendet, um Modelle in einer kontrollierten Umgebung zu testen und zu bewerten. Es besteht keine Verbindung zum offiziellen Betriebsserver von EVE Online.

Einerseits bedeutet die Offline-Version, dass DeepMind keine Daten aus den Spielen der aktiven Spieler verwendet und die Wirtschaft des echten Servers nicht stört. Dies vermeidet alle Komplikationen in Bezug auf Datenschutz und Compliance.

Andererseits behält die Offline-Version von EVE das komplexe Regelsystem, die Schiff- und Wirtschaftssysteme, die Sternenraumstruktur und andere Kernaspekte des Spiels bei.

DeepMind erhält eine "23 Jahre von Spielern getestete" komplexe Welt als Prüfumgebung, in der der KI-Agent überleben muss.

Von Atari zu EVE

Wohin führt dieser Weg?

Wenn man sich die Trainingsumgebungen von DeepMind in den letzten zehn Jahren anschaut, kann man eine klare Entwicklungslinie erkennen.

Von 2013 bis 2015 war Atari der Ausgangspunkt. DQN brachte den KI-Agenten in Spiele wie "Breakout" und "Space Invaders", die klare Level und geschlossene Regeln haben. Die Prüfung betraf Reaktion und Wertschätzung.

Von 2016 bis 2017 kamen AlphaGo und AlphaZero. Das Schach hat regelmäßige Regeln und einen großen, aber geschlossenen Aktionsraum. Die Prüfung betraf die Suche und die langfristige logische Schlussfolgerung.

2019 ging AlphaStar in "StarCraft II". Dies war das erste Mal, dass ein KI-Agent in eine Echtzeitumgebung mit unvollständigen Informationen und mehrfachen Spielen kam. Die Prüfung betraf die Echtzeitentscheidung bei teilweiser Beobachtbarkeit.

2024 wollte SIMA einen universellen KI-Agenten für mehrere Spiele entwickeln. Die Prüfung betraf die Übertragbarkeit und Generalisierung.

2025 wurde SIMA 2 verbessert: Es kann nicht nur Befehle ausführen, sondern auch mit Benutzern kommunizieren, Ziele ableiten und sich während des Spiels verbessern.

Das SIMA 2, das DeepMind 2025 veröffentlichte, hat sich von der "Befehlsausführung" zu "Zielverstehen, Prozessableitung und Lernen während des Spiels" entwickelt.

Jede neue Trainingsumgebung hat mehr "Eigenschaften der realen Welt" als die vorherige: von geschlossenen Regeln zu offenen Regeln, von vollständigen Informationen zu unvollständigen Informationen, von Einzelspielkonfrontationen zu Übertragbarkeit über mehrere Spiele hinweg.

Die meisten dieser Umgebungen waren jedoch immer noch relativ geschlossen, teilbar und wiederholbar zu bewerten. Beispielsweise sind Atari-Spiele Arcade-Spiele mit festen Regeln, AlphaStar spielt einzelne StarCraft-Matches, und SIMA testet die Übertragbarkeit zwischen mehreren 3D-Virtualen Umgebungen.

Der Unterschied bei EVE ist, dass es eine langfristig funktionierende, von Spielern getriebene Welt ist, in der die Wirtschaft und die politische Struktur ständig evolvieren.

Es hat sich in 23 Jahren von einer Gruppe echter Spieler in einer Welt mit offenen Regeln spontan entwickelt: ein vollständiges von Spielern getriebenes Wirtschaftssystem (die Preisschwankungen von ISK sind vergleichbar mit denen des realen Finanzmarktes), eine interallianzielle politische Struktur (Diplomatie, Spionage, Waffenstillstandsabkommen) und eine gesamte Kriegsökologie, von kleinen Konflikten bis zu 21-stündigen Schlachten.

Es wird immer klarer, dass die Bewertung von KI-Agenten in Einzeltasks nicht mehr viel Neues zu bieten hat. Langfristiges Gedächtnis, langfristige Planung und Lernen aus Fehlern haben jedoch keine angemessenen Bewertungsumgebungen.

Deshalb hat DeepMind diese Entscheidung getroffen: Anstatt eine synthetische Umgebung zu schaffen, geht es in eine "künstliche Gesellschaft", die von menschlichen Spielern 23 Jahre lang getestet wurde.

Aber es ergibt sich auch eine größere Frage:

Was fehlt einem KI-Agenten, der in EVE dauerhaft existieren, lernen und planen kann, um in der realen Welt autonom zu funktionieren?

Quellen:

https://x.com/GoogleDeep

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Der Vater von AlphaGo wirft KI in die künstliche Gesellschaft der letzten 23 Jahre: Alle drei härtesten Nüsse der Agenten befinden sich hier.