Ehemalige Mitarbeiter von Tencent und NetEase haben sich zusammengeschlossen, um die Kosten der KI-Welt, auf die Cai Haoyu setzt, um 80 % zu senken
Kürzlich hat die von Cai Haoyu gegründete KI-Firma Anuttacon eine Studie namens Agentopia veröffentlicht.
Das Forschungs-Team hat mehrere virtuelle Szenarien erstellt und 100 KI-Agenten in diesen Szenarien für ganze 10 Simulationsjahre leben lassen.
In diesen 10 Jahren haben die KI-Agenten Freunde gemacht, Jobs gewechselt, Psychotherapie in Anspruch genommen und andere soziale Verhaltensweisen gezeigt. Die Forscher haben dann die "Lebenserfahrungen" der besten Agenten ausgewählt, um die Rollenspielfähigkeit des Modells zu trainieren.
Das Ziel der Schaffung einer solchen KI-Welt ist natürlich, dass in zukünftigen Spielen NPCs auftauchen können, die intuitiver und natürlicher wirken.
Aber wenn man von der Forschung zum Spiel übergeht, steht eine Realität im Weg: Wie viel kostet es, wenn ein NPC seine Woche plant? Wie viele Token werden benötigt, wenn er seine Erinnerungen jeden Abend zusammenfasst? Kann der Spaß, den der Spieler dabei hat, die Kosten des Modells decken? Und vor allem: Diese Kosten werden mit der Zeit und der Anzahl der Spieler immer höher.
Das ist fast die gleiche Rechnung für alle kommerziellen KI-Spiele. Kürzlich hat aber ein chinesisches KI-Spiel-Team zwei ziemlich beeindruckende Zahlen vorgelegt.
Mitglieder des AutoGame-Teams haben Coreesports mitgeteilt, dass in der neuesten Version ihres Spiels "Maggies Garten" die KI-bezogenen Token-Kosten insgesamt um etwa 80% gesunken sind; bei bestimmten Aufgaben wie der Generierung von Gegenständen und Levels sind die Kosten sogar um bis zu 96% gesunken.
Wenn man von den ersten drei Tagen der New Product Festival (am 12. Juni) bis heute rechnet, also fast einen Monat lang, haben ungefähr 10.000 Spieler das Spiel heruntergeladen und ausprobiert. Und die Kosten für die Big-Model-Services von "Maggies Garten" beliefen sich auf weniger als 200 US-Dollar – das ist vielleicht sogar billiger als die Entwicklung kleinerer Spiele mit Vibe Coding.
Wenn man nach einem chinesischen kommerziellen Spiel sucht, das der Agentopia-These ähnelt, ist "Maggies Garten" ein Kandidat.
Das AutoGame-Team besteht derzeit aus etwa 13 Mitgliedern. Einige von ihnen kommen aus Spielefirmen wie Tencent, NetEase, Gibit und Glacial. Sie haben an Projekten mit Milliardenumsatz beteiligt und haben auch Erfahrung in Algorithmen und KI.
Die Entwicklung von "Maggies Garten" begann Ende 2023. Das Team hat seitdem drei Runden von Finanzierungen abgeschlossen. Nach dem Konzept von Stanford Town ist es wahrscheinlich das früheste, am besten abgeschlossene und am ehesten kommerzialisierbare Produkt in China. Vor kurzem hat das Spiel erstmals an der Steam New Product Festival teilgenommen. Coreesports hat die neueste Version ausprobiert und mit den Teammitgliedern gesprochen, um herauszufinden, wie weit "Maggies Garten", ein Star-Produkt, schon ist.
Ein Regen um sechs Euro
Wenn man die KI vorerst ausschaltet, ist "Maggies Garten" zunächst ein Pixelart-Sandbox-Abenteuerspiel. Die Grundmechanik ähnelt eher "Stardew Valley" oder "RimWorld".
Die Spieler übernehmen die Rolle eines pensionierten Helden und bauen auf dem Oz-Kontinent ein Camp, bebauen Land, sammeln Ressourcen und fertigen Ausrüstung an. Sie können auch in Höhlen und verschiedene Ökosysteme gehen, um zu erforschen und zu kämpfen. Es gibt ein relativ traditionelles Ressourcen-Zirkulations- und Abenteuer-Framework, und es wird auch Mehrspieler-Modus für bis zu vier Spieler unterstützt.
Die KI wird für die Generierung von Charakteren, Aufgaben und Inhalten eingesetzt. Die Spieler können im Gasthaus einen KI-Kumpel rekrutieren, indem sie ihn mit einem Text beschreiben oder ein Foto hochladen. Sie können nicht nur das Aussehen, sondern auch das Charaktereigenschaft, die Beruf und die Hintergrundgeschichte festlegen. Nachdem die Rekrutierung abgeschlossen ist, werden diese Charaktere der Gruppe beitreten, an Kämpfen teilnehmen und auch für die täglichen Arbeiten im Camp eingesetzt werden können.
Im Laufe der Zeit können sie auch neue Aufgaben aufgrund ihrer Hintergrundgeschichte vorschlagen und dann die Aufgabeort, die Handlung und die Gegenstände generieren.
In der offiziellen Präsentation wird eine Bühnen-Gesangs-Handlung basierend auf der Hintergrundgeschichte einer Sängerin generiert.
Diese Fähigkeiten bleiben nicht nur in der Werbung. Schon bei den Tests im vergangenen Jahr konnten die Spieler Charaktere erstellen, sie an Kämpfen und Produktion teilnehmen lassen und nach einer langen Zeit neue Aufgaben und Geschichten auslösen. Jetzt kann das Spiel immer noch auf Steam heruntergeladen werden, damit die Spieler, die es ausprobieren möchten, an den Tests teilnehmen können.
Aber nachdem die KI-Charaktere in die Hände der Spieler geraten sind, hat sich auch das Problem, dem sich das AutoGame-Team gegenübersieht, verändert.
Mit der Zunahme der Spieler haben die Anforderungen an die NPCs auch über die ursprünglichen Grenzen des Teams hinausgegangen. Manche Spieler bitten die NPCs direkt, zu kochen, und andere fragen direkt, wo sich ein bestimmtes Item befindet. In diesem Fall müssen die NPCs nicht nur die Sprache verstehen, sondern auch die Umgebung lesen, ihre eigenen Fähigkeiten beurteilen und eine Antwort in eine konkrete Handlung umsetzen.
Wenn man die Kosten völlig außer Acht lässt, sind diese Probleme nicht unauflösbar. Laut dem Team kann man, indem man mehr Spiel-Daten an das Modell gibt, die umfassendere Umweltwahrnehmung, Handlungsplanung und Pfadfindung freischaltet und ein starkes genug Modell verwendet, immerhin mit genügend Ressourcen das gewünschte Ergebnis erreichen.
Aber in einem kommerziellen Spiel, das auf eine große Anzahl von Benutzern abzielt und langfristig laufen soll, ist diese Methode offensichtlich nicht nachhaltig. Wenn ein NPC mehr Informationen wahrnimmt und mehr Entscheidungen trifft, kann dies zu neuen Modellaufrufen führen. Wenn die Anzahl der Spieler und die Spielzeit zunehmen, können diese scheinbar unbedeutenden Kosten schnell zu einer nicht zu vernachlässigenden Summe anwachsen.
Das AutoGame-Team hat intern ein komplexeres und aufschlussreicheres Design getestet: Wenn es in einer Region lange regnet oder lange nicht regnet, beobachten die NPCs die Wetteränderungen, schätzen, dass der Preis für eine bestimmte Art von Gegenständen steigen könnte und generieren automatisch einen Gegenstand als Waren. Dann suchen sie die Spieler auf und versuchen, ihm die Waren zu verkaufen.
Wetter, Wirtschaft und NPC-Verhalten sind nun miteinander verbunden. Die NPCs treffen Entscheidungen basierend auf dem Zustand der Welt. Dies ist genau die KI-Welt, die viele Menschen sich vorstellen. Logisch gesehen ist dies nicht weit von der Agentopia-Simulation entfernt: Die Charaktere nehmen ständig die Umgebung wahr, treffen Entscheidungen basierend auf ihrer Situation und setzen diese Entscheidungen in konkrete Handlungen um. Der Unterschied besteht darin, dass ein Forschungsprojekt nur beweisen muss, dass ein solches Phänomen auftreten kann, während ein kommerzielles Spiel für jedes Auftreten Kosten aufbringen muss.
Als sie die Kosten näher berechneten, stellten sie fest, dass die Durchführung dieser gesamten Ereigniskette etwa 6 Yuan an Big-Model-Kosten verursachen würde, und dass das Big-Model in diesem Prozess ständig eine große Menge an nutzlosen Informationen erzeugen würde.
Die Spieler würden diese Kosten möglicherweise nicht bereitwillig tragen, also bleibt nur eine Lösung.
Wie die Kosten senken
Für das AutoGame-Team kann die Lösung des Problems offensichtlich nicht darin bestehen, wie in einem Labor, das Budget zu erhöhen und ein stärkeres Modell zu verwenden. In den letzten Monaten haben sie genau das Gegenteil getan: Sie haben die bereits implementierten KI-Funktionen in "Maggies Garten" neu zerlegt und festgestellt, welche Schritte wirklich ein Big-Model erfordern und welche Ergebnisse durch die technische Infrastruktur, die Spielregeln und den Code abgesichert werden können.
Diese Arbeit wurde von vier Mitgliedern etwa vier Monate lang durchgeführt und umfasste die Optimierung des Modells, die Anpassung der Infrastruktur, die Auswahl der Ergebnisse usw. Das Endergebnis sind die beiden Zahlen, die am Anfang erwähnt wurden.
Diese Fähigkeit, die Funktionen zu zerlegen, hängt möglicherweise mit dem Team zusammen, das hauptsächlich aus ehemaligen Angestellten großer Unternehmen besteht. Sie haben auch einen weiteren Blick auf die KI. Anstatt das Big-Model als eine schwarze Kiste zu betrachten, die alle Funktionen übernehmen kann, neigen die Mitglieder des Entwicklerteams eher dazu, die KI als ein Modul im Spielentwicklungsprozess zu betrachten und dann zu entscheiden, welche Probleme das Modell, das Programm und die Spielkonzeption jeweils behandeln sollten.
Obwohl wir nicht wissen können, was sie genau getan haben, hat der Hauptdesigner Kuding uns ein Beispiel gegeben: Die meisten KI-Entwickler werden während der Entwicklung feststellen, dass bestimmte Big-Modelle Vorteile haben, z. B. welches Modell "menschlicher" wirkt und welches besser in der Datenverarbeitung ist. In der Laborphase oder bei der Prototypentwicklung ist es natürlich sinnvoll, diese teureren Modelle auszuwählen.
Aber wenn man die kommerziellen Faktoren berücksichtigt, kann ein gutes Modell möglicherweise aus dem Markt genommen werden, und das Spiel möchte natürlich möglichst wenig von den Änderungen der Modellanbieter abhängig sein. Mit der Weiterentwicklung der Modelle kann die Leistung eines billigen Modells sich ändern. Wenn der Vorteil eines Produkts von dem Modellanbieter stammt, muss das Team möglicherweise ein neues, stärkeres und teureres Modell verwenden, um die ursprüngliche Qualität aufrechtzuerhalten.
Deshalb ist ihre Vorgehensweise eigentlich nicht kompliziert: Sie müssen verstehen, wie ein bestimmter Charakter ausdrücken sollte und welche Rückmeldung die Spieler erwarten. Dann können sie ähnliche Effekte auf einem billigeren Modell durch die Verwendung von Anweisungen, Charakterhintergründen, Regeln und Code realisieren.
Das Team muss nicht die abstrakte "KI-Intelligenz" optimieren, sondern konkrete Probleme im Spiel: Wie sollte ein stiller NPC sprechen? Wie wütend sollte ein Charakter sein, wenn er abgelehnt wird? Welche Informationen muss ein Gegenstand, der aus einer Aufgaben-Erfahrung generiert wird, enthalten, um an der weiteren Spielweise teilnehmen zu können?
Wenn diese Probleme klar genug zerlegt sind, benötigt nicht jede Funktion das stärkste Modell. Dies erfordert, dass das Team nicht nur die Leistungsunterschiede zwischen verschiedenen Modellen kennt, sondern auch die Fähigkeit hat, die Spielererfahrung zu definieren.
Diese Arbeit wird heute noch wichtiger, weil die Funktionen, die die aktuellen KI-Spiele auf dem Markt umsetzen möchten, sehr schnell wachsen.
Frühe Produkte mussten möglicherweise nur einen Text des Spielers an das Modell senden und dann eine Antwort empfangen. Heute ist es jedoch kaum genug, wenn ein Spiel nur freies Chatten ermöglicht, um es als attraktives Produkt zu bewerben. Die meisten Spiele müssen das Modell dazu bringen, die Hintergrundgeschichte des Charakters, die Langzeitgedächtnisse, die Teambeziehungen, den Umgebungsstatus und die aktuelle Aufgabe zu lesen, um die generierten Ergebnisse an das Spielsystem zu übergeben und auszuführen, damit die Charaktere wirklich am Spiel teilnehmen können.
Spiele wie "AI2U" oder "Code: Black Box", über die Coreesports berichtet hat, versuchen, mit KI mehr Funktionen im Spiel zu realisieren.
Da jede zusätzliche Funktion mehr Kontext, längere Ausgaben und mehr Modellaufrufe mit sich bringt, kann die Anzahl der verbrauchten Token für eine vollständige Spielweise auch dann steigen, wenn der Preis pro Token ständig sinkt. Dies erklärt auch das scheinbar widersprüchliche Phänomen: Die Token der Modellanbieter werden immer billiger