StartseiteArtikel

MiHoYo hat in einer Nacht 2 Millionen Yuan an Token verbrannt. Auch Führungskräfte großer Unternehmen beginnen zu zweifeln: Mit dem Verbrennen von Token lässt sich kein Wert schaffen, aber wen macht es reich?

AI前线2026-05-26 18:23
Endlich hat sich ein High-Level-Manager gemeldet und mit seinen eigenen praktischen Erfahrungen direkt die Kostenfrage von Tokenmaxxing in Frage gestellt.

Endlich hat sich ein High-Level-Manager herausgetan und mit seinen eigenen praktischen Erfahrungen direkt die Kosten von Tokenmaxxing in Frage gestellt.

Andrew Macdonald, der Leiter des Betriebs bei Uber, hat in einem kürzlichen Interview direkt angegeben, dass es innerhalb des Unternehmens immer schwieriger wird, die Kosten für AI-Tokenmaxxing als gerechtfertigt zu begründen.

Zuvor hatte Praveen Neppalli Naga, der Cheftechniker von Uber, im April enthüllt, dass Uber bereits das Budget für Claude Code für das Jahr 2026 vorzeitig aufgebraucht hatte. Diese Äußerung löste anschließend heftige Diskussionen im Internet aus. Macdonald beschrieb, dass er sich in diesem Moment wie „ein Kopfexplosion“ fühlte. Innerhalb des Unternehmens begann auch eine Diskussion über den Tokenverbrauch und die daraus resultierenden Abwägungen, wie beispielsweise ob dies die Anzahl der Mitarbeiter beeinflussen würde.

Aus den Gesprächen mit der hochrangigen Ingenieurleitung von Uber erkannte Macdonald, dass eine höhere Token-Nutzung nicht in einem gleichen Verhältnis in nützliche Verbraucherfunktionen umgesetzt wurde.

„Der Zusammenhang ist noch nicht hergestellt, oder?“, sagte er. „Ich denke, dass vielleicht auf impliziter Ebene tatsächlich mehr geleistet wird, aber es ist schwierig, eine klare Linie zwischen diesen Daten und der Aussage ‚Okay, jetzt haben wir tatsächlich 25 % mehr nützliche Verbraucherfunktionen produziert‘ zu ziehen.“

Macdonald sagte, dass es aufgrund des fehlenden direkten Zusammenhangs noch schwieriger ist, die Abwägungskosten, die durch die AI entstehen, zu rechtfertigen. Es ist zu beachten, dass der CEO von Uber, Dara Khosrowshahi, in einer Einnahmetelefonkonferenz Anfang dieses Monats angegeben hat, dass das Unternehmen die Einstellungen verlangsamt, um die AI-Investitionen auszugleichen.

Macdonald fügte hinzu, dass, wenn man nur „ein Benutzer ist, der da sitzt und sich verschiedene interessante Anwendungsfälle ausdenkt“ und nicht selbst bezahlen muss, die AI tatsächlich wie kostenlos erscheine. Letztendlich muss die Firma die Rechnung begleichen.

Tokenmaxxing? Fragen Sie sich zuerst, ob Sie das Geld haben 

Für große Unternehmen ist es schon sehr kostspielig, wenn man keine „Tokenmaxxing“ anwendet und einfach nur eine gewöhnliche Testung vornimmt.

Am 20. Mai hat Zheng Yinhe, der Leiter des AI-NPC & Gameplay-Teams der Serie „Honkai“, auf dem Alibaba Cloud Summit 2026 versehentlich die Kosten für interne Agent-Experimente enthüllt: Ein Mitarbeiter hat für ein Projekt mehrere Dutzend Agenten eingerichtet, die zusammen arbeiteten, und am Ende hat er in einer Nacht Token im Wert von 2 Millionen Yuan verbraucht.

„Wir akzeptieren, dass es Kosten und Lernkurven beim Erkunden der AI gibt. Dies hilft uns auch, unsere Agent-Plattform zu verbessern.“ Trotzdem hat ein Internetnutzer darauf hingewiesen, dass der Wert von diesen 2 Millionen Yuan scheinbar nicht deutlich sichtbar geworden ist.

Und nicht jedes Unternehmen kann sich diese „Großzügigkeit“ leisten. Ein Internetnutzer hat ironisch kommentiert: „Ein Kauf von 648 Yuan bringt nur etwas mehr als eine halbe Goldwährung. Zwei Millionen Yuan sind nur der Betrag, den drei Spieler mit maximaler Investition von 65 Yuan pro Laden in einem Spiel ausgeben.“

Es ist bemerkenswert, dass Liu Wei, Mitbegründer von Mihoyo, auf einer externen Veranstaltung am 15. Mai angegeben hat, dass das Unternehmen in den nächsten drei Jahren bis zu 100 Milliarden Yuan in die AI-Branche investieren wird. Er gestand: „Selbst wenn es am Ende nicht erfolgreich ist und wir es nicht hinbekommen, akzeptieren wir es einfach. Es ist wie ein großer Feuerwerksschein.“

„Wir, ein Unternehmen mit dem Slogan ‚All in AI‘, haben nach einem Tag, an dem wir 100.000 Yuan an Token verbraucht haben, die API für alle gesperrt.“ Ein Internetnutzer hat dies kommentiert.

Einige Unternehmen beginnen mit Anpassungen 

Während die großen Technologieunternehmen noch stark das sogenannte „Tokenmaxxing“ vorantreiben, beginnen einige Unternehmen sich in die entgegengesetzte Richtung zu bewegen.

Beispielsweise hat Duolingo früher beschlossen, die AI-Nutzung in die Leistungsbewertung aufzunehmen. Aber nachdem die Mitarbeiter gefragt haben, „ob sie die AI nur verwenden müssen, um sie zu verwenden“, hat das Unternehmen diese Vorgehensweise zurückgenommen.

Der CEO von Duolingo, Luis von Ahn, hat in einem Podcast-Interview im April gesagt:

„Duolingo hat tatsächlich die AI-Nutzung in die Leistungsbewertung aufgenommen, aber später haben wir es abgeschafft. Ich habe eine interne Notiz an das Unternehmen geschickt, in der ich sagte, dass die Leistungsbewertung die AI-Nutzung enthalten würde. Dann habe ich festgestellt, dass die Mitarbeiter sich fragten: ‚Müssen wir die AI nur wegen der AI verwenden?‘. Am Ende haben wir diese Forderung zurückgenommen, denn die wichtigste Sache bei der Leistungsbewertung ist es, die eigene Arbeit so gut wie möglich zu erledigen. Die AI kann oft helfen, aber es ist nicht notwendig, sie zwangsläufig zu verwenden. Wir möchten nicht, dass die Leute um der Form willen die tatsächlichen Arbeitsergebnisse vernachlässigen. In einigen Situationen ist die AI einfach nicht geeignet.“

Es gibt auch Unternehmen wie Shopify, die versuchen, den unkontrollierten Tokenverbrauch einzudämmen.

Shopify ist eines der ersten Unternehmen, das eine Token-Rangliste eingeführt hat. Der Leiter der Ingenieurabteilung, Farhan Thawar, hat gesagt, dass das Unternehmen diejenigen loben würde, die am meisten Token verbrauchen, da sie möglicherweise mit der AI wertvolle Arbeit leisten. Beispielsweise könnte ein Entwickler, der im Laufe eines Monats 1.000 Dollar an Cursor ausgibt, hinter den Kulissen ein Team von Agenten aufgebaut haben.

Aber Shopify hat die „Token-Rangliste“ in „Nutzungsdashboard“ umbenannt. Der Grund ist, dass das Unternehmen nicht möchte, dass die Mitarbeiter um die Spitzenplätze konkurrieren. Der Tokenverbrauch wird weiterhin auf der internen Profilseite und im Nutzungsdashboard angezeigt, aber der Schwerpunkt verschiebt sich von der „Rangfolge“ hin zur „Verständnis der Nutzung“.

Shopify hat auch eine „Sicherungseinrichtung“ eingerichtet. Wenn die persönlichen Ausgaben eines Mitarbeiters plötzlich in einem Tag stark ansteigen, kann das Unternehmen sofort den Zugang sperren. Wenn diese Zunahme beabsichtigt war oder tatsächlich ein Agent außer Kontrolle geraten ist, kann der Mitarbeiter eine Wiederherstellung beantragen.

Farhan hat gesagt, dass diese Mechanismen nicht nur helfen, Agenten, die außer Kontrolle geraten sind, zu entdecken, sondern auch Fehler in der Infrastruktur aufdecken. Wichtig ist auch, dass Shopify darauf achtet, was diejenigen tun, die viele Token verbrauchen. Mitarbeiter mit hohen Ausgaben werden nach den genauen Anwendungsfällen gefragt. Wenn jemand einfach nur Token sammelt, wird er wahrscheinlich in diesem Prozess aufgedeckt.

Farhan hat auch einen noch wertvolleren Aspekt aufgezeigt: Anstatt nur zu schauen, „wer am meisten Geld ausgibt“, sollte man eher schauen, „welche Token am teuersten sind“. Hinter einigen teuren Token stecken oft tiefgreifendere und komplexere Entwicklungsarbeiten, was für die Beurteilung wertvoller ist als eine einfache Gesamtmenge.

Die Sieger in der Tokenmaxxing-Welle 

Das Wesen von Tokenmaxxing besteht darin, die interne AI-Nutzung in Unternehmen von der „nötigen Nutzung“ zur „ermutigten Konsumierung“ zu verändern. Sobald Unternehmen den Tokenverbrauch als Fortschrittskriterium ansehen, erhalten die Modellhersteller ein fast perfektes Wachstumsrad.

Die direktesten Benefizienten von Tokenmaxxing sind Basis-Modellhersteller wie OpenAI, Anthropic, Google und xAI.

Weil Token selbst die Abrechnungseinheit für die Modellaufrufe sind. Sobald Unternehmen den Tokenverbrauch in eine interne Rangliste oder ein Leistungszeichen umwandeln, werden die Mitarbeiter von der „nötigen Nutzung der AI“ zur „aktiven Erzeugung von AI-Nutzung“ übergehen. Dies wird die API-Aufrufe der Modelle, die Unternehmensabonnements und die Inferenz-Einnahmen direkt erhöhen.

Das Beispiel von Meta zeigt dies am besten. Die Mitarbeiter von Meta haben in 30 Tagen 60,2 Billionen AI-Token verbraucht. Wenn man die Preise der Anthropic-API nimmt, könnte diese Kosten bis zu 9 Milliarden US-Dollar betragen; selbst wenn Meta einen Rabatt bekommt, könnten die Kosten immer noch über 1 Milliarde US-Dollar liegen.

Das bedeutet, dass, sobald Tokenmaxxing in großen Unternehmen skaliert wird, es nicht mehr nur eine normale Tool-Ausgabe ist, sondern eine Inferenz-Rechnung im Milliarden-Dollar-Bereich.

Das Einnahmenwachstum von Anthropic spiegeln auch diesen Trend wider. Laut einem neuesten Bericht von Reuters erwartet Anthropic, dass der Umsatz im zweiten Quartal 2026 über 10,9 Milliarden US-Dollar liegen wird, höher als im ersten Quartal mit 4,8 Milliarden US-Dollar, und es ist möglich, dass ein Betriebsgewinn von 559 Millionen US-Dollar erzielt wird. Frühere Berichte haben gezeigt, dass das Claude Code von Anthropic in dem Jahr, in dem es eingeführt wurde, fast 1 Milliarde US-Dollar an Jahresumsatz erreichte.

D.h., für die Modellhersteller bedeutet Tokenmaxxing im Wesentlichen, die interne Angst der Unternehmen in API-Einnahmen umzuwandeln. Natürlich bedeutet dies nicht, dass die Modellunternehmen keine Rechenleistungsprobleme haben, aber Tokenmaxxing bringt ihnen zumindest beträchtliche Einnahmen.

Die zweite Gruppe von Gewinnern sind AI-Programmiertools und Agent-Plattformen wie Cursor, Claude Code, Windsurf, Replit und Lovable. Beispielsweise hat Anysphere, das hinter Cursor steht, im November 2025 eine neue Runde von Finanzierungen abgeschlossen und hat einen Schätzwert von fast 30 Milliarden US-Dollar erreicht. Das Unternehmen hat angegeben, dass sein Jahresumsatz bereits über 1 Milliarde US-Dollar liegt und dass die vertriebsgetriebenen Einnahmen seit Anfang 2025 um das 100-fache gestiegen sind.

Aber das bedeutet nicht, dass die AI-Tool-Unternehmen profitabel sein können. Laut ausländischen Medienberichten wachsen Unternehmen wie Cursor und Windsurf schnell und haben einen hohen Schätzwert, aber viele Unternehmen haben noch keine Gewinne erzielt. Ein Grund dafür ist, dass sie auf Basis-Modelle wie Anthropic angewiesen sind und die Inferenzkosten sehr hoch sind. Einige Unternehmen beginnen daher, eigene Modelle zu trainieren, um die Kosten zu senken und die Kontrolle zu stärken.

Deshalb können die AI-Programmiertools nur als Sieger in Bezug auf Traffic und Schätzwert von Tokenmaxxing angesehen werden, aber nicht unbedingt alle als Gewinngewinner.

Tokenmaxxing basiert auf Rechenleistung, und die größten Gewinner sind Nvidia, Cloud-Anbieter, GPU-Cloud-Dienstleister und AI-Infrastrukturunternehmen.

Ein typisches Beispiel ist Nvidia. Seine Finanzdaten spiegeln diesen Trend wider. Nvidia hat im Geschäftsjahr 2026 (bis Januar 2026) einen Jahresumsatz von 215,9 Milliarden US-Dollar erzielt, was einem Anstieg von 65 % gegenüber dem Vorjahr entspricht. Im vierten Geschäftsquartal betrug der Umsatz 68,1 Milliarden US-Dollar, was einem Anstieg von 73 % gegenüber dem Vorjahr entspricht. Anschließend, im ersten Quartal des Geschäftsjahres 2027, das im April 2026 endete, erreichte der Umsatz weiter 81,6 Milliarden US-Dollar, was einem Anstieg von 85 % gegenüber dem Vorjahr entspricht. Dabei waren der Datencentersektor und die Netzwerkhardware die Kernantriebskräfte. Der Netzwerksales betrug 14,8 Milliarden US-Dollar, was einem Anstieg von etwa dem Dreifachen gegenüber dem Vorjahr entspricht.

Cloud- und Inferenz-Infrastruktur-Start-up-Unternehmen profitieren ebenfalls. Das AI-Infrastruktur-Start-up Modal Labs hat nach der neuesten Runde von Finanzierungen einen Schätzwert von 4,65 Milliarden US-Dollar erreicht. Der Jahresumsatz ist von 60 Millionen US-Dollar im September letzten Jahres auf 300 Millionen US-Dollar gestiegen. Sein Geschäft trifft genau auf zwei Trends: den starken Anstieg der Nachfrage nach AI-Coding und die zunehmende Knappheit von Rechenleistung.

Und in dieser Welle sind die größten Verlierer die Unternehmen, die den Tokenverbrauch nicht in Vermögen umwandeln können, aber trotzdem blind der Mode folgen.

Reiche Großunternehmen sind zu „verrückt“ nach Tokens 

Rückblickend hat man in diesem Silicon Valley „Token-Verbrauchskrieg“ bereits viele Tokens verschwendet. Diejenigen, die am „verrücktesten“ sind, sind eher die reichen Großunternehmen.

Mehrere Meta-Ingenieure haben angegeben, dass innerhalb des Unternehmens eine Vielzahl von sinnlosen AI-Nutzungen auftreten. Einige Entwickler führen interne Agenten wie OpenClaw aus und verbrauchen eine enorme Menge an Tokens, aber es entstehen fast keine effektiven Ergebnisse. Einige Entwickler haben auch erwähnt, dass einige SEV-Online-Störungen möglicherweise mit unvorsichtiger AI-Codegenerierung zusammenhängen: Die Entwickler achten mehr darauf, mit der AI schnell eine große Menge an Code zu produzieren, anstatt auf die Qualität des Produkts selbst.

Was noch kontroverser ist, ist, dass die Rangliste den Tokenverbrauch zu einem spielerischen Wettbewerb gemacht hat. Die Mitarbeiter, die an der Spitze stehen, haben möglicherweise nicht unbedingt wertvollere Arbeit geleistet, sondern eher eine große Menge an einmaligen, wegwerfbaren Codes und Prompt-Notizen erzeugt. Nachdem die internen Mitarbeiter die AI-Prompt-Spuren untersucht haben, können sie deutlich sehen, dass viele dieser Arbeiten keine tatsächliche Bedeutung haben.

Nachdem es auf den sozialen Medien zu einer öffentlichen Reaktion kam und ausländische Medien die relevanten Daten preisgaben, hat Meta diese Rangliste offline genommen.

Auch innerhalb von Microsoft, OpenAI, Anthropic usw. gibt es ähnliche Token-Nutzungsdashboards. Anfangs hat dieser Mechanismus tatsächlich die Experimente mit AI-Tools vorangetrieben, aber es sind auch Probleme aufgetreten: Wenn der Tokenverbrauch mit der Leistungsbewertung, dem Beförderungssignal und dem Grad der AI-Nativität verknüpft wird, wird er nicht mehr nur ein Beobachtungsindikator, sondern wird zu einem Ziel, das die Mitarbeiter bewusst verfolgen.

Ein Microsoft-Ingenieur hat zugeben, dass er selbst aktiv Tokenmaxxing betreibt, nicht um auf die Spitze der Rangliste zu kommen, sondern aus Angst, als jemand, der „zu wenig AI nutzt“, angesehen zu werden. Er wird die AI fragen, über Fragen, die bereits in der Dokumentation beschrieben sind; er lässt die AI Funktionsprototypen generieren, die er überhaupt nicht entwickeln wird; selbst wenn er weiß, dass es schneller ist, es manuell zu schreiben, verwendet er standardmäßig einen Agenten und schaut, wie er scheitert.

Dieser Ingenieur hat nicht lange bei der Firma gearbeitet und ist sensibel gegenüber seiner beruflichen Sicherheit. Deshalb wählt er aus, mehr Tokens zu verbrauchen, um zu beweisen, dass er ein „genügend AI-nativer“ Mitarbeiter ist.

Salesforce geht noch radikaler vor und lässt die Mitarbeiter direkt ihren Tokenverbrauch vergleichen.

Laut einem internen Ingenieur hat das Unternehmen zwei Tools eingeführt: Ein Mac-Widget, das die persönlichen Ausgaben alle 15 Minuten aktualisiert und gleichzeitig die minimalen erwarteten Ausgaben anzeigt. Es gab beispielsweise ein Ziel von 100 US-Dollar für Claude Code und 70 US-Dollar für Cursor pro Woche. Das andere ist ein Web-Tool, mit dem man die Token-Ausgaben von beliebigen Kollegen einsehen kann.

Salesforce hat auch eine maximale Ausgabengrenze von 250 US-Dollar pro Monat für Claude Code und 170 US-Dollar pro Monat für Cursor festgelegt, aber diese Grenze kann durch einfaches Klicken auf eine Schaltfläche aufgehoben werden. Einige Ingenieurorganisationen haben sogar die maximale Grenze entfernt, mit der