So schnell können die Giganten die Kosten für Tokens nicht mehr stemmen?
Die Silicon Valley-Riesen, die ihre Mitarbeiter gezwungen haben, stark auf KI zu setzen, beginnen nun, "nicht mehr mitzuspielen".
Amazon hat eindringlich dargelegt: "Verwenden Sie KI nicht einfach, um sie zu verwenden", und mit einem Handbeweg geschlossen die interne Rangliste für den Token-Verbrauch der Mitarbeiter.
Microsoft hat plötzlich die meisten Claude Code-Lizenzen widerrufen und die Entwickler aufgefordert, ihren Arbeitsablauf wieder auf GitHub Copilot CLI umzustellen.
Vor kurzem war die Situation ganz anders. Je mehr KI die Mitarbeiter verwendeten, desto fortschrittlicher schienen sie und desto zukunftsträchtiger erschien das Unternehmen.
Aber als die Mitarbeiter tatsächlich anfing, KI massiv zu nutzen, stellten die Unternehmen schnell fest, dass es noch unklar ist, ob dadurch eine höhere Produktivität erzielt wird, während die Rechnungen schon gewachsen sind.
Einerseits bekümmern sie sich um die Token-Rechnungen, andererseits fürchten sie, im KI-Wettlauf zurückzufallen. Silicon Valley steht vor einem Problem, das es selbst geschaffen hat.
Leute, KI ist einfach unglaublich nützlich!
Alles begann im vergangenen Jahr. Obwohl das "Ermutigen der Mitarbeiter, sich der KI zu öffnen" schon länger üblich war, hat es 2025 plötzlich zu einer unaufhaltsamen Welle geworden.
Am deutlichsten ist, dass die Silicon Valley-Konzerne die Mitarbeiter zwingen, mehr KI zu nutzen.
Wie Julia Liuson, ein Manager in Microsofts Entwicklertools-Bereich, sagte: "Die Verwendung von KI ist kein Option mehr, sondern eine Kernkompetenz für jede Position und jeden Hierarchieebene."
Damals forderte sie in einer internen E-Mail die Manager auf, bei der Beurteilung der Mitarbeiterleistung deren Verwendung interner KI-Tools, einschließlich GitHub Copilot, zu berücksichtigen.
Amazon hat einerseits angedeutet, dass in Zukunft einige Positionen aufgrund der KI reduziert werden könnten, und die Mitarbeiter andererseits aufgefordert, sich der KI zu öffnen.
Letzten Sommer hat CEO Andy Jassy eine E-Mail über generative KI an alle Mitarbeiter verschickt. In der E-Mail sagte er, dass mit der massiven Implementierung von generativer KI und Agenten in der Firma die Anzahl der benötigten Mitarbeiter für einige bestehende Positionen sinken würde; in den nächsten Jahren wird die Effizienzsteigerung durch KI voraussichtlich die Gesamtzahl der Unternehmensmitarbeiter bei Amazon reduzieren.
Als es darum ging, wie die Mitarbeiter reagieren sollten, forderte Jassy die Mitarbeiter direkt auf, sich aktiv der KI zu öffnen:
"Machen Sie sich mit KI vertraut, nehmen Sie an Workshops und Schulungen teil, nutzen und testen Sie KI so weit wie möglich, beteiligen Sie sich an Team-Brainstormings, denken Sie darüber nach, wie Sie schneller und in größerem Umfang für die Kunden innovieren können und wie Sie mit einem kompakteren Team mehr erreichen können."
Dieser Text kann als öffentlicher Ausgangspunkt der internen KI-Mobilisierung bei Amazon angesehen werden.
Nicht nur einige Konzerne, sondern auch im Jahr 2025 war es fast eine Art Mode, "die gesamte Belegschaft mit KI auszustatten".
Shopify hat das Konzept der "reflexiven KI-Nutzung" eingeführt und erklärt, dass dies jetzt eine Grundanforderung der Firma ist. Unter "reflexiver Nutzung" versteht man, "KI wie eine Konditionierung zu nutzen". Wenn Mitarbeiter mit einer Aufgabe konfrontiert werden, sollten sie zunächst überprüfen, ob die Aufgabe mit KI gelöst werden kann.
Die Firma verlangt auch, dass Teams, bevor sie zusätzliche Mitarbeiter und Ressourcen beantragen, zunächst die Frage beantworten müssen: Warum kann diese Aufgabe nicht von KI erledigt werden?
Duolingo hat sogar öffentlich angekündigt, dass die Firma auf "KI-Priorität" umstellen wird. Wo KI eingesetzt werden kann, wird kein Outsourcing in Anspruch genommen. Wo KI eingesetzt werden kann, werden keine neuen Mitarbeiter eingestellt. Bei der Mitarbeiterbeurteilung wird auch deren KI-Nutzung berücksichtigt.
Dieser Trend hat sich bis zu einem gewissen Grad auch in dieses Jahr fortsetzt.
Im März dieses Jahres hat Huang Renxun öffentlich erklärt, dass er "sehr besorgt" wäre, wenn ein Ingenieur bei NVIDIA mit einem Jahresgehalt von 500.000 US-Dollar in einem Jahr nicht mindestens 250.000 US-Dollar an KI-Token verbraucht. Als er gefragt wurde, ob NVIDIA vorbereitet ist, jährlich etwa 2 Milliarden US-Dollar für das Engineering-Team für Token auszugeben, antwortete Huang Renxun: "Wir bemühen uns."
Dies ist nicht die erste Zeit, dass er so geäußert hat. Ende vergangenen Jahres hat Huang Renxun in einer internen Allhands-Veranstaltung bei NVIDIA einen Manager, der das Team "weniger KI zu nutzen" empfohlen hatte, gefragt: "Seid ihr verrückt?" und die Mitarbeiter eindeutig aufgefordert, so viele Aufgaben wie möglich mit KI zu automatisieren, und den Mitarbeitern zugesichert, dass die KI ihnen nicht ihren Job nehmen würde.
Aber wenn es um die aggressivste Firma geht, hat Meta die Nase vorn.
Im November 2025 hat Janelle Gale, die Chief Human Resources Officer von Meta, angekündigt, dass ab 2026 der "KI-getriebene Einfluss" ein Kernkriterium für die Mitarbeiter werden und in die Leistungsevaluation aufgenommen werden würde.
Im April dieses Jahres ist in Meta eine Rangliste namens "Claudeonomics" entstanden: Sie verfolgt die Anzahl der verbrauchten Token von über 85.000 Mitarbeitern, listet die Top 250 auf und vergibt Titel wie "Token-Legende" und "Cache-Meister". Innerhalb von nur 30 Tagen hat die Liste einen Token-Verbrauch von über 6 Billionen registriert.
Die KI-Nutzung ist zu einem brutalen internen Spiel geworden.
BCG hat in seinem Bericht "AI Radar 2026" 2.360 Unternehmensmanager befragt, darunter über sechshundert CEOs. Die Ergebnisse zeigen, dass 94 % der Organisationen angeben, dass sie weiterhin in KI investieren werden, auch wenn die Investitionen in KI 2026 keine unmittelbaren Erträge bringen.
Der Bericht prognostiziert, dass der Anteil der Unternehmensinvestitionen in KI am Umsatz von etwa 0,8 % im Jahr 2025 auf etwa 1,7 % im Jahr 2026 steigen wird, fast verdoppeln. 72 % der CEOs geben an, dass sie bereits die Hauptverantwortlichen für die KI-Entscheidungen in ihrer Firma sind; die Hälfte der CEOs ist sogar der Meinung, dass ihr Job gefährdet wäre, wenn die KI-Investitionen keine Ergebnisse bringen.
Für diese Unternehmen ist die KI eine Transformation, in die die CEOs persönlich setzen. Wichtig ist, nicht langsamer als die Konkurrenten zu sein.
Werden sie nicht mitspielen? Die Silicon Valley-Riesen kehren um
Allerdings haben die Silicon Valley-Riesen bald nach dem Start des KI-Nutzungswettbewerbs die Bremse gedrückt.
Das erste, das sich selbst widerspricht, ist Amazon, das zuvor die Mitarbeiter aufgefordert hatte, "KI so weit wie möglich zu nutzen und zu testen".
Ende Mai dieses Jahres wurde bekannt, dass Amazon eine interne Rangliste namens "KiroRank" geschlossen hat. Diese von den Mitarbeitern selbst erstellte Liste zeigt die Anzahl der verbrauchten Token bei der Nutzung von KI-Tools an.
Laut der "Financial Times" haben einige Mitarbeiter angefangen, die interne KI-Agentenplattform MeshClaw von Amazon für unnötige Aufgaben zu nutzen, um ihre KI-Nutzungsdaten zu verbessern. MeshClaw kann normalerweise für die Mitarbeiter Code-Deployments initiieren, E-Mails sortieren oder mit Anwendungen wie Slack interagieren; aber wenn der Token-Verbrauch in die Rangliste aufgenommen wird, kann der Zweck der Mitarbeiter, diese Agenten auszuführen, von der Erledigung echter Aufgaben auf das reine "Ranglistenplatzieren" umschlagen.
Dieses Verhalten hat sogar einen eigenen Namen: Tokenmaxxing, was bedeutet, den Token-Verbrauch so hoch wie möglich zu treiben.
Obwohl Amazon nicht offen gelegt hat, welche ineffektiven Aufgaben die Mitarbeiter ausgeführt haben, haben Benutzer in der zugehörigen Community bereits direkt über diese "Ranglistenplatzierungs"-Methode spekuliert:
MeshClaw im Hintergrund laufen lassen, damit es ständig eine statische Analyse von Quellcode-Paketen durchführt, und die Tokens sammeln sich natürlich an.
Auf Hacker News hat ein Benutzer auch angegeben, dass ein Mitarbeiter, den er kennt, nachdem die Firma begann, "wie viele Token verbraucht werden" zu bewerten, einfach verschiedene KI-Agenten so eingerichtet hat, dass sie die Ausgaben der anderen aufnehmen und im Kreis laufen, da es einfach nicht so viele Aufgaben gibt, die einen hohen Token-Verbrauch erfordern.
Amazon hat schließlich diesen Wettbewerb beendet.
Dave Treadwell, ein Senior-Vizepräsident der Firma, hat die Mitarbeiter in einer internen Mitteilung darauf hingewiesen: "Verwenden Sie KI nicht einfach, um sie zu verwenden. Verwenden Sie KI, um Ihnen zu helfen, Kundenprobleme zu lösen, Geschäftsprobleme zu bewältigen und Innovationen zu erzielen."
Es ist noch nicht einmal ein Jahr vergangen, seit Jassy die Mitarbeiter persönlich aufgefordert hat, sich der KI zu öffnen.
Amazon ist nicht der einzige Konzern, der zurücktritt. Mitte Mai dieses Jahres hat Microsoft begonnen, die meisten internen Claude Code-Lizenzen zurückzunehmen.
Unter den Riesen können auch die kleinen und mittleren Unternehmen nicht mehr mithalten.
Im April letzten Jahres hat Luis von Ahn, der CEO von Duolingo, angekündigt, dass die Firma auf "KI-Priorität" umstellen würde, aber ein Jahr später hat er zugeben müssen, dass die Firma diese Bewertungsmaßstab zurückgenommen hat.
Ein ganzes Jahr später hat er in einem Podcast erklärt, dass die Mitarbeiter der Firma gefragt haben: Müssen wir KI einfach verwenden, um zu zeigen, dass unsere Firma "KI-prioritär" ist?
Schließlich hat Duolingo aufgehört, die KI-Nutzung der Mitarbeiter als offizielles Leistungskriterium zu verwenden. Von Ahn hat erklärt, dass es am wichtigsten ist, dass die Mitarbeiter ihre Arbeit gut erledigen können. KI ist für einige Aufgaben geeignet, aber nicht für alle. Die Firma sollte die Mitarbeiter nicht zwingen, KI an ungeeigneten Stellen zu verwenden.
Die Unternehmen, die ihre Mitarbeiter früher so eifrig aufgefordert haben, sich der KI zu öffnen, haben natürlich nicht auf KI verzichtet.
Sie haben einfach festgestellt, dass es ein Problem ist, wenn die Mitarbeiter keine KI verwenden, aber es könnte ein noch "teureres" Problem sein, wenn die Mitarbeiter aufgrund von Ranglisten, Leistungsevaluierungen und Selbstschutz Token massiv verbrauchen.
KI ist zwar gut, aber man kann sich nicht leisten, zu viel davon zu genießen
Es ist bekannt, dass die Entwicklung von KI sehr teuer ist.
Aber dass die Nutzung von KI auch so teuer sein kann, ist wirklich überraschend.
Ein typisches Beispiel ist Uber, das im April dieses Jahres bereits sein gesamtes Jahresbudget für KI aufgebraucht hatte. Erinnern wir uns an Dezember letzten Jahres, als Uber etwa 5.000 Ingenieuren das KI-Programmiertool Claude Code von Anthropic zur Verfügung gestellt hat.
Wie bereits erwähnt, hat Microsoft im Mai dieses Jahres begonnen, die meisten internen Claude Code-Lizenzen zurückzunehmen. Microsoft hat intern erklärt, dass dies dazu dienen soll, die Toolchain auf das eigene Copilot CLI zu vereinheitlichen.
Aber laut The Verge ist dies auch eine finanzielle Entscheidung.
Die Claude Code-Lizenzen werden Ende Juni, also vor dem Ende des aktuellen Geschäftsjahres von Microsoft, in großem Umfang geschlossen, um vor dem Beginn des neuen Geschäftsjahres einen Teil der Betriebskosten zu senken.
Was noch bemerkenswerter ist, dass sich auch die Preismodelle von Copilot ändern, während Microsoft die Mitarbeiter dazu auffordert, wieder auf Copilot CLI umzusteigen.
Im April dieses Jahres hat GitHub angekündigt, dass ab dem 1. Juni die Bezahlpläne für Unternehmens- und Teambenutzer von GitHub Copilot auf ein nutzungsbasiertes Preismodell umgestellt werden. In der Vergangenheit haben diese Kunden hauptsächlich nach Abonnementpaketen und Anzahl der Premium-Anfragen bezahlt; unter dem neuen Plan enthält jedes Paket nur ein bestimmtes Kontingent an GitHub AI Credits, und nach Überschreitung des Kontingents müssen sie weiterhin nach der tatsächlichen Nutzung bezahlen.
Wie wird diese Gebühr berechnet? Sie wird anhand der verbrauchten Eingabe-Token, Ausgabe-Token und Cache-Token während der Mitarbeiter-Nutzung berechnet.
GitHub hat in einer offiziellen Ankündigung erklärt, dass, da Copilot zunehmend komplexere Agentenaufgaben wie Analyse, Modifikation und Iteration übernimmt, die Rechenleistungskonsumdifferenzen zwischen verschiedenen Aufgaben immer größer werden, daher ist es erforderlich, auf die nutzungsbasierte Abrechnung umzustellen.
Anthropic hat auch ein ähnliches Abrechnungsmodell eingeführt.
Derzeit deckt die Sitzplatzgebühr für die Unternehmensversion von Claude nur den Zugang zur Plattform ab und umfasst nicht die tatsächliche Nutzung. Jeder Token, der von Mitarbeitern bei der Nutzung von Claude, Claude Code und Cowork verbraucht wird, muss zusätzlich nach den Standard-API-Preisen berechnet werden.
Direkter gesagt, in der offiziellen Hilfedokumentation von Anthropic wird Unternehmen explizit darauf hingewiesen: Unter dem neuen nutzungsbasierten Abrechnungsplan hat kein Team ein separat zugewiesenes Token-Kontingent. Wenn ein Mitarbeiter viel KI nutzt, verringert dies nicht das verfügbare Kontingent anderer Mitarbeiter, sondern führt nur zu einer höheren