Neue Art der AI-Konkurrenz in großen Unternehmen: Tokens werden zum neuen "PPT"
Das Geld, das Unternehmen durch Kostensenkung und Effizienzsteigerung einsparen, könnte von ineffektiven Tokens verbrannt werden.
Berichten zufolge hat Microsoft begonnen, die interne Genehmigung für Claude Code einzuschränken. The Verge hat offen gelegt, dass das Experiences + Devices - Team von Microsoft Ende Juni die meisten Drittanbieter - Genehmigungen für Claude Code einstellen wird und vollständig auf das eigene GitHub Copilot CLI umstellen wird. Einer der Kernanforderungen ist es, den Kostendruck durch KI zu lindern. Die Situation bei Uber ist noch schlimmer. Der CTO Praveen Neppalli Naga hat offen zugegeben, dass das gesamte KI - Budget des Unternehmens für das Jahr 2026 bereits nach vier Monaten fast aufgebraucht ist.
Meta geht einen anderen Weg, und zwar in genau die entgegengesetzte Richtung. Innerhalb von Meta wurde eine Token - Verbrauchs - Rangliste eingeführt. Mitarbeitern mit hohem Verbrauch werden Ehrentitel wie "Token - Legende" und "Cache - Magier" verliehen. Selbst die Verknüpfung des Verbrauchs mit der Leistungsevaluation und die Einrichtung eines Letztplatz - Ausscheidungsverfahrens wurden eingeführt. Nur 30 Tage nach der Implementierung dieses Mechanismus ist der Gesamtverbrauch von Tokens im gesamten Meta - Personal von 6 Billionen auf 73,7 Billionen explodiert, was einer Steigerung von über dem 12 - fachen entspricht. Der KI - Verbrauch ist völlig außer Kontrolle geraten.
Einige Unternehmen bremsen, andere treten aufs Gaspedal, aber das Problem ist dasselbe. Bislang gibt es in der Branche keine ausgereifte, stabile und umsetzbare Bewertungsstandard für den KI - Wert. Daher wird der einfach zu statistierende Token - Verbrauch zum einzigen harten Kriterium.
Robin Li, CEO von Baidu, hat vor zwei Wochen auf einer Konferenz darauf hingewiesen, dass Tokens zwar einfach zu statistieren sind, aber nicht gleichbedeutend mit der tatsächlichen Leistung sind.
Wenn ein Mitarbeiter mehr Agenten startet, längere Kontexte hinzufügt und das Modell wiederholt Fehlversuche macht, wird die Rechnung schnell größer, aber die Geschäftsergebnisse verbessern sich möglicherweise nicht synchron.
01.
Token - KPI: Ein Leistungsevaluations - Experiment, das Verschwendung erzeugt
Die Arbeitsweise, die darauf abzielt, den Token - Verbrauch zu maximieren ("Tokenmaxxing"), hat sich seit Ende letzten Jahres in Silicon Valley verbreitet und hat sich jetzt auch in China ausgebreitet. Technische Teams großer Unternehmen wie Alibaba, Tencent und ByteDance haben in unterschiedlichem Maße den Token - Verbrauch als Referenz für die Feststellung der Anstellung und Beförderung herangezogen.
Wenn die Leistungsevaluation eng mit dem Token - Verbrauch verknüpft ist, breitet sich der Büro - Formalismus schnell in die KI - Arbeitsumgebung aus. Laut einem Bericht von "Caixin" stellen viele Mitarbeiter absichtlich die KI - Agenten an, um Tausende von Codezeilen und Daten aus zehntausendwörtigen Literaturen zu lesen, um den Token - Verbrauch einfach durch "Aufschub von Arbeitslast" zu erhöhen, ohne tatsächliche Arbeitsleistung zu erbringen. Dies ist kein Einzelfall. Offizielle Daten zeigen, dass fast die Hälfte des Token - Verbrauchs in globalen Unternehmens - KI - Anwendungen ineffektiv und verschwendet ist.
Wie viel von den 73,7 Billionen Tokens von Meta hat sich tatsächlich in effektive Leistung umgesetzt? Dies ist genau die Kernlücke aller Token - KPI - Systeme.
Im Gegensatz zur Kostenangst von Silicon - Valley - Unternehmen versuchen chinesische Spitzenunternehmen, die Schwelle für die Mitarbeiter zur KI - Nutzung durch hohe Token - Subventionen drastisch zu senken.
Nach Informationen aus verschiedenen Quellen haben die Wohlfahrtsmaßnahmen der Unternehmen unterschiedliche Schwerpunkte: Tencent hat für die Kernforschung und Entwicklung ein spezielles Token - Paket im Wert von 228.000 Yuan pro Jahr bereitgestellt, sowie eine monatliche Rückerstattung von 1.000 US - Dollar für externe Tools; ByteDance hat die unbegrenzte Nutzung von KI - Tools für interne Mitarbeiter geöffnet. Mitarbeiter können 50 % der Kosten für die Privatnutzung von KI zurückerstatten lassen, wobei das Limit für technische Mitarbeiter 1.000 US - Dollar pro Jahr beträgt; Baidu hat technischen Mitarbeitern die unbegrenzte Nutzungsrechte für Wenxin Yiyan zugewiesen, sowie eine maximale externe Token - Subvention von 800 US - Dollar pro Jahr; 360 hat einfach direkt allen Mitarbeitern 1 Milliarde Tokens gutgeschrieben.
KI - Tools sind nicht mehr einfach Office - Software - Plugins, sondern werden zu neuen Produktionsmitteln. Früher haben Unternehmen ihren Mitarbeitern Computer, Software - Accounts, Cloud - Speicher und Rückerstattungsbeträge zur Verfügung gestellt; jetzt benötigen möglicherweise Mitarbeiter in den Bereichen Forschung und Entwicklung, Design, Produktentwicklung und Betrieb Modell - Aufruf - Quoten. Vor allem in den Szenarien wie Code - Generierung, Agent - Arbeitsabläufen, Video - Generierung und Wissenssuche sind Tokens der Treibstoff für die Arbeit.
Das Problem ist, dass viele Unternehmen noch nicht wissen, wie der Treibstoffverbrauch berechnet werden soll, nachdem der Treibstoff verteilt wurde.
02.
Das goldfressende Agent und die unberechenbaren Kostenvariablen
Die internen Daten von Uber zeigen präzise die Kernlücke im Kostenkontrollsystem von Unternehmens - KI - Anwendungen. Derzeit verwenden 95 % der Ingenieure regelmäßig KI - Codierungstools. Die monatlichen Kosten für den KI - Aufruf pro Mitarbeiter betragen zwischen 500 und 2.000 US - Dollar. 70 % der Code - Einreichungen werden von KI generiert. KI - Agenten können wöchentlich 1.800 Code - Änderungen durchführen. Der Anteil der damit verbundenen Arbeitslast ist von weniger als 1 % auf 8 % gestiegen.
Aus der Perspektive der Geschäftsumsetzung ist dies eine deutliche Steigerung der KI - Penetration. Für die Finanzabteilung eines Unternehmens bedeutet dies jedoch, dass das starre und kontrollierbare IT - Kostensystem völlig zerstört wurde.
Die Wurzel des Kostenproblems liegt in der hohen Ressourcenanforderung von KI - Agenten. Gartner hat festgestellt, dass Agenten für die gleiche Arbeitsmenge 5 bis 30 Mal mehr Tokens verbrauchen als herkömmliche Chatbots. Goldman Sachs hat sogar vorhergesagt, dass der globale Token - Verbrauch bis 2030 auf etwa 120 Quadrillionen pro Monat steigen wird, was das 24 - fache des Niveaus von 2026 ist. Der Antrieb hierfür ist die massenhafte Implementierung von Agenten auf Unternehmensebene.
Bei herkömmlichen SaaS - Lösungen werden die Kosten pro Benutzer berechnet, und die IT - Abteilung kann die maximalen Ausgaben für das ganze Jahr bei der Beschaffung festlegen.
Die Kostenstruktur von KI - Tools ist mit diesem System überhaupt nicht kompatibel. Die Token - Rechnung wächst dynamisch mit der Nutzungsaktivität. Die Finanzabteilung hat keine historischen Daten, um einen Referenzwert zu erstellen, die IT - Abteilung hat keine ausgereiften Tools für die Echtzeitverfolgung und Kostenaufteilung, und die Geschäftseinheiten haben auch keine Kostenattributionsmechanismen eingerichtet, wenn sie die Nutzung fördern.
Es ist nicht so, dass KI nutzlos ist, sondern dass das FinOps - System der Unternehmen überhaupt nicht mit der KI - Nutzungsgeschwindigkeit Schritt halten kann. Deshalb haben Microsoft und Uber dringend die Bremse betätigt.
03.
Mitarbeiter nutzen Subventionen aus, Geschäftseinheiten versprechen viel
Die Situation in chinesischen Unternehmen unterscheidet sich etwas von der in Silicon Valley. In Silicon Valley besteht die Sorge, dass der Verbrauch zu schnell wächst und die Rechnung über das Budget hinaus geht. Bei chinesischen Großunternehmen ist die realistischere Schwierigkeit, dass das Geld ausgegeben wird, aber die Mitarbeiter die KI nicht tief genug nutzen und der tatsächliche Geschäftswert unklar bleibt.
Nach C - Seite - Daten ist die Popularität von KI - Anwendungen in China bisher nie so hoch gewesen. Ein Branchenbericht von Liangziweike in 2026 zeigt, dass der monatliche Zugriff auf die Web - Seite von KI - Anwendungen in China im April dieses Jahres 900 Millionen überschritten hat, die monatliche Downloadsanzahl der APP - Seite über 240 Millionen und die tägliche aktive Benutzerzahl 670 Millionen erreicht hat, was einem Anstieg von 223 % gegenüber dem Vorjahr entspricht. Daten von QuestMobile bestätigen ebenfalls, dass bis März 2026 die monatliche aktive Benutzerzahl von chinesischen KI - nativen APPs 440 Millionen erreicht hat. Doubao, Qianwen und DeepSeek führen die Branche an.
Die aufregenden C - Seite - Daten haben sich nicht synchron in eine Produktivitätssteigerung auf Unternehmensebene umgesetzt.
Daten aus dem "China - Unternehmens - Digitalisierungs - Index 2025" von Accenture zeigen, dass 46 % der chinesischen Unternehmen die Anpassung und Umsetzung von KI gestartet haben, aber nur 9 % der Unternehmen einen signifikanten Geschäftswert - Durchbruch erzielt haben. Die Umsetzung von KI in den meisten Unternehmen bleibt noch in der Anfangsphase des oberflächlichen Tests, der blinden Promotion und der Erkundung von Anwendungsfällen.
In oberflächlichen Szenarien wie Inhaltserstellung, Kundenservice - Fragen und Code - Unterstützung ist die Umsetzung von KI einfach und bringt schnell Ergebnisse. In den Schlüsselgeschäftsprozessen wie Kernforschung und Entwicklung, Supply - Chain - Management, Finanz - Risikokontrolle und Organisationskoordination steigen jedoch die Anpassungsschwierigkeiten, die Compliance - Schwelle und die Umsetzungskosten von KI erheblich.
Das Ziel der Token - Subvention für alle Mitarbeiter in Großunternehmen ist es, die Kosten für KI - Fehlversuche durch finanzielle Vergünstigungen zu senken und die Mitarbeiter zwangsläufig in den KI - Arbeitsablauf zu integrieren. Diese Vorgehensweise hat eine gewisse Rationalität: Nur eine ausreichende Nutzungsdichte kann ein Unternehmen zwingen, die echten Anwendungsfälle für die Geschäftsanpassung auszuwählen und gleichzeitig die KI - Nutzungsgewohnheiten der Mitarbeiter zu fördern.
Das Problem ist jedoch, dass wenn nur die Nutzung gefördert wird und kein Wertmaßstab eingerichtet wird, werden die Wohlfahrtsleistungen zu einer Rechnungsbelastung. Gleichzeitig entsteht ein pseudo - KI - Arbeitsstil, der sich auf die "PPT - Präsentation" und die "Dokumentation" konzentriert.
Die Penetrationsgeschwindigkeit von KI in den Arbeitsmarkt ist viel schneller als erwartet. Laut einem Bericht von Cognizant aus 2026 wird 93 % der Arbeitsplätze in den USA in unterschiedlichem Maße von KI betroffen sein. Diese Branchenprognose ist ganze sechs Jahre früher als zuvor geschätzt.
Die KI - Penetration in den Hauptarbeitsplätzen zeigt einen vollständigen Ausbruch. Daten zeigen, dass die KI - Exposition in den Bereichen Management, Finanzbetrieb und administrativer Support im Jahr 2023 nur 14 % - 21 % betrug und jetzt auf 60 % - 68 % gestiegen ist; die KI - Exposition in der Anwaltschaft ist von 9 % auf 63 % gestiegen, und selbst die theoretische KI - Exposition des CEO - Postens hat die 60 % - Marke überschritten. Der Bericht betont gleichzeitig, dass die theoretische Penetration nicht gleichbedeutend mit der tatsächlichen Substitution ist. Verantwortlichkeit, Branchenregulierung und menschliche subjektive Beurteilung sind immer noch die Kernbarrieren für die vollständige Umsetzung von KI.
Dies bedeutet, dass KI in mehr Arbeitsplätze eindringen wird und der Token - Verbrauch sich von der Forschungs - und Entwicklungsabteilung auf eine breitere Organisationsebene ausbreiten wird. Unternehmen müssen sich wirklich damit auseinandersetzen, wie sie entscheiden können, ob ein Token - Einsatz lohnend ist.
04.
Den Token - Schaum beseitigen: Vom "Verbrauchsglauben" zum "Effizienzmaßstab"
Tokens an sich sind kein Problem. Wenn Unternehmen ein ausgereiftes KI - Produktivitätssystem aufbauen möchten, benötigen sie unbedingt einen ausreichenden Token - Einsatz als Unterstützung. Der Kern des Branchenproblems liegt nie darin, "zu viele Tokens zu verbrauchen", sondern darin, "den Token - Verbrauch als das einzige Ziel zu setzen".
Das Token - Ranglisten - System von Meta scheint die KI - Nutzungsbegeisterung aller Mitarbeiter zu wecken und die Mitarbeiter in einem gewissen Maße dazu zu bringen, neue KI - Tools zu testen, aber es kann die Kernlücke nicht vermeiden: Die Gesamtmenge des Token - Verbrauchs hat keine direkte Beziehung zur Geschäftleistung der Mitarbeiter.
Die Kostenkrise von Microsoft und Uber bestätigt auch, dass eine einfache Reduzierung des Token - Kontingents nur das Symptom behandelt und nicht die Ursache beseitigt. Es kann sogar die wirklich effizienten KI - Arbeitsumgebungen schädigen.
Robin Li hat versucht, eine Lösung anzubieten. Er hat das Konzept von DAA eingeführt: Daily Active Agent. Er befürwortet die Verwendung der Anzahl der täglich aktiven Agenten, um das tatsächliche Penetrationsniveau von KI zu messen, anstatt die Gesamtmenge des Token - Verbrauchs. Dieser Ansatz ist nicht unvernünftig, aber die genaue Berechnungsmethode muss noch verbessert werden. Schließlich muss ein aktiver Agent nicht unbedingt den Geschäftsprozess erfolgreich abwickeln können.
Die Kernumorientierung von Unternehmen besteht darin, den Token - Glauben abzulegen und ein KI - Effizienzdenken zu entwickeln.
Bei der Bewertung der Qualität der KI - Arbeit in der Forschung und Entwicklung sollte der Schwerpunkt auf der Merge - Genehmigungsrate, der Fehlerrate, der Rückarbeitrate und der Projektlieferungsphase des KI - Codes liegen, anstatt auf der Anzahl der Aufrufe;
Bei der Bewertung des Kundenservice - Szenarios sollte der Kern auf der Einmal - Lösungrate von Problemen,