Nach 500 Millionen US-Dollar Verlust im Januar: Tokens als KPIs - Die teuerste Falle bei AI-Umstellung, Amazon entfernt Rangliste eilig

Die Narrative von Token-Maxing verwandelt das Wachstumsmythos der oberen Wertschöpfungskette in ein Kostenunglück für die untere Wertschöpfungskette.

In letzter Zeit haben immer mehr Unternehmen festgestellt: Bevor die Künstliche Intelligenz (KI) tatsächlich ihre Geschäftsprozesse transformiert, wird ihr bereits das Token - Rechnungskonto die Finanzen umgestaltet. Das teuerste Hindernis bei der KI - Transformation ist es, die Token - Nutzung als Key Performance Indicator (KPI) für die Mitarbeiter zu setzen.

Der Geschäftsführer eines Unternehmens hat mit einer Handbewegung die Claude - Zugangsberechtigung für alle Mitarbeiter eingerichtet, dabei aber die Obergrenze vergessen. Innerhalb eines Monats wurden 5 Milliarden US - Dollar verbraucht, was in etwa 3 Milliarden Yuan entspricht. Als die Finanzabteilung darauf aufmerksam wurde, war die Rechnung im Wert von mehreren hundert Millionen US - Dollar bereits unterwegs.

Wie wurden eigentlich 5 Milliarden US - Dollar verbraucht? Wenn man die Details untersucht, stellt man fest, dass ein Großteil davon darauf zurückzuführen ist, dass einige Mitarbeiter bei der Ausführung von Aufgaben wiederholt auf Fehler stießen und immer wieder manuell auf "Wiederholen" klickten.

Wenn es nur ein Unternehmen wäre, das so unvorsichtig wäre, würde man das als Pech bezeichnen. Das Problem ist jedoch, dass ähnliche "Unfälle" wie Sand am Meer sind.

Innerhalb von Meta wurde eine Rangliste namens "Claudeonomics" (Claude - Ökonomie) erstellt, um zu ermitteln, wer die KI am stärksten nutzt. Innerhalb von 30 Tagen verbrauchte das gesamte Unternehmen mehr als 60 Billionen Tokens. Allein der "Spitzenreiter" der Rangliste verbrauchte 281 Milliarden Tokens, was in etwa 500.000 US - Dollar pro Monat entspricht.

Uber hat zunächst 5.000 Ingenieuren Claude Code zur Verfügung gestellt. Die Nutzungsrate stieg binnen wenigen Monaten stark an. Schon nach dem ersten Quartal klagte der Chief Technology Officer (CTO) bitterlich: Das gesamte AI - Programmierungshaushalt für das Jahr 2026 wurde bereits vorzeitig aufgebraucht.

Auch in China ist die Situation nicht anders. Auf dem Alibaba Cloud Summit hat der Technologieverantwortliche von Mihayo erwähnt, dass ein Mitarbeiter für ein Projekt mehrere Dutzend Agenten koordiniert hat und innerhalb einer Nacht Tokens im Wert von 2 Millionen Yuan verbraucht hat.

Warum ist die Token - Rechnung so außer Kontrolle geraten?

Der Bericht "Decoding the Agentic Economy" von Goldman Sachs aus diesem Mai enthüllt die Wahrheit: Im Agentic - Modell muss das Modell ständig in einer Schleife "Denken - Suchen - Werkzeuge aufrufen - Vollständigen Kontext neu lesen" agieren. Die Token - Verbrauchmenge erreicht dabei das 1000 - fache der normalen Frage - Antwort - Mode.

Man denkt, das Modell denkt, aber tatsächlich verbrennt es nur Geld. Die Modell - Unternehmen, Cloud - Anbieter und Chip - Hersteller verstecken sich stillschweigend hinter der Vorstellung, dass "mehr KI - Nutzung und mehr Token - Verbrauch" Fortschritt der fortschrittlichen Produktivität darstellen.

Wenn man sich nun die Vermögensbildungserfolge von Anthropic anschaut, das in einem Quartal über 10 Milliarden US - Dollar verdient und einen Unternehmenswert von über einer Billion US - Dollar hat, oder die starke Wachstumskurve von Huang (Jensen Huang), wird das alles verständlicher. Das von den unteren Ebenen "unfallhaft" verbrauchte Geld wird einfach in die Bilanzen der Modell - Unternehmen umgewandelt. Dieselbe Summe wird aus zwei Perspektiven betrachtet: Einmal als Wachstum, einmal als Unfall.

Amazon macht den ersten Schritt

Das Verbrauchen von mehreren hundert Millionen US - Dollar mag ein extremer Fall sein, aber das Problem des Geldverbrauchs ohne wirklichen Nutzen ist bereits ein weit verbreitetes Phänomen bei den großen Technologieunternehmen.

Amazon konnte es schließlich nicht mehr ertragen und griff zu den Messern.

Innerhalb von Amazon gab es eine Rangliste namens KiroRank, die auf der Kiro - Entwicklerplattform des Unternehmens aufgehängt war und die Ingenieure nach der Token - Verbrauchmenge sortierte.

Da das Unternehmen zuvor die strenge Forderung gestellt hatte, dass mehr als 80 % der Mitarbeiter die KI wöchentlich nutzen müssen, begannen die Mitarbeiter nach der Veröffentlichung der Rangliste mit "Tokenmaxxing": Sie schickten Agenten auf sinnlose Aufgaben, um ihre Token - Verbrauchmenge zu erhöhen und damit ihre Position in der Rangliste zu verbessern, was wiederum als berufliche Sicherheit empfunden wurde.

Schließlich konnte sich Dave Treadwell, der Senior - Vice - Präsident von Amazon, nicht länger enthalten und forderte in einer internen Konferenz eindringlich: Man soll nicht einfach aus Gründen der KI - Nutzung die KI nutzen.

Die Rangliste wurde daraufhin offline genommen, und der neue KPI wurde in "normalised deployments" (standardisierte Bereitstellungen) geändert. Dieser KPI misst, ob die Ingenieure tatsächlich nützlichen Code mit Hilfe der KI entwickelt haben, anstatt einfach die Token - Verbrauchmenge zu zählen.

Als Cloud - Computing - Marktführer vertraut Amazon natürlich auf die KI, aber es hat auch bewiesen, dass der KPI "KI - Nutzungsmenge" sehr leicht verfälscht werden kann.

Wenn man die Token - Anzahl misst, werden die Mitarbeiter versuchen, die Token - Anzahl zu erhöhen; wenn man die Anzahl der Prompts misst, werden sie Prompts erfinden; wenn man andeutet, dass man ohne KI - Nutzung zurückbleibt, werden die Mitarbeiter versuchen, zu beweisen, dass sie nicht zurückbleiben.

In der Ökonomie gibt es das Goodhart - Gesetz: Wenn ein Indikator zum Ziel wird, ist er kein guter Indikator mehr.

In der KI - Ära kann man dies auch so ausdrücken: Wenn die Token - Nutzung zum KPI wird, ist sie kein Produktivitätsindikator mehr, sondern eine sich automatisch vergrößernde Cloud - Rechnung. Früher ging es um die Arbeitszeit, jetzt um die Token - Nutzung; früher wurden die KPIs manipuliert, jetzt wird die Cloud - Rechnung manipuliert. Obwohl die Technologie voranschreitet, bleibt die Essenz am Arbeitsplatz dieselbe.

Amazon ist nicht der einzige, der die Bremse betätigt.

Shopify hat die Token - Rangliste in ein neutraleres Nutzungsdashboard umgewandelt und eine Abschaltmechanik eingeführt. Duolingo wollte die KI - Nutzungsdaten in die Leistungsbewertung einbeziehen, hat dies aber später zurückgenommen. Microsoft hat auch die Zugangsberechtigungen für einige externe KI - Programmierwerkzeuge eingeschränkt.

Ihre Kosten: Huang's Vermögen

Das verbrauchte Geld verschwindet nicht in Luft auf. Die Unordnung eines Unternehmens ist oft die Bilanz eines anderen Unternehmens.

Anthropic hat im ersten Quartal einen Umsatz von 4,8 Milliarden US - Dollar erzielt und erwartet im zweiten Quartal eine Verdopplung auf 10,9 Milliarden US - Dollar. Was treibt diese Wachstumskurve an? Nicht die normalen Benutzer - Gespräche, sondern die Unternehmens - APIs, Claude Code und die Organisationstriebkraft vieler Unternehmen, "KI für alle" und "Agenten loslaufen lassen" umzusetzen.

Wenn man sich Nvidia, den Anbieter der "Spaten", anschaut, hat es im letzten Quartal einen Umsatz von 81,6 Milliarden US - Dollar erzielt. Dies ist nicht nur Glauben an die KI, sondern auch echtes Bargeld.

Wenn man nun Jensens Huang's Aussage liest, klingt es anders. Gestern hat er auf der GTC Taipei gesagt, dass aus industrieller Sicht die Token bereits zu Vermögenswerten und Umsatzeinheiten geworden sind. Die Genialität dieser Aussage liegt darin, dass er heimlich das Subjekt wechselte.

Der Token - Verbrauch ist in den Bilanzen normaler Unternehmen eindeutig eine Kostenposition, eine Ausgabe, für die die Finanzabteilung nachfragt, ob das Geld gut investiert wurde.

Nur in den Bilanzen der Hersteller auf der Oberseite der Wertschöpfungskette sind die Token tatsächlich Vermögenswerte: Je mehr Tokens, desto mehr Inference; je mehr Inference, desto mehr müssen Huang's GPUs, Netzwerke und Flüssigkeitskühlungen verkauft werden. Auch in den Bilanzen von Anthropic sind die Token Vermögenswerte: Je mehr Agenten ein Unternehmen ausführt, desto mehr Umsatz und Profitabilität erzielt Anthropic.

Aber in den Bilanzen der Unternehmen auf der Unterseite der Wertschöpfungskette sind die Token zunächst Kosten. Kosten können natürlich gemacht werden, aber nur wenn sie kürzere Prozesse, weniger Nacharbeiten und bessere Leistungserbringung bewirken, haben sie das Recht, als Vermögenswerte bezeichnet zu werden. Wenn die Tokens nur für die Rangliste und den Beweis der Fortschrittlichkeit verbrannt werden, ist das nur teurer Formalismus.

Das Schlachtfeld der KI - Effizienzsteigerung liegt nicht in der Token - Rangliste.

Natürlich soll man nicht zum Konservatismus zurückkehren, sonst wäre die Investition in die KI sinnlos. Das Problem ist, dass viele Unternehmen die Umsetzung der KI zu oberflächlich verstehen.

Sie denken, dass es genügt, den Mitarbeitern Zugang zu geben, um die KI - Transformation umzusetzen; dass eine hohe Nutzungsrate Fortschritt für die Organisation bedeutet; dass ein hoher Token - Verbrauch eine tiefe KI - Nutzung darstellt.

Der Chief Operating Officer (COO) von Uber, der als Erster in diese "Transformation" gestartet ist, hat nach seiner radikalen Vorgehensweise eingesehen: Wir haben zwar etwas mehr Code ausgeliefert, aber es ist schwierig, dies mit "der Entwicklung nützlicher Funktionen für die Benutzer" in Verbindung zu bringen.

Dies ist kein Einzelfall. Die Code - Analysefirma GitClear hat 220 Millionen Codezeilen untersucht und festgestellt, dass nach der KI - Unterstützung der Anteil an Code, der innerhalb von zwei Wochen nach der Fertigstellung erneut bearbeitet werden muss, um das 9 - fache gestiegen ist; der Anteil an kopiertem und wiederholtem Code hat sich um das 8 - fache erhöht. Oft ersetzen Unternehmen nur die ineffizienten Aspekte des Menschen durch ineffiziente Modelle, die aber teurer sind.

Die echte Effizienzsteigerung durch KI in der Organisation findet nicht in der Token - Rangliste statt, sondern in den tiefen Ebenen des Geschäfts. Das Schwierigste bei der Umsetzung der KI in Unternehmen ist nicht, den Mitarbeitern Zugang zu geben, sondern das Modell in den Arbeitsfluss zu integrieren.

Deshalb rekrutieren OpenAI und Anthropic derzeit mit hohen Löhnen Forward - Deployed Engineer (Vorwärts - Deployierte Ingenieure), um in die Kundenbetriebe einzudringen, die Prozesse zu analysieren, die Zugangsberechtigungen zu verwalten und die Integration durchzuführen - denn sie haben auch erkannt, dass eine reine API - Bereitstellung nicht ausreicht, um die KI tatsächlich umzusetzen.

Die Unternehmen auf der Oberseite der Wertschöpfungskette werden natürlich weiterhin die Geschichte der Tokens erzählen, aber das ist schließlich die Wachstumsgeschichte anderer. Wenn normale Unternehmen nicht zuerst ihre eigenen Geschäftsprobleme und Prozessstrukturen klären, sondern eilig die Geschichte anderer in ihre KPIs aufnehmen, werden sie schließlich nur Nebenrollen in den Bilanzen anderer Unternehmen spielen.

Ihr Unfall ist jemand anderes Umsatz. Es ist keine Leistung, Tokens zu verbrennen. Die Fähigkeit, zu erklären, "wo sich die Organisation durch diese Ausgabe verbessert hat", ist es.

Dieser Artikel stammt aus dem WeChat - Account

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Nachdem fünfhundert Millionen US-Dollar im Januar verbrannt wurden, kam man zu Besinnung: Tokens als KPIs zu behandeln ist die teuerste Falle bei der AI-Umstellung. Amazon hat die Rangliste in aller Eile entfernt.

Warum ist die Token - Rechnung so außer Kontrolle geraten?

Amazon macht den ersten Schritt

Ihre Kosten: Huang's Vermögen