Token von Großtechnologieunternehmen: Nicht mehr "in ausreichender Menge verfügbar" - Tencent startet Mengenbegrenzungen, ByteDance erstattet teilweise Kosten

Wenn Token Kosten und Produktionskapazität miteinander verbinden, wie sollten Unternehmen die Kontingente festlegen und verteilen? Die großen Technologieunternehmen suchen noch nach einer Antwort.

Ab Juni bemerkte ein Tencent-Mitarbeiter, dass der ihm zugewiesene Token (Worteinheit)-Kontingent auf der internen Verwaltungsübersicht geringer war. "Früher hatte ich einen Monatskontingent von 2.000 US-Dollar (etwa 13.500 Yuan), diesen Monat nur 1.400 Yuan, und es war in zwei Tagen verbraucht."

Laut unvollständigen Statistiken der Economic Observer variiert derzeit das monatliche durchschnittliche Token-Kontingent von Mitarbeitern verschiedener Abteilungen bei Tencent stark, von 1.000 bis 7.000 Yuan. Nachdem das Token-Kontingent an die Gruppen verteilt wurde, wird es von den Gruppenleitern an die einzelnen Mitarbeiter weiterverteilt. Wenn das Kontingent nicht ausreicht, können die Mitarbeiter den Leitern "die Hand heben", um das Kontingent zu erhöhen.

Bei den Mitarbeiter-Tokens gibt es derzeit bei den großen chinesischen Unternehmen hauptsächlich zwei Verteilungsarten: Einmal wird das Kontingent direkt an die einzelnen Mitarbeiter verteilt. Bei überschrittenem Bedarf können die Mitarbeiter einen Teil der Kosten selbst tragen und später erstattet bekommen. Zweitens wird das Kontingent an die Abteilung verteilt und als Teil des Abteilungsbudgets von den Leitern innerhalb der Abteilung verteilt.

Egal, an wen und wie die Tokens verteilt werden, letztendlich geht es um das Geld, das für den Kauf von Tokens verwendet wird. Die Einbeziehung von Agenten (Intelligentien) in die Arbeit führt zu einem exponentiellen Anstieg des Token-Verbrauchs, und die Rechenleistungskosten drücken auch auf die Gewinne der großen Unternehmen. Mitte 2026 begannen weltweit führende Technologieunternehmen wie Microsoft und Meta, die unbegrenzte interne Nutzung von KI zu begrenzen, indem sie den Token-Verbrauch ihrer Mitarbeiter überwachen, beschränken und dynamisch zuweisen.

Nach der Reduzierung des Kontingents befürchten einige Mitarbeiter, dass sie wieder zur "alten Programmierweise" zurückkehren müssen. Die Mitarbeiter müssen sich mit dem Schmerz der Umstellung von Luxus auf Sparsamkeit auseinandersetzen: Sollen sie wieder manuell programmieren oder sich selbst das Kontingent erhöhen und so mit eigenen Mitteln arbeiten?

Das "Gemeinschaftsessen" ist vorbei

Tencent ist eines der ersten chinesischen Internetriesen, die das Token-Kontingent ihrer Mitarbeiter begrenzen. Laut der Economic Observer sank seit Juni das Token-Kontingent von Mitarbeitern mehrerer Geschäftsbereiche bei Tencent, und die Unterschiede zwischen den Abteilungen waren erheblich: Im Team des Huanyuan-Großmodells, das einen hohen KI-Bedarf hat, beträgt das monatliche Token-Kontingent der Mitarbeiter etwa 7.000 Yuan; im YouTu-Labor, das sich auf das Gebiet der Computervision konzentriert, beträgt es etwa 5.250 Yuan. Ein Outsourcing-Mitarbeiter aus Tencents Unterhaltungsbereich gab außerdem an, dass sein monatliches Token-Kontingent nur 1.000 Yuan betrage.

"In der Gruppe teilen wir ein gemeinsames Kontingent-Pool, und der Gruppenleiter verteilt es.", sagte der zuvor erwähnte Tencent-Mitarbeiter. "Dies ist die vorläufige Methode für diesen Monat, und es könnte im nächsten Monat noch geändert werden."

Im März dieses Jahres gab es auf der Maimai-Community die Nachricht, dass Tencent seinen Mitarbeitern "ein Token-Ressourcen-Paket im Wert von 220.000 Yuan pro Jahr pro Person" zugewiesen habe, das monatlich 700 US-Dollar Cursor-Kontingent, 700 US-Dollar Claude-Kontingent, 1.000 US-Dollar CodeBuddy-Kontingent usw. enthielte, um die Mitarbeiter zur Effizienzsteigerung durch die Nutzung von KI zu motivieren. Diese Nachricht wurde von mehreren Tencent-Mitarbeitern bestätigt.

Während der KI-Feuersbrunst nahm die Vermutung, ob der Token-Verbrauch mit dem Arbeitsengagement in Verbindung stehen könnte, immer mehr zu. Ende März schrieb ein Tencent-Mitarbeiter in der Maimai-Kollegen-Gruppe, dass einige Geschäftsbereiche den Token-Verbrauch der Abteilungen und Teams statistisch auswerteten und klassifizierten. Einige Mitarbeiter befürchteten, dass ihr Token-Verbrauch nicht ausreichend wäre, und bauten in der Arbeitszeit sinnlose Arbeitsabläufe auf, ließen Agenten Aufgaben wiederholen, bearbeiteten persönliche Anforderungen oder sogar "private Jobs", um sicherzustellen, dass ihr Token-Verbrauch nicht hinterher blieb.

Mit der Anpassung des Token-Kontingents für Mitarbeiter will Tencent das bisherige "Gemeinschaftsessen"-Modell ändern, bei dem der Token-Verbrauch als einziges Maßstab galt. Laut der Economic Observer wird Tencent 2026 weiterhin die Token-Investitionen erhöhen, aber nicht mehr nach einem einheitlichen Standard an die Mitarbeiter verteilen. Die Abteilungsleiter verteilen die Ressourcen dynamisch in Bezug auf die Arbeitsumstände. Wenn erforderlich, können die Mitarbeiter eine Erhöhung des Kontingents beantragen. Intern wird die Rangliste des Token-Verbrauchs abgelehnt, und der Token-Verbrauch wird nicht einfach als Maßstab für die Mitarbeiterleistung herangezogen.

Was passiert, wenn das Token-Kontingent überschritten wird?

Außer Tencent gibt es unterschiedliche Logiken bei der Token-Kontingent-Zuweisung bei anderen Internetriesen.

Bei Positionen mit hohem KI-Einsatz wie in der Produktentwicklung und Forschung beträgt das monatliche Kontingent von Alibaba-Mitarbeitern etwa 8.000 Yuan, ohne Modellbeschränkungen. Die Mitarbeiter sagen, dass es für die täglichen Anforderungen "im Grunde ausreicht". Mitarbeiter von JD.com können das eigene Modell unbegrenzt aufrufen, und die Kosten für den Aufruf externer Modelle werden auf die Abteilung verteilt. Ein Mitarbeiter von Meituan sagte, dass er noch keine eindeutigen Token-Kontingent-Standards gehört habe, aber beim Verwenden interner KI-Produkte öfters das Problem "des dummen Modells" habe und vermute, dass es aufgrund des hohen Aufrufvolumens auf ein Modell niedrigerer Qualität "heruntergestuft" wurde.

Bei ByteDance können die Mitarbeiter die Modelle in TRAE (ByteDance's eigenes KI-IDE-Produkt) unbegrenzt aufrufen, darunter GPT, Gemini, Grok usw. Wenn es für die Arbeit erforderlich ist, andere Modelle aufzurufen, können die entstehenden Kosten teilweise erstattet werden. In einigen Abteilungen beträgt der Erstattungsstandard 50 % der tatsächlichen Ausgaben. Das jährliche Erstattungslimit für Positionen in der Produktentwicklung und Forschung beträgt 1.000 US-Dollar, und für andere Positionen 300 US-Dollar.

Bezüglich der Zuweisung des Token-Kontingents für Mitarbeiter geben die großen Unternehmen dasselbe Signal: KI muss eingesetzt werden, aber die Tokens müssen verwaltet werden, sonst könnten die Kosten außer Kontrolle geraten.

Am 20. Mai 2026 teilte Zheng Yinhe, der Leiter des AI NPC & Gameplay-Teams der Mihoyo's "Honkai"-Serie, auf der Alibaba Cloud Summit 2026 seine Erfahrungen bei der Exploration von KI mit: Ein Mitarbeiter baute mehrere Dutzend Agenten auf, die gemeinsam arbeiteten, und verbrauchte in einer Nacht etwa 2 Millionen Yuan an Tokens.

Ein Entwickler eines KI-Start-ups sagte der Economic Observer, dass sein Team von etwa 50 Personen im vergangenen Monat etwa 200.000 US-Dollar an Token-Kosten hatte, was einem durchschnittlichen Kostenbetrag von 4.000 US-Dollar pro Person entsprach. "Die Kosten fallen hauptsächlich für die Codierung an, und Modelle mit hoher Codierungsqualität sind teuer. Der Chef hat uns gebeten, zu sparen, und wir werden in Zukunft vielleicht auf billigere Modelle umsteigen."

Anfang Juni sagte OpenAI-CEO Sam Altman in einer Live-Übertragung, dass die KI-Ausgaben bereits ein großes Problem für Unternehmen seien, und "am Anfang des Jahres waren die Leute noch sehr zufrieden mit ihren Ausgaben".

Auf billigere Modelle umsteigen oder das Kontingent selbst finanzieren

"Auf der Übersicht steht, dass man sich an den Verantwortlichen wenden kann, wenn das Token-Kontingent nicht ausreicht.", sagte ein Tencent-Mitarbeiter. Sein monatliches Token-Kontingent betrug etwa 3.000 US-Dollar, aber nach der Aktualisierung der Übersicht im Juni betrug es nur noch 5.000 Yuan. "Ich habe es in drei Tagen verbraucht. Wenn die Agenten und Subagenten laufen, geht das Kontingent sehr schnell." Also bat er seinen Vorgesetzten um eine Erhöhung des Kontingents, erhielt aber die Rückmeldung, dass das Abteilungsbudget begrenzt sei, und die Erhöhung wurde abgelehnt. "Die Obergrenzen variieren von Abteilung zu Abteilung und hängen von den Geschäftsumständen ab."

Tencents aktuelle Anpassung des Token-Kontingents betrifft hauptsächlich externe Modelle. Die Mitarbeiter können weiterhin das von Tencent selbst entwickelte Huanyuan-Großmodell unbegrenzt nutzen, was auch zu einem Anstieg der Huanyuan-Aufrufe führte. Einige Mitarbeiter sagen, dass die Arbeitsleistung nach der Rückkehr zu Huanyuan gesunken ist und die Nutzungserfahrung schlechter geworden sei. "Es gibt viele Halluzinationen, und es ist kein speziell für die Codierung entwickeltes Modell. Es ist nicht so gut wie die manuelle Codierung."

Da das Unternehmenskontingent nicht ausreicht hat, hat ein Tencent-Mitarbeiter sich entschieden, sich für das monatliche Abonnement von Codex Pro 20x im Wert von 200 US-Dollar zu entscheiden. Er hat sich die Zahlen angesehen: "Wenn ich Huanyuan nutze, dauert es sehr lange, um die grundlegenden Anforderungen zu erfüllen. Wenn es fehlschlägt, muss ich es nochmal versuchen, was Zeit verschwendet. Obwohl ich nicht gerne mit eigenen Mitteln arbeiten, ist es besser, als kein Kontingent zu haben. Der Preis ist auch noch akzeptabel."

Selbst bei ByteDance, wo das Kontingent relativ groß ist, kann man die Modelle nicht beliebig aufrufen. "Ich und die meisten meiner Kollegen nutzen GPT-5.5. Die Warteschlangen für die Modelle in der Firma sind immer lang.", sagte ein ByteDance-Entwickler. Selbst wenn das Modell im Rahmen der Unternehmenszahlungen liegt, haben einige Mitarbeiter weiterhin eigene Konten abonniert, um Verzögerungen bei der Arbeit aufgrund der Warteschlangen zu vermeiden.

Nach der Begrenzung des Kontingents ist es für die Mitarbeiter schwierig, wieder zur reinen manuellen Arbeitsweise vor der Einbeziehung von KI zurückzukehren. "Die Arbeitsbelastung ist gestiegen und hat sich nicht verringert, nur weil das Token-Kontingent verringert wurde. Und nachdem ich KI benutzt habe, finde ich es schwer, wieder zur alten Programmierweise zurückzukehren." Ein Tencent-Mitarbeiter ist derzeit von dem Problem des fehlenden Token-Kontingents geplagt.

Wenn die Tokens mit Kosten und Produktivität in Verbindung gebracht werden, wie sollten Unternehmen das Kontingent festlegen und verteilen? Die großen Unternehmen suchen noch nach der Antwort.

Dieser Artikel stammt aus dem WeChat-Account "Economic Observer", Autor: Liu Sixuan, veröffentlicht von 36Kr mit Genehmigung.

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Token von Großtechnologieunternehmen sind nicht mehr "in ausreichender Menge verfügbar": Tencent beginnt mit Mengenbegrenzungen, ByteDance erstattet teilweise Kosten.

Das "Gemeinschaftsessen" ist vorbei

Was passiert, wenn das Token-Kontingent überschritten wird?

Auf billigere Modelle umsteigen oder das Kontingent selbst finanzieren