Ihre KI: Berechnung nach "Wörtern"

Tokens sind zur „Währung“ der KI-Zeit geworden.

"Tokens sind zur 'Währung' der KI - Ära geworden. Sowohl die Interaktion zwischen Menschen und KI als auch die Zusammenarbeit zwischen KIs werden um den Token als zentrales Medium herum abgeschlossen." Während der Jahrestagung des Zhongguancun - Forums 2026 sagte ein zuständiger Techniker von Moore Threads gegenüber China News Service.

Mit der Iteration der Rechenleistungsinfrastruktur und dem Ausbruch der Anwendungen von KI - Agenten ist "Token", als Maßeinheit für die KI - Informationsverarbeitung, zum Schlüsselwort dieses Zhongguancun - Forums geworden.

Von der Konzeptphase zur Umsetzung

Am 25. März gab die Nationale Kommission für die Bestimmung von wissenschaftlichen und technischen Begriffen eine Ankündigung heraus, in der der chinesische Name von "Token" als "Wortelement" festgelegt wurde und es für die öffentliche Probeverwendung veröffentlicht wurde.

"Alle großen Modelle verwenden Token als Maßeinheit. Token ist die zentrale Maßeinheit der KI." sagte Lin Songtao, Vizepräsident der Topbrand Information Technology Co., Ltd., gegenüber China News Service. Genau wie man für den Stromverbrauch in Kilowattstunden bezahlt, ist Token die "Kilowattstunde" in der KI. Durch die Nutzung von Energie wie Strom wird schließlich Token - Output erzeugt.

Seit Anfang dieses Jahres sind KI - Agenten wie OpenClaw (im Folgenden "Lobster") extrem beliebt geworden, und der Bedarf an Wortelementen hat rapide zugenommen. Laut Daten der Nationalen Datenbehörde betrug der tägliche durchschnittliche Token - Aufruf in China Anfang 2024 100 Milliarden; bis Ende 2025 stieg er auf 100 Billionen. Im März dieses Jahres hat er die Marke von 140 Billionen überschritten, was einer Steigerung um über tausend Mal in zwei Jahren entspricht.

Laut Daten der Drittanbieter - Plattform OpenRouter für die Aggregation von KI - Modellen hat OpenClaw in der Woche vom 9. bis 15. März 2026 20 % des gesamten Token - Verbrauchs auf der Plattform beigetragen. Der wöchentliche Token - Verbrauch von OpenClaw entspricht 60 % des durchschnittlichen wöchentlichen Token - Verbrauchs der gesamten Plattform im vierten Quartal 2025.

"Der Aufstieg von Lobster hat die Umstellung des Nutzungsmusters der KI - Rechenleistung weiter vorangetrieben. Jetzt liegt der Schwerpunkt auf der Inferenz und den Dienstleistungen, und die Token werden sehr standardisiert." sagte Li Bin, Senior - Vizepräsident von Sugon. Diese Veränderung rührt von der Umstellung des Nutzungsmusters der KI - Rechenleistung her. Die Rechenleistungsinfrastruktur, die die Entwicklung der KI unterstützt, wandelt sich allmählich von einer Rechenleistungswerkstatt in eine Token - Fabrik.

Nach Ansicht von Zhou Hongyi, Gründer der 360 Group, ist Token die digitale Energie der KI - Ära und das Maßelement für die Umwandlung von Rechenleistung in Intelligenz. Es gehört zusammen mit Strom und Rechenleistung zum Kern der KI - Infrastruktur. Er wies darauf hin, dass die Rechenleistung die Produktionsbasis für Token ist, insbesondere die Inferenzrechenleistung der Schlüssel für den Token - Verbrauch ist, und dass der Ausbruch von Token wiederum die Aufrüstung der Rechenleistung erzwingen wird. "Im Wesentlichen ist der Wettlauf um Token ein Wettlauf um Rechenleistung, und im Grunde ein Wettlauf um Strom und Energieeffizienz." sagte er.

Zhou Hongyi sagte gegenüber China News Service, dass der Boom von Anwendungen wie Lobster ein markantes Ereignis für die Umsetzung der Token - Ökonomie aus dem Konzept ist. "Lobster hat die Benutzer daran gewöhnt, für die Nutzung zu bezahlen, und Token von einem branchenspezifischen technischen Indikator zu einem von den Endbenutzern wahrnehmbaren Wertträger gemacht." Er meint, dass der aktuelle tägliche durchschnittliche Token - Verbrauch von 140 Billionen nur der Ausbruchspunkt ist und dass es noch lange nicht zu einer unternehmensweiten massenhaften Anwendung kommt. Die starke Inferenzfähigkeit von L5 - KI - Agenten wie Lobster wird den Token - Verbrauch in einen exponentiellen Wachstumspfad bringen.

Zhou Hongyi wies ferner darauf hin, dass derzeit die Geschäftslogik der KI neu strukturiert wird und ihr Geschäftsmodell sich möglicherweise zur "nach Bedarf bezahlbaren" Token - Ökonomie wandeln wird. "Von der Traffic - Ökonomie in der Internet - Ära zur Token - Ökonomie in der Agent - Ära liegt eine qualitative Veränderung der zugrunde liegenden Logik zugrunde. Die Traffic - Ökonomie ist eine Aufmerksamkeitsekonomie, bei der die Grenzkosten gegen Null gehen und keine neue Produktivität geschaffen wird. Die Token - Ökonomie ist eine Bewertung der Produktivität, die von Rechenleistung, Chips und Strom getragen wird. Je mehr Benutzer es gibt, desto höher ist der Verbrauch und die Kosten." sagte er.

Auf der offiziellen Homepage von Volcengine ist angegeben, dass die Abrechnungsarten für das KI - Audio - Video - Interaktions - Paket Tokens sowohl die Abrechnung nach der tatsächlich verbrauchten Anzahl von Tokens als auch die Vorauszahlung eines Ressourcenpakets umfassen. Dabei beträgt der Preis pro Million Tokens bei der Abrechnung nach der tatsächlich verbrauchten Anzahl von Tokens 12 Yuan. Auf der offiziellen Homepage von Huawei Cloud ist angegeben, dass die Preise je nach Modellversion variieren. Bei der Vorauszahlung eines Pakets kostet 1 Million Tokens zwischen 2,2 und 5,6 Yuan für einen Monat, und 1 Milliarde Tokens zwischen 2.199 und 5.598 Yuan für drei Monate.

Wie kann man damit Geld verdienen?

Bei der Diskussion über die Kommerzialisierung der KI meint Wang Ai, Chief Marketing Officer von Honor Embodied Intelligence, dass Agenten zu einer neuen Produktivitätsquelle werden. Agenten erzeugen während der Nutzung eine große Anzahl von Tokens, und es könnte in Zukunft ein geschlossener KI - Geschäftszyklus auf der Grundlage von Tokens geben. "Genau wie man für die Nutzung von Wasser und Strom in Kilowattstunden oder Kubikmetern bezahlt, wird die KI nach Tokens abgerechnet. Je nach Modell mit unterschiedlichen Fähigkeiten variieren auch die Kosten." sagte er.

"Die Erzeugung von Tokens erfordert Rechenleistung, aber es gibt jetzt mehr Bewertungsdimensionen und - kriterien. Früher war die Rechenleistung eines Rechenleistungssystems ein Bewertungskriterium. In Zukunft wird die Frage, wie man Token wirtschaftlicher erzeugen kann, zum Bewertungskriterium." sagte Li Bin, Senior - Vizepräsident von Sugon, während der Jahrestagung des Zhongguancun - Forums 2026 gegenüber China News Service.

Li Bin sagte, dass aus der Perspektive der Benutzererfahrung der Kern von Token die Reaktionsgeschwindigkeit ist, d. h. ob man nach der Eingabe einer Frage in kurzer Zeit eine Rückmeldung erhält. Aus der Sicht des Rechenleistungsbetreibers muss man jedoch berücksichtigen, wie viele Benutzer gleichzeitig auf Token zugreifen können und dass die grundlegende Benutzererfahrung auch unter Hochlastbedingungen gewährleistet bleibt.

Zhou Hongyi meint, dass es zwei Wege gibt, um über Token Einnahmen zu erzielen. Allgemeine Tokens folgen der Massenmarktsstrategie und erzielen hohe Umsätze mit geringen Margen, ähnlich wie Wasser und Strom als Basisdienstleistungen. Tokens für vertikale Szenarien und hochwertige Aufgaben hingegen bilden hohe Margen aufgrund von technologischen und szenariobasierten Barrieren, wie in den Bereichen Sicherheit und Industrie. 'Der Kern besteht darin, den Wert von Token zu erhöhen, auf der Grundlage von Massenproduktion aufzubauen und durch technologische Prämien zusätzliche Einnahmen zu erzielen.'

Nach Ansicht des zuständigen Technikers von Moore Threads liegt der Kern der Token - Ökonomie in der Kooperationseffizienz zwischen Menschen und KI sowie zwischen KIs. Der zentrale geschlossene Geschäftszyklus besteht in der Token - Produktion pro Kosten.

"Wir sollten nicht nur die Anzahl der Tokens anstreben, sondern auf die Kosteneffizienz achten. Wir müssen genau, schnell, stabil und sicher rechnen können und gleichzeitig die Token - Kosten so niedrig wie möglich halten. Dies ist der Schlüssel dafür, dass die Rechenleistung nutzbar und gut funktioniert." Der Techniker wies darauf hin, dass mit dem Beginn der Anwendungsära von KI - Agenten der Anstieg des Bedarfs an Inferenzrechenleistung viel höher ist als der an Trainingsrechenleistung.

Es ist erwähnenswert, dass die Massenproduktion der Token - Ökonomie auf der Rechenleistung als Basisstütze beruht. He Shuibing, Vizepräsident des Zhijiang - Labors, wies darauf hin, dass die Erweiterung des Rechenleistungsskalas nicht automatisch eine gleichzeitige Steigerung der Token - Produktionsfähigkeit bedeutet. "Probleme wie Scheduling - Engpässe, Engpässe in der Kommunikation und Speicherleistung beeinträchtigen die Effizienz der Rechenleistungserfassung und senken die Token - Produktionsrate pro Rechenleistungseinheit." Er nahm das Beispiel eines H100 - Clusters mit einer Million Grafikkarten: "Die jährlichen Rechenleistungskosten betragen etwa 1,2 Milliarden Yuan. Wenn die Rechenleistungsnutzung um 10 % verschlechtert ist, beträgt der direkte wirtschaftliche Verlust im Jahr über 120 Millionen Yuan."

Xia Lixue, Mitbegründer und CEO von Wuwen Xinqiong, sagte auf dem AI - Open - Source - Frontiers - Forum, dass die derzeitige Entwicklung der KI noch in einem langfristigen Fortschrittsprozess ist und ihre Lebenskraft davon abhängt, ob ein nachhaltiges Token - Lieferungssystem aufgebaut werden kann. Aus infrastruktureller Sicht sind die Ressourcen begrenzt. Aus der Perspektive einer "Token - Fabrik" ist die Frage, ob Token kontinuierlich, stabil und in großer Menge bereitgestellt werden können, damit Spitzenmodelle tatsächlich langfristig für mehr downstream - Szenarien eingesetzt werden können, ein Schlüsselproblem.

Luo Fuli, Leiter des Xiaomi - Big - Model - Teams, sagte auf dem AI - Open - Source - Frontiers - Forum, dass aufgrund des rapiden Fortschritts der Big - Modelle und der Unterstützung des Agent - Frameworks die Anzahl der Tokens im Jahr 2026 um das 100 - fache ansteigen könnte.

Li Bin meint, dass mit dem explosionsartigen Anstieg des Token - Verbrauchs der Bedarf an Rechenleistung kontinuierlich steigen wird. Seit OpenClaw hat der Token - Verbrauch exponentiell zugenommen. Nach der Standardisierung der Rechenleistungserfassung ist das Wachstumspotenzial des Bedarfs unbegrenzt. Früher mussten Benutzer hohe Hürden überwinden, um Rechenleistung zu nutzen. Jetzt dient der KI - Agent als Schnittstelle, und die flexiblen Standard - Superknoten senken die Nutzungsbarriere weiter. Das zukünftige Wachstumspotenzial der Rechenleistung ist enorm.

Dieser Artikel stammt aus dem WeChat - Account "China News Service" (ID: jwview) , Autor: Zhou Yihang, Xie Jingwen. Veröffentlicht von 36Kr mit Genehmigung.

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Ihre KI wird nach "Wörtern" berechnet.

Von der Konzeptphase zur Umsetzung

Wie kann man damit Geld verdienen?