StartseiteArtikel

Jensen Huang, startet die Token-Ära

新智元2026-03-20 16:38
Die jährliche Token-Nutzung von globalen Large Language Models hat die 100 Billionen überschritten, und die KI ist in die Ära der Token-Ökonomie eingetreten.

【Einführung】Heute hat das globale Großmodell das Zeitalter der Billionen von Tokens betreten! Nur auf der Plattform OpenRouter beläuft sich die geschätzte jährliche Infrastrukturausgabe für die Inferenz auf ungefähr 1 Milliarde US-Dollar, wenn man bei ungefähr 1 US-Dollar pro Million Tokens rechnet! Die von Jensen Huang auf der GTC-Konferenz vorgeschlagene „Token-Ökonomie“ hat in den letzten Tagen das Internet in Sturm gesetzt. Tokens sind zur neuen Maßeinheit der KI-Zeit geworden!

Im März 2026 wurde eine Zahl geboren, die Silicon Valley und Wall Street wach halten wird –

Gerade jetzt hat das globale Großmodell das Zeitalter der Billionen von Tokens betreten!

OpenRouter hat angekündigt, dass der jährliche Token-Verbrauch die Billionen-Marke überschritten hat.

Eine Billionen ist keine astronomische Beobachtungsdaten und auch nicht das BIP eines Landes, sondern nur der jährliche Token-Durchsatz einer KI-Modell-Aggregationsplattform.

Wenn Sie sich diese Zahl nicht vorstellen können, können wir es anders berechnen:

Nach dem derzeitigen Durchschnittspreis von etwa 1 US-Dollar pro Million Tokens auf dem Markt beläuft sich die Inferenzausgabe hinter einem Aggregator allein auf 1 Milliarde US-Dollar.

Eine Plattform hat bereits 1 Milliarde US-Dollar an echten Geldern generiert. Die globalen Rechenleistungskosten haben ein neues Stadium erreicht.

Ja, Tokens werden zur Öl dieser Zeit.

Heute dringt die KI wie Strom über API-Schnittstellen in jeden Code und jede E-Mail ein und beeinflusst fast jeden Menschen auf der Welt.

Wenn man sagt, dass das Jahr 2023 das Jahr der Modellerwachen war, dann stehen wir heute im Jahr 2026 vor der Zahl 1.000.000.000.000.000.

Dies ist die größte geistige Überschwemmung in der Geschichte der menschlichen Zivilisation.

Während die Menschen noch darüber diskutieren, ob die KI eine Blase ist, haben diese 15 Nullen wie ein Tsunami alle Skeptiker überwältigt!

Zwei Tage vor der Veröffentlichung dieser Zahl hat Jensen Huang auf der Bühne der GTC 2026 in einem fast zweistündigen Vortrag das Wort Token mehr als 70 Mal erwähnt.

Token ist der Ankerpunkt und die Hauptlinie des gesamten Vortrags.

Jensen Huang hat tatsächlich eine neue wirtschaftliche Grundlage für eine neue Ära benannt. Er hat ihr den Namen „Token-Ökonomie“ gegeben.

In den folgenden wenigen Tagen haben die Konzepte von „Token-Engineering“ und „Token-Ökonomie“ sofort das Internet in Sturm gesetzt!

Nvidia hat die Token-Ökonomie geschaffen

Was genau sind Tokens?

Nach Jensen Huangs Ansicht ist ein Token nicht nur ein technischer Begriff, sondern auch eine Rechenleistungseinheit, eine Informationseinheit und eine Währungseinheit.

Tokens sind zu einem großen Geschäft geworden. Jensens Huang Urteil enthüllt direkt die zugrunde liegende Logik der KI-Branche –

Tokens sind das zentrale wirtschaftliche Maßstab der KI-Zeit!

Davon ausgehend könnte die Betriebsregel der globalen KI-Branche neu gestaltet werden.

Tokens sind Informationseinheiten und die kleinsten Einheiten des KI-Denkens.

Schematische Darstellung von Tokens

Von einem einfachen Chat bis hin zur Erstellung eines filmreifen KI-Videos und zur Schulung und Inferenz von Unternehmensmodellen werden alle von der KI verarbeiteten Informationen in Tokens gemessen.

Es ist das Atom des KI-„Denkens“ und die grundlegendste Maßeinheit der KI-Wirtschaft.

Rechenleistungseinheit, ein neues Produkt der Rechenzentren

Auf der GTC hat Jensen Huang offiziell das Konzept der „Token-Fabrik“ vorgeschlagen:

In Zukunft werden die Rechenzentren nicht mehr Daten speichern oder Software ausführen, sondern Tokens produzieren.

Die Anzahl der Tokens, die Sie produzieren können, bestimmt, wie viel Geld Sie verdienen können.

Allerdings ist die Leistung eine harte Beschränkung. Ein Rechenzentrum mit 1 Gigawatt Leistung hat eben 1 Gigawatt, und die physikalischen Gesetze sind unnachgiebig.

Somit ist der Kern der gegenwärtigen Konkurrenz, wer bei demselben Strompreis den höchsten Token-Durchsatz pro Watt und die niedrigsten Produktionskosten hat.

Dies ist eigentlich genau wie bei der traditionellen Fertigungsindustrie – auf derselben Produktionslinie gewinnt der, der die höchste Ausbeute hat. Nur hat sich das „Produkt“ von Chips zu Tokens gewandelt.

Jensen Huang hat auf der Bühne die gestaffelten Token-Preise angekündigt:

Niedriges Niveau: ca. 1 US-Dollar pro Million Tokens, mittleres Niveau: 3 bis 6 US-Dollar, hohes technisches Niveau: 45 US-Dollar, Echtzeit-Interaktionsniveau: 150 US-Dollar pro Million Tokens.

Der Preisunterschied beträgt das 150-fache. Geschwindigkeit und Qualität bestimmen den Preis.

Die auf der Bühne von Jensen Huang gezeigte Evolutionskurve ist sehr klar: Durch die perfekte Hardware-Software-Kooperation wird die Kosten pro Generation drastisch gesenkt.

Der Grace Blackwell erreicht bei jedem Preisniveau einen 35-fachen höheren Durchsatz als der Hopper. Der neue Vera Rubin verdoppelt diesen Wert nochmal um das 5-fache, und nach der ersten Integration der Groq LPU steigt der Durchsatz im Superniveau noch um das 35-fache.

In nur zwei Jahren ist die Token-Generationsrate von 2 Millionen auf 700 Millionen gestiegen, ein epischer Sprung um das 350-fache.

Wenn die Kosten um eine Größenordnung sinken, kann der Verbrauch um eine Größenordnung steigen.

Währungseinheit, ein neues Gehaltselement in der Gehaltsabrechnung

Dies ist der aufregendste Teil und auch der Teil, der Jensen Huangs GTC-Vortrag in die Öffentlichkeit katapultiert hat.

Wer hätte gedacht, dass 2024, als ChatGPT Pro ein Abonnement für 200 US-Dollar pro Monat anbot, die Leute sich fragten, „Wer wird so viel Geld für eine KI-Abonnement ausgeben?“

Heute hat die Token-Konsumrate sich von „schmerzhaft“ zu „ängstlich“ entwickelt.

Jensen Huang hat auf der Bühne angekündigt:

In Zukunft wird jeder Nvidia-Ingenieur ein jährliches Token-Budget benötigen.

Zusätzlich zu einem Basisgehalt von mehreren hunderttausend US-Dollar werde ich ihm noch etwa die Hälfte des Wertes in Tokens geben, um die Effizienz um das 10-fache zu erhöhen.

Darüber hinaus wird das Token-Budget auch zu einem neuen Rekrutierungsargument in Silicon Valley. Bei einem Vorstellungsgespräch wird der Ingenieur fragen: Wie viel Token beinhaltet mein Angebot?

Früher wechselte man wegen Aktien und RSU, jetzt muss man auch darauf achten, ob das Unternehmen Token zur Verfügung stellt. Das Token-Budget wird von einer IT-Ausgabe zu einer Personalausgabe.

Der größte Faktor, der all dies vorantreibt, ist der Agent.

Im Januar dieses Jahres hat der OpenClaw die gesamte Agenten-Branche in Schwung gebracht.

Ein OpenClaw mit Claude Opus 4.6 verbraucht bereits nach wenigen Gesprächsrunden hunderte von Yuan.

Jensen Huang sieht jedoch die andere Seite.

Agenten benötigen Tokens, um zu laufen. Tokens zu kaufen, bedeutet, Rechenleistung zu kaufen, und Rechenleistung zu kaufen, erfordert ein Budget.

Somit erscheint das Token-Budget in den Unternehmensbilanzen.

Jedes SaaS-Unternehmen wird zu einem AaaS-Unternehmen – Agentic as a Service.

Die Inferenzdienstleister erweitern ihre Kapazität, die Cloud-Anbieter bauen Token-Fabriken, die SaaS-Unternehmen wandeln sich in Agenten-Services um, und die Unternehmen geben ihren Mitarbeitern Token-Budgets. Vom Produktion bis zum Verbrauch ist der Kreis geschlossen.

Informationseinheit, Rechenleistungseinheit, Währungseinheit – dreifach vereint.

Tokens sind nicht mehr nur technische Parameter, sondern das zentrale wirtschaftliche Maßstab der KI-Zeit.

Ein Rechenzentrum, das Tokens produziert, ist wie ein Gelddruckerei.

Die Cloud-Anbieter treiben die „Hummerzucht“ voran, hinter der sich auch das Token-Geschäft verbirgt.

Drei Supercomputer, drei Zeitalter

Tokens müssen produziert werden, und dazu braucht man Fabriken. Tokens müssen verbraucht werden, und dazu braucht man Agenten.

Aber wenn die Fabriken nur in Rechenzentren existieren und die Agenten nur in der Cloud laufen, bleibt diese Ökonomie für immer ein Spiel der Großunternehmen.

Jensen Huang will es auf jeden Schreibtisch bringen. Seine Methode ist einfach – er liefert persönlich.

2016 wurde der erste DGX-1 an OpenAI unter der Führung von Elon Musk geschenkt.

Das Deep Learning war gerade aus dem Labor hervorgegangen, und die meisten Menschen beobachteten noch abwarten.

Jensen Huang hat darauf gewettet, dass die KI eine Zukunft hat.

2024 wurde der erste DGX H200 an OpenAI unter der Führung von Sam Altman geschenkt.

ChatGPT hat die Welt erobert, und die Skalierungsgesetze waren populär. Alle haben an Parametern und Skalen gewettet.

Jensen Huang hat darauf gewettet, dass die Ära der großen Infrastruktur für die KI-Schulung gekommen ist und die AGI in vollem Gange ist.

Am 18. März 2026, zwei Tage nach der GTC-Keynote.

Jensen Huang hat mit dem ersten globalen DGX Station GB300 an die Tür eines Labors geklopft.

Dies