StartseiteArtikel

Hat der Kryptomarkt seinen Höhepunkt erreicht und lässt sich der Token-Verbrauch nicht mehr aufrechterhalten? Dies könnte die wichtigste Grafik für den gesamten Markt sein

36氪的朋友们2026-06-10 11:39
Die marginalen Veränderungen der Token-Ausgaben beeinflussen über die Übertragungskette der Nachfrage nach GPU-Rechenleistung, DRAM-Speicher und Rechenzentren direkt die Erwartungen der Kapitalausgaben von NVIDIA, Speicherchipherstellern und Cloud-Dienstanbietern.

Das Wachstum der Token-Ausgaben zeigt Anzeichen von Schwäche, und der Kernpunkt des Marktes für KI verschiebt sich rasch von der Frage „Ist die Technologie machbar?“ hin zu „Ist die Kostenlast tragbar?“

Am 9. Juni erklärte der Makro-Strategist Andreas Steno Larsen in sozialen Medien, dass der Verlauf des Silicon Data LLM Token-Ausgabenindex die wichtigste Grafik für den gesamten Markt sei.

Der Index hat sich seit Dezember letzten Jahres mehr als verdoppelt und stieg bis Mai 2026 stark an, hat jedoch in letzter Zeit rückläufig gemacht. Andreas Steno Larsen warnte, dass, wenn die Token-Preise weiterhin schwächen, die Transaktionen von der Speichertechnologie bis hin zu einer breiteren Palette von Hardware und Rechenzentren in diesem Zyklus beendet sein könnten.

Zur gleichen Zeit bemühen sich die Tech-Riesen, den unkontrollierten KI-Rechenleistungsbedarf innerhalb ihrer Unternehmen dringend einzudämmen.

Wie Wall Street News zuvor berichtete, kürzen Amazon und Microsoft interne KI-Tools oder stoppen Projekte zur Verfolgung des Nutzungsumfangs, um das Verhalten von Mitarbeitern zu bekämpfen, das als „Tokenmaxxing“ (Maximierung der Token-Nutzung) bezeichnet wird, bei dem sie Rechenleistung unnötig verschwenden, um ihre interne Rangfolge zu verbessern.

Am Serverende wechselte GitHub Copilot am 1. Juni seine Abrechnungsweise von einer auf Anfragen basierenden Gebühr zu einer auf Token basierenden Gebühr. Dies führte dazu, dass die monatlichen Rechnungen einiger Benutzer um mehr als das Zehnfache sprangen, was zu einer breiten Skepsis auf dem Markt hinsichtlich der Nachhaltigkeit des KI-Subventionsmodells führte.

Diese Reihe von Signalen formt die Risikoeinschätzung der Anleger für KI-Infrastrukturtransaktionen neu. Die marginalen Veränderungen der Token-Ausgaben wirken sich über die Übertragungskette der GPU-Rechenleistung, des DRAM-Speichers und des Rechenzentrumbedarfs direkt auf die Kapitalausgabenvorhersagen von Nvidia, Speicherchipherstellern und Cloud-Dienstleistern aus.

01

Der Index erreicht einen Gipfel: Die Logik der Hardwaretransaktionen steht auf dem Prüfstand

Der Silicon Data LLM Token-Ausgabenindex ist ein auf Ausgaben gewichteter Indikator, der den Zahlungspreis für eine Million LLM-Token auf dem gesamten Markt misst. Er gilt als Ersatzindikator für die marginale Zahlungsbereitschaft des Marktes für KI.

Da die wichtigsten Anbieter wie OpenAI, Anthropic und Google die Kunden in der Regel nach der Token-Nutzung berechnen, binden die Token-Ausgaben die KI-Nutzung direkt an die Nachfrage nach GPU, DRAM und Rechenzentren.

Das jüngste Stagnieren des Index hat in den Kapitalmärkten Sorgen um den Hardware-Zyklus ausgelöst. Kommentare von Silicon Data weisen darauf hin, dass der jüngste Rückgang möglicherweise darauf hindeutet, dass die Migration zu hochwertigen, closed-source-Modellen verlangsamt. Wenn die Token-Ausgaben weiterhin schwach bleiben, wird das marginale Einkommen, das für den Kauf von zusätzlichen GPUs, DRAM und Rechenzentren zur Verfügung steht, schwächer werden. Dies wird die Risikolage von Unternehmen ändern, die ihre Kapitalausgabenpläne auf das Token-getriebene Wachstum ausgerichtet haben.

Obwohl ein einziger Rückgang keine absolute Tendenz darstellt, deutet diese Datenlage als führender Indikator für den Hardware-Zyklus darauf hin, dass die Abhängigkeit der Unternehmen von hochkostspieligen, fortschrittlichen Modellen möglicherweise einem systemischen Rückgang unterliegt.

02

Die Rechnungskrise: Tech-Riesen stoppen „unsinnigen Verbrauch“

Die Unternehmens-KI-Boomphase erlebt erstmals eine echte Rechnungskrise.

Laut einer Nachricht von Axios, die auf einen KI-Berater zurückgeht, hat ein Unternehmenskunde dieses Beratungsunternehmens kürzlich in einem einzigen Monat 500 Millionen US-Dollar für Claude ausgegeben, einfach weil keine Obergrenze für die Mitarbeiter-Nutzung festgelegt wurde.

In Unternehmen selbst hat sich die Praxis, die KI-Nutzung als Bewertungsmaßstab zu verwenden, auch gegen die Unternehmen selbst gewendet. Berichten zufolge hatte die von Amazon betriebene Entwicklerplattform Kiro einst eine interne Rangliste namens „Kirorank“. Ähnliche Versuche, die Token-Nutzung zu erhöhen, um eine bessere Platzierung in der Rangliste zu erreichen, traten auch bei Meta auf.

Dave Treadwell, Senior-Vizepräsident von Amazon, gab zu, dass Mitarbeiter die Betriebskosten des Unternehmens erhöht hätten, indem sie die KI zu sinnlosen Aufgaben eingesetzt hätten, um in der Rangliste besser zu platzieren. Er wies die Mitarbeiter eindeutig darauf hin, „nicht nur für den KI-Einsatz KI einzusetzen“. Das Testdashboard wurde daraufhin offline genommen. Amazon hat sich jetzt zu einem „normalisierten Einsatz“-Indikator statt der Token-Nutzung gewandt, um den tatsächlichen Wert des von der KI generierten Codes zu verfolgen.

03

Preisrückgang: Das Ende der Subventionszeit

An der Angebotsseite nähert sich das Geschäftsmodell der KI-Branche, das lange Zeit Wachstum durch Subventionen erzielt hat, seine Grenzen.

Am 1. Juni wechselte GitHub Copilot offiziell zur Abrechnung nach Token-Nutzung. Ein Nutzer teilte in der Reddit-Community mit, dass seine monatlichen Kosten von weniger als 45 US-Dollar auf über 847 US-Dollar steigen würden.

Mario Rodriguez, Chefproduktmanager von GitHub, erklärte zuvor, dass das alte Preis-Modell mit dem Aufkommen der Agenten-KI nicht mehr haltbar sei. Arun Chandrasekaran, Analyst bei Gartner, sagte in einem Interview mit Business Insider, dass mit dem Anstieg des Rechenleistungsbedarfs durch fortschrittliche Inferenzmodelle mehr Unternehmen zur Abrechnung nach Nutzung übergehen würden.

Der Investor Tommy Shaughnessy warnte vor den systemischen Risiken dieses Subventionsmodells. Er wies darauf hin, dass die Gewinnmarge der großen KI-Unternehmen derzeit stark negativ sei. Sobald die Unternehmen mit den echten Preisen nach Nutzung konfrontiert würden, würde der tatsächliche Verbrauchsmarsch viel schneller als erwartet sein. Beispielsweise habe Uber 2026 sein gesamtes Jahresbudget für KI in nur vier Monaten aufgebraucht. Wenn die Anleger an den Ertragserwartungen zweifeln würden, würde die Kapitalströmung, die den Kauf von GPUs und das Modelltraining stützt, umkehren.

04

Kostenumstellung: Günstige Modelle könnten den Markt dominieren

Angesichts der hohen Inferenzkosten sucht der Markt nach kostengünstigen Alternativen.

Rich Privorotsky, Leiter der One-Delta-Abteilung von Goldman Sachs, meint, dass mit der Preissenkung von DeepSeek um 75 % und der nahezu 99%igen Preisreduktion von Xiaomi MiMo die Lockerung der Infrastrukturengpässe einen Preisvergleich auslöst.

Wie Wall Street News zuvor berichtete, sagt Brian Armstrong, Chefexecutiv von Coinbase, voraus, dass 80 % der KI-Arbeitslast innerhalb von 12 bis 18 Monaten auf Modelle mit 99 % geringeren Kosten umgestellt werden wird, und nur 20 % der Aufgaben, die extrem hohe Intelligenz erfordern, auf den fortschrittlichen Modellen verbleiben werden. Er weist darauf hin, dass Energie und Rechenleistung der echte Engpass werden werden.

Clement Delangue, Chefexecutiv von Hugging Face, stützt diese Tendenz mit Daten der Stanford University: Die Genauigkeit lokaler Modelle bei realen Abfragen hat auf 71,3 % gestiegen, und die Kosten sind extrem niedrig. Ali Ansari, Chefexecutiv von Micro1, sieht dies als eine „gesunde Verschiebung“ von übermäßiger Nutzung hin zu rationaler Nutzung.

Was die tatsächlichen Renditen von KI-Investitionen betrifft, besteht auf der Wall Street derzeit ein starker Dissens. Laut der Einschätzung von Jim Schneider von Goldman Sachs wird die Agenten-KI bis 2030 den Token-Verbrauch um das 24-fache steigern, und die Bruttomarge der Cloud-Dienstleister wird kurzfristig positiv werden. Die wirtschaftliche Forschung von JPMorgan zeigt ebenfalls, dass das Sprungwachstum von Python-Paketen auf PyPI einen Anstieg der realen Produktivität beweist.

Die Anhänger der Kurskampfes sind jedoch ebenso entschieden. Jim Covello, Halbleiteranalyst von Goldman Sachs, schreibt in einem Bericht, dass der gegenwärtige Aufschwung der Wertschöpfungskette auf Kosten des Verbrauchs in der Oberstufe geht. Fast der gesamte Wert fließt in die Halbleiterunternehmen, und diese Situation ist nicht nachhaltig.

Josh Pantony, Chefexecutiv von Boosted.ai, betont, dass die Bedenken der Unternehmen hinsichtlich der Offenlegung von Daten die Effektivität von KI-Agenten schwächen. Unter Berücksichtigung von Kosten, Renditen und Sicherheit wird der tatsächliche Wert der nächsten KI-Rechnung das endgültige Urteil des Marktes über diese Technologieinvestition sein.

Dieser Artikel stammt aus dem WeChat-Account „Wall Street News“, Autor: Ye Zhen. 36Kr hat die Veröffentlichung mit Genehmigung erhalten.