Zha Nan gibt auf, die KI-Giganten beginnen mit der "Aufteilung der Ressourcen"
Mark Zuckerberg hat gerade zugegeben, dass die Entwicklung der Meta-AI-Agenten langsamer als erwartet verläuft.
Laut einer Meldung der Reuters sagte er auf einer internen Meta-Gesamtmitarbeiterversammlung, dass sich die Entwicklung der AI-Agent-Technologie in den letzten vier Monaten "nicht so beschleunigt hat wie wir erwartet haben" und dass die organisatorische Umstrukturierung der Firma am Jahresanfang im Zusammenhang mit der AI "noch nicht" die erwarteten Ergebnisse geliefert habe. Andererseits könnte die Kapitalausgabe von Meta in diesem Jahr bis zu 145 Milliarden US-Dollar betragen, wobei ein Großteil auf die Erweiterung der AI-Infrastruktur und der Rechenzentren geht.
Das Geld ist schon investiert, aber die Produktrücklagen sind noch ausstehend.
Fast zur gleichen Zeit berichtete die Bloomberg, dass Meta eine Cloud-Geschäftsidee vorbereitet und planst, überschüssige AI-Rechenleistung zu vermieten. Dies bringt Meta in eine heikle Position: Es war eines der aggressivsten Rechenleistungssammler in Silicon Valley, und diese Sammlungen dienten seiner eigenen aggressiven AI-Forschung und -Entwicklung. Jetzt überlegt es jedoch, seine eigene AI-Infrastruktur zur Geldverdichtung zu nutzen.
Den Weg hat schon Elon Musk gegangen. SpaceX vermietet die Rechenleistung von Colossus an Anthropic und hat mit Google ein mehrjähriges Cloud-Dienstvertrag abgeschlossen. Jetzt scheint Zuckerberg Musk nachzugehen.
Der Wettlauf um AI-Rechenleistung nimmt eine neue Wende. Früher ging es darum, wer mehr GPU's bekommen konnte. Jetzt muss man beantworten, wer diese GPU's am besten nutzen, vermieten und in Einnahmen umwandeln kann.
Zuckerberg folgt Musk?
Die Nachricht, dass Meta Rechenleistung verkaufen will, ist am 1. Juli Ortszeit bekannt geworden.
Die Bloomberg berichtet, dass Meta eine Cloud-Geschäftsidee vorbereitet und planst, überschüssige AI-Rechenleistung zu verkaufen.
Laut der Meldung ist das Projekt noch in der Entwicklung, die Strategie könnte sich noch ändern, und Meta weigerte sich, zu kommentieren. Aber die allgemeine Richtung ist klar: Meta könnte es Entwicklern ermöglichen, auf AI-Modelle wie Muse Spark zuzugreifen, die auf seiner Infrastruktur gehostet werden, und für die benötigte Rechenleistung berechnen. Gleichzeitig überlegt es, ähnlich wie CoreWeave und Nebius, direkt die Roh-AI-Rechenleistung zu vermieten.
Dies ist kein unbedeutender Schritt. Meta war lange Zeit keine Cloud-Dienstleister. Sein Kerngeschäft sind soziale Plattformen und Werbeunternehmen, und die AI-Infrastruktur diente eher internen Modellen, Empfehlungssystemen, Werbesystemen und Produktfunktionen.
Die Außenwelt begann sofort zu spekulieren: Bedeutet dies, dass Meta bereit ist, den Schwerpunkt von der Eigenentwicklung/Full-Stack-AI wegzubewegen? Sucht Meta einen realistischeren Weg, um die hohen AI-Investitionen zurückzuerlangen?
Diese Spekulationen sind nicht unbegründet. Meta hat in den letzten Jahren stark in AI investiert, aber die Geschichte der Spitzenmodelle war nicht sehr erfolgreich. Im April veröffentlichte es Muse Spark, das erste Modell eines neuen, kostspieligen AI-Teams von Meta. Es zeichnet sich durch Leichtigkeit aus, aber das wichtigere "Flaggschiff-Großmodell" taucht immer noch nicht auf.
Das Problem ist, dass das Geld schon ausgegeben wurde. In seiner ersten Quartalsbilanz erhöhte Meta die Kapitalausgabenvorhersage für 2026 auf 125 bis 145 Milliarden US-Dollar, höher als der frühere Bereich von 115 bis 135 Milliarden US-Dollar, unter anderem wegen steigender Komponentenpreise und erhöhter Kosten für Rechenzentren zur zukünftigen Rechenleistungserhöhung.
Wenn die Ausgaben für AI-Infrastruktur auf die Milliarden-Dollar-Ebene ansteigen, interessieren sich die Anleger natürlich dafür, wann diese GPU's, Rechenzentren und Strom in Einnahmen umgewandelt werden können.
Deshalb war die Reaktion des Marktes auf die Nachricht, dass Meta Rechenleistung vermieten will, sehr direkt. Nach der Meldung stieg der Meta-Aktienkurs um über 10%, was den Druck verringerte, der sich aus seiner schlechteren Performance gegenüber dem S&P 500-Index ergeben hatte. Gleichzeitig fielen die Aktien von CoreWeave und Nebius um 10,8% bzw. 12,4%.
Der direkte Vorteil für Meta, Rechenleistung zu verkaufen, ist die "Geldrückgewinnung".
Den Weg hat schon Elon Musk gegangen.
Im Mai dieses Jahres vermietete SpaceX die Rechenleistung des Memphis-Rechenzentrums Colossus an Anthropic. Anthropic sagte damals, dass es die gesamte Rechenleistung der SpaceX Colossus 1-Installation nutzen würde. Diese Anlage verfügt über mehr als 220.000 Nvidia-Prozessoren und wird Anthropic innerhalb eines Monats über 300 Megawatt zusätzlicher Kapazität bringen.
Anschließend schloss SpaceX ein mehrjähriges Cloud-Dienstvertrag mit Google ab. Laut den Dokumenten wird Google von Oktober 2026 bis Juni 2029 monatlich 920 Millionen US-Dollar an SpaceX zahlen, um die Rechenleistung von etwa 110.000 Nvidia-GPU's sowie CPU's, Arbeitsspeicher und anderen relevanten Komponenten zu erhalten.
Die Reuters berechnete, dass die beiden Rechenleistungs-Zugangsverträge von SpaceX mit Anthropic und Google zusammen etwa 26 Milliarden US-Dollar pro Jahr betragen würden; wenn beide Verträge nicht vorzeitig gekündigt werden, würde der Gesamtbetrag über 70 Milliarden US-Dollar liegen.
Elon Musk war auch einer der aggressivsten Spieler im Wettlauf um AI-Rechenleistung. Colossus diente ursprünglich der Geschichte von xAI und Grok und war eine wichtige Infrastruktur für Musks Bemühungen, OpenAI und Anthropic einzuholen. Aber bevor seine eigene AI-Geschäftsidee diese Rechenleistung vollständig nutzen konnte, vermietete SpaceX die Rechenleistung an Anthropic und Google, die an Rechenleistung hungerlicher waren und diese sofort nutzen konnten.
Wichtig ist, dass Musk die Kurzfristigkeit und Flexibilität dieser Zusammenarbeit betont.
Bezüglich der Vermietung von Colossus an Anthropic stellte er später klar, dass SpaceX zunächst einen 180-tägigen Mietvertrag abgeschlossen hatte und dass beide Seiten danach 90 Tage im Voraus kündigen konnten. Er sagte auch, dass die Kurzfristigkeit von SpaceX vorgeschlagen wurde und dass SpaceX die Rechenleistung zurückfordern könnte, wenn die Rechenleistung in Zukunft sehr knapp wird.
Dieser Satz zeigt den wahren Zweck der Rechenleistungsvermietung: Es bedeutet nicht, die Eigenentwicklung von AI aufzugeben, noch dass man sich geschlagen gibt, was die eigene AI-Geschäftsidee betrifft. Die Firma behält die Flexibilität zwischen internem Bedarf und externer Geldverdichtung. Die Rechenleistung kann zunächst an hungrigere Kunden vermietet werden, um Cashflow zu erhalten; wenn die eigenen Modelle, Produkte und Benutzerbedürfnisse aufholen, kann die Rechenleistung zurückgefordert werden.
Das gleiche Prinzip gilt auch für Meta. Es muss nicht ankündigen, dass es sich in einen Cloud-Anbieter umwandelt, noch muss es zugeben, dass die Eigenentwicklung von AI scheitert. Indem es einen Teil der überschüssigen oder vorübergehend nicht vollständig intern genutzten Rechenleistung anbietet, kann es zwei Geschichten erzählen: Intern ist die AI-Infrastruktur weiterhin Teil der zukünftigen Strategie; extern können diese Infrastrukturen bereits Einnahmen generieren.
So hat der Wettlauf um AI-Rechenleistung eine heikle Wende genommen.
In den letzten Jahren haben die Silicon Valley-Riesen um die Frage gerungen, wer schneller GPU's bekommen und größere Rechenzentren bauen konnte. Jetzt geht es darum, wer diese GPU's am besten nutzen kann. Und diese "Nutzung" kann intern oder extern erfolgen.
Zwei Extremen: Rechenleistungssurplus und -knappheit
Dass Meta und SpaceX anfangen, Rechenleistung zu vermieten, bedeutet nicht, dass die gesamte AI-Branche in einen Zustand von Rechenleistungssurplus geraten ist.
Im Gegenteil, fast zur gleichen Zeit ist die Rechenleistungsknappheit immer noch das am häufigsten auftretende Stichwort in AI-Nachrichten.
Als Anthropic im Mai dieses Jahres die Absolvierung einer 65-Milliarden-US-Dollar-H-Runde der Finanzierung ankündigte, sagte es, dass der Unternehmenswert nach der Finanzierung 965 Milliarden US-Dollar betrage und dass das Jahresumsatz bereits Anfang Mai über 47 Milliarden US-Dollar lag. Anthropic sagte, dass diese Finanzierung zur Erweiterung der Rechenleistung verwendet werden würde, um den wachsenden Bedarf von Claude zu befriedigen.
Die Reuters berichtete auch, dass Anthropic in den letzten Monaten Schwierigkeiten hatte, den Bedarf zu befriedigen und musste in Spitzenzeiten Nutzungseinschränkungen einführen und den Bedarf durch die Anregung der Benutzer, in Nichtspitzenzeiten zu nutzen, regulieren.
Die von Anthropic anschließend angekündigten Rechenleistungsabkommen verdeutlichen dieses Problem noch besser. Neben SpaceX nannte Anthropic auch andere Rechenleistungsabkommen: Ein bis zu 5 Gigawatt betragendes Abkommen mit Amazon, das bis Ende 2026 fast 1 Gigawatt neue Kapazität umfasst; ein 5-Gigawatt-Abkommen mit Google und Broadcom; eine 30-Milliarden-US-Dollar-Azure-Kapazitätszusammenarbeit mit Microsoft und Nvidia; sowie eine 50-Milliarden-US-Dollar-Investition in die US-amerikanische AI-Infrastruktur mit Fluidstack.
Für Anthropic bedeutet mehr Rechenleistung eine höhere Obergrenze für die Nutzung von Claude Code, eine größere API-Aufrufkapazität und die Möglichkeit, mehr Unternehmenskunden zu akzeptieren.
Ähnlich verhält es sich bei OpenAI. Am 29. April sagte OpenAI bei der Vorstellung des Stargate-Fortschritts, dass es, um dem wachsenden Bedarf von Verbrauchern, Unternehmen, Entwicklern und Regierungen an AI gerecht zu werden, weiterhin die Rechenleistungserweiterung vorantreiben und die neue Kapazität schneller in Betrieb nehmen würde. OpenAI erwähnte auch, dass es bei der Ankündigung des "Stargate" im Januar 2025 zugesagt hatte, bis 2029 in den USA 10 Gigawatt AI-Infrastruktur sicherzustellen; mehr als ein Jahr später wurde dieses Ziel bereits vorzeitig überschritten, wobei in den letzten 90 Tagen mehr als 3 Gigawatt hinzugekommen sind.
Man kann also nicht einfach sagen, dass die Blase der AI-Rechenleistung platziert ist. Genauer gesagt, beginnt es, zu einer Fehlverteilung der Rechenleistung zu kommen.
Einerseits gibt es Unternehmen wie Anthropic und OpenAI. Sie haben bereits klare Produktzugänge, Entwickler-Ökosysteme und Unternehmenskunden, und der Benutzerbedarf wird direkt in Token-Aufrufe, Abonnementeinnahmen und API-Rechnungen umgewandelt.
Für sie bedeutet mehr Rechenleistung, dass sie mehr Bedarf bewältigen und die Einnahmenobergrenze höher ist.
Andererseits gibt es Spieler wie Meta und xAI/SpaceX. Sie sind ebenfalls die aggressivsten Sammler von AI-Rechenleistung, aber ihre eigenen AI-Produkte und geschlossenen Geschäftsabläufe sind noch nicht in dem gleichen Maße validiert.
Meta hat Meta AI, AI-Brillen, AI-Funktionen in Instagram und WhatsApp sowie neue Modelle wie Muse Spark. xAI hat Grok und das Musk-Ökosystem. Aber im Vergleich zu dem Wachstum, das Anthropic mit Claude Code, API und Unternehmenskunden erzielt hat, haben die AI-Investitionen von Meta und xAI noch keinen ebenso klaren Einnahmenkreislauf geschaffen.
Im Moment sind diejenigen, die am meisten an Rechenleistung bedürfen, nicht unbedingt diejenigen, die am frühesten und aggressivsten Rechenleistung gesammelt haben.
Rechenleistungsknappheit und -surplus treten gleichzeitig auf. Die Unternehmen, die wirklich Rechenleistung in Einnahmen umwandeln können, haben immer noch einen Mangel an Rechenleistung, während diejenigen, die die Rechenleistung zuerst aufgebaut haben, aber deren interner Produktbedarf noch nicht vollständig freigesetzt ist, beginnen, die Rechenleistung als ein vermietbares, handelbares und cashflowrückgewinnendes Asset zu betrachten.
Der Wettlauf um AI-Rechenleistung geht von der "Sammlungsphase" in die "Verkaufsphase" über.
Neues Gleichgewicht im Rechenleistungsaustausch
Nachdem die Rechenleistung in Umlauf gekommen ist, verändern sich auch die Positionen der Akteure auf dem Markt für AI-Infrastruktur.
Die traditionellen Cloud-Anbieter waren die ersten und natürlichen Gewinner dieser Nachfrage. Microsoft, Google und Amazon AWS sind schon Cloud-Dienstleister, und die Vermietung von Rechenressourcen ist ihr Kerngeschäft. In der AI-Zeit verschieben sich die Kernressourcen der Cloud-Dienste von CPU's, Speicher und Datenbanken zu GPU's, TPU's, Modellaufrufen und AI-Entwicklungsplatten.
Google ist ein typisches Beispiel. Bei der Telefonkonferenz zur ersten Quartalsbilanz von Alphabet sagte Sundar Pichai, dass der Umsatz von Google Cloud im ersten Quartal um 63% gegenüber dem Vorjahr stieg und erstmals über 20 Milliarden US-Dollar lag; die nicht ausgeführten Aufträge, d. h. die vertraglich vereinbarten, aber noch nicht als Einnahmen verbuchten Beträge, verdoppelten sich fast im Vergleich zum Vorquartal und beliefen sich auf über 460 Milliarden US-Dollar. Das Wachstum von Google Cloud stammt aus der Nachfrage nach Unternehmens-AI-Produkten und AI-Infrastruktur.
Google sagte auch, dass die Anzahl der Tokens, die von seinem ersten Parteien-Modell über direkte API-Aufrufe von Kunden verarbeitet wurden, von 10 Milliarden pro Minute im Vorquartal auf über 16 Milliarden pro Minute gestiegen ist. Gleichzeitig packt Google weiterhin seine eigenentwickelten TPU's, Axion CPU's und Nvidia GPU's in seine Cloud-Dienste und hat auf der Cloud Next die achte Generation von TPU's vorgestellt.
Microsoft hat auch nicht plötzlich angefangen, AI-Rechenleistung zu verkaufen. Azure ist schon eines der größten Cloud-Plattformen weltweit, aber die AI hat seine Wachstums- und Koststruktur verändert.
Die Telefonkonferenz zur dritten Quartalsbilanz von Microsoft im Geschäftsjahr 2026 zeigte, dass der Umsatz von Microsoft Cloud 54,5 Milliarden US-Dollar betrug und um 29% gegenüber dem Vorjahr stieg; der Umsatz von Azure und anderen Cloud-Diensten stieg um 40%. Aber Microsoft betonte gleichzeitig, dass die Kundenbedürfnisse immer noch die verfügbare Kapazität überstiegen. Das heißt, für Microsoft reicht die Rechen