Von Alibaba bis Baidu: Große Tech-Konzerne konkurrieren um die Vorteile der "neuen Infrastruktur" in der KI-Cloud

KI-Cloud wird die „neue Infrastruktur“ im Zeitalter der künstlichen Intelligenz sein.

Angesichts des blauen Ozeans der Intelligenzierung in allen Branchen stehen die Cloud-Anbieter wieder auf der gleichen Startlinie und haben ein Rennen um die Umsetzungskapazität begonnen.

1698 erfand Thomas Savery eine Dampfpumpe, die aus einem Kessel, einem Kolben und Ventilen bestand. Durch die Kondensation von Dampf wurde ein Vakuum erzeugt, und dann wurde Wasser aus der Mine mittels des atmosphärischen Drucks gepumpt.

1712 verbesserte der Schmied Thomas Newcomen die Dampfpumpe und schuf die atmosphärische Dampfmaschine, die 24 Stunden am Tag kontinuierlich arbeiten konnte und es ermöglichte, dass Minen bis zu einer Tiefe von 150 Metern trocken blieben.

1765 erfand James Watt den separaten Kondensator, der die Effizienz der Dampfmaschine um das Sechsfache erhöhte. In den folgenden 20 Jahren erfand Watt nacheinander das Schwungrad und das Zahnradsystem. Dadurch konnte die Dampfmaschine nicht nur Wasser auf- und abpumpen, sondern auch Maschinen drehend antreiben.

1785 lief die erste Watt'sche Dampfmaschine in einer Baumwollspinnerei. Die Spinnleistung verdoppelte sich direkt, und die menschliche Gesellschaft begann damit eine neue Epoche, die "Dampfzeit".

Die Entwicklung der Cloud-Computing-Technologie ähnelt stark der der Dampfmaschine.

Die frühe Cloud-Computing-Technologie war bekannt für ihre Virtualisierung und Elastizität. Genau wie die Dampfpumpe die Windmühle zur Wasserpumpung ersetzte, löste die Cloud-Computing-Technologie die dringendsten Probleme der Unternehmensdigitalisierung: Es war nicht mehr erforderlich, Serverräume zu bauen, Server zu kaufen oder Infrastrukturen zu warten. Unternehmen mussten nur die Ressourcen in der Cloud nach Bedarf kaufen.

Die Welle der Large Language Models hat den Wert der Cloud neu strukturiert. Genau wie die atmosphärische Dampfmaschine die Wasserpumpleistung verbessert hat, trägt die Cloud-Computing-Technologie in der Zeit der Large Language Models zunehmend Dienste wie Modelltraining, Inferenzaufrufe und die Entwicklung von KI-Anwendungen und hat sich zu einer intelligenten Basis für verschiedene Branchen entwickelt.

Mit der Entstehung von Agenten hat die KI die Dialogbox verlassen und die Fähigkeit erlangt, Aufgaben zu zerlegen, Werkzeuge aufzurufen, Systeme zu verbinden, Prozesse zu koordinieren und kontinuierlich auszuführen. Dies entspricht der Hinzufügung von "Schwungrad und Zahnradsystem" zur Cloud, wodurch die Beschränkung des "Serververkaufs" überwunden wurde und die Cloud zu einem intelligenten Motor für alle Branchen wurde.

Im 19. Jahrhundert wurde die Dampfmaschine schnell in Branchen wie Metallurgie, Mühlenbetrieb, Münzprägung und Textilindustrie eingesetzt und wurde zur "Universalmaschine" für verschiedene Fertigungsbranchen. Wenn die Intelligenzierung eine gesellschaftliche Notwendigkeit wird, beginnt die Cloud-Computing-Technologie, die die Mission der Intelligenzierungstransformation in allen Branchen trägt, ein neues Schlachtfeld.

In der absehbaren Zukunft wird die KI-Cloud die "neue Infrastruktur" der Intelligenzierungszeit sein - nicht nur die größte Chancengabe der Zeit, sondern auch ein blauer Ozeanmarkt, der gerade erst seinen Anfang nimmt.

Die Anforderungen haben sich geändert: Von "Ressourcenmiete" zu "Ergebnisgewinnung"

Im Jahr 2026 hat der Agent die Entwicklungstrends des Cloudmarktes bereits umgeschrieben.

In den letzten zehn Jahren gab es eine bewährte Formel, um die Wettbewerbsfähigkeit eines Cloud-Anbieters zu messen: Man sah sich die Ressourcengröße, das Umsatzwachstum, die Anzahl der Kunden und die Marktanteile an. Derjenige, der den größeren Marktanteil hatte, mehr Ressourcen besaß und eine breitere Infrastrukturabdeckung hatte, wurde als Marktführer angesehen.

Diese Logik war in der Phase des Mobile-Internets und der Branchendigitalisierung gültig.

Damals war die Kernanforderung der Unternehmen die Digitalisierungstransformation: Geschäftssysteme sollten in die Cloud migriert werden, Daten sollten zentralisiert werden, Organisationen sollten kooperieren und Prozesse sollten online sein. Die Cloud-Anbieter boten die Basis, die Ressourcen und die Grundfähigkeiten. Wenn Kunden sich für die Cloud entschieden, kauften sie im Wesentlichen Elastizität, Stabilität und optimierten die Kosten.

Nach dem Eintritt in die Agentenzeit haben sich die Anforderungen grundlegend geändert.

McKinsey hat in seinen Einschätzungen über die Agentic AI-Infrastruktur erwähnt, dass die IT-Infrastruktur in eine neue Phase eintritt. AI-Agenten beginnen, Arbeit innerhalb von Unternehmen zu organisieren, zu verwalten und zu erweitern. Die Infrastruktur wird nicht nur zur Stützschicht, sondern auch zum Kernskelett für Unternehmen, um den Wert der KI zu nutzen.

Kurz gesagt: Kunden wollen nicht nur "Ressourcen mieten", sondern "Ergebnisse erzielen".

Banken brauchen nicht nur reines Rechenleistungspotenzial, sondern wollen wissen, ob tausende KI-Anwendungen stabil laufen können und ob sie die kontinuierliche Iteration in verschiedenen Szenarien wie Risikomanagement, Kundenservice, Investmentforschung, Wartung und Compliance unterstützen können.

Automobilhersteller brauchen nicht nur ein isoliertes KI-Modell, sondern wollen wissen, ob die Assistenzfahrfunktion von der Trainingsphase, der Simulation, der Validierung bis zur Serienproduktion und dem Fahrbetrieb einen vollständigen Kreis bilden kann.

Energieunternehmen brauchen nicht nur eine Demonstrationsanwendung, sondern wollen wissen, ob die KI in Geschäftsprozesse wie Netzmanagement, Geräteüberprüfung, Störungsvorhersage und Kundenservice integriert werden kann und wirklich die Produktivität, die Sicherheit und die Stabilität beeinflussen kann.

Herstellungsunternehmen brauchen nicht nur "ein intelligentes Fragestellungssystem", sondern wollen wissen, ob die KI in die Bereiche Forschung und Entwicklung, Lieferkette, Qualitätsprüfung, Gerätewartung und Produktionslinienmanagement integriert werden kann und Unternehmen bei der Lösung konkreter Betriebsprobleme helfen kann...

Wie Forrester in seinem Bericht über die Google Cloud Next 2026 erwähnt hat: Das Unternehmens-KI-Geschäft geht von der "Pilotphase" in die "Phase der Skalierungsverwaltung" über. Letztes Jahr fragten Unternehmen, ob man einen Agenten entwickeln könne. Heute lautet die Frage, wie man tausende Agenten verwalten kann.

Ein Pilotprojekt mit einem Agenten prüft die Modellfähigkeit und die Demonstrationswirkung; das stabile Funktionieren von Tausenden von Agenten prüft die Systemtechnikfähigkeit der Cloud-Anbieter: Es werden Rechenleistungsscheduling, Modellservice, Berechtigungssystem, Datenverwaltung, Sicherheitsaudit, Kostenkontrolle usw. benötigt.

Es besteht in China ein ähnlicher Konsens.

Das Netzwerk- und Informationsbehörde, die National Development and Reform Commission und das Ministerium für Industrie und Informationstechnologie haben im Mai die "Implementierungsrichtlinien für die normgerechte Anwendung und die innovative Entwicklung von Agenten" gemeinsam veröffentlicht. KI wird nun offiziell als industrielle Infrastruktur behandelt. Die Cloud muss sich von einer Plattform, die "Anwendungen trägt", zu einem Motor entwickeln, der "intelligente Entscheidungen und intelligente Ausführungen trägt".

Dies entspricht einer Änderung der Marktkonkurrenzlogik: In den früheren Cloud-Kriegen ging es darum, wer mehr Marktanteile eroberte; in den neuen Cloud-Kriegen geht es darum, wer tiefer in die Branchen einwurzelt.

Unter "mehr Marktanteile erobern" versteht man die Ressourcengröße, die Anzahl der Serverräume, die Kundendeckung und die Marktanteile. Die Frage ist, "wie groß ist der Anbieter". Unter "tiefer einwurzeln" versteht man das Verständnis der Branche, die Akkumulation von Szenarien, die Ingenieurskapazität, die Lieferfähigkeit und die kontinuierliche Betriebsfähigkeit. Die Frage ist, "hat der Anbieter wirklich in die Geschäftsprozesse der Kunden eingebracht".

Der Wendepunkt hat sich geändert: Beschleunigte Evolution zur "Intelligenten Fabrik"

Bei den Pressekonferenzen der Cloud-Anbieter wird die Erzählweise immer praxisorientierter.

Früher wurde über die Anzahl der globalen Knoten und die Anzahl der Kunden gesprochen. Jetzt wird über die Anzahl der Modellaufrufe, den Verbrauch von Tokens und den MaaS-Umsatz gesprochen. Die Anbieter versuchen, dem Markt zu beweisen: "Ich habe nicht nur ein gutes Large Language Model, sondern ich habe auch das Modellaufrufen zu einem stabil wachsenden Geschäft gemacht."

Es ist etwas überraschend, was bei Baidu Smart Cloud passiert.

Nach den Q1-Bilanzdaten von Baidu betrug das Einkommen von Baidu AI Cloud 8,8 Milliarden Yuan, was einem Jahr-zu-Jahr-Anstieg von 79 % entspricht. Der Umsatz aus GPU-Clouds stieg sogar um 184 % im Vergleich zum Vorjahr.

In den letzten Monaten haben viele Leute Erklärungen gegeben: Einige denken, dass Baidu die Welle der Agentenzeit mitgekriegt hat und die Nachfrage nach KI-Clouds schnell steigt; andere meinen, dass Baidu Smart Cloud bereits vor 10 Jahren den Schwerpunkt auf "Intelligenz" gelegt hat und jetzt endlich die Früchte erntet; wieder andere geben zu, dass Baidu zwar in der KI-Cloud gut abschneidet, aber der gesamte Cloud-Geschäftsmarkt noch nicht groß genug ist...

Vielleicht ist es noch interessanter, zu untersuchen, was Baidu Smart Cloud richtig gemacht hat. Die Antwort liegt in der strategischen Upgrades im Mai 2026. Baidu wird eine neue ganzheitliche KI-Cloud um das Konzept von "Chip, Cloud, Modell, Agent" aufbauen. Dies kann in zwei Teile zusammengefasst werden:

Der erste Teil ist die AI-Infrastruktur. Der ursprüngliche "MaaS-Modell-Service" wird zum "Token-Fabrik" (Token Factory) aufgewertet, und die Produktarchitektur wird unter dem Prinzip "Agent-first" neu strukturiert. Das Ziel ist es, die redundante Berechnung von Tokens so weit wie möglich zu reduzieren und schnellere Generierungsgeschwindigkeiten und kostengünstigere Token-Services anzubieten.

Der zweite Teil ist die Agent-Infrastruktur. Durch Optimierungslösungen wie die Schichtung und Pooling von Ressourcen, die Verbesserung der KV-Cache-Trefferquote, die Trennung von PD und die Cache-Scheduling, sowie die Anpassung der Superknotenprodukte an die gängigen Modelle, wird die Intelligenz pro Token optimiert, damit die Agenten ihre Aufgaben besser erfüllen können.

Um es anschaulicher zu machen: Die Positionierung der KI-Cloud wandelt sich von einer "Trainingsbaustelle" zu einer "Intelligenten Fabrik". Die erste löst das Problem, wie man ein Modell von Grund auf aufbaut und konzentriert sich auf Parameter, Rechenleistung und Trainingswirkungsgrad. Die zweite löst das Problem, wie man aus KI-Fähigkeiten Produktivität macht und fokussiert sich auf Inferenzkosten, Aufgabenorganisation, Datenkreisläufe und Branchenanpassung.

Es ist nicht nur Baidu, sondern der gesamte Cloud-Markt entwickelt sich in Richtung "Intelligente Fabrik".

Microsoft hat auf der Build 2026 die Project Solara vorgestellt und betont, dass eine Plattform von Chip bis zur Cloud für "agent-first" Unternehmensgeräte aufgebaut wird. Die Geräte werden nicht mehr um traditionelle Apps organisiert, sondern um Agenten. Die Cloud übernimmt die Agenten-Services, die Zustandsverwaltung und die Aufgabenplanung.

NVIDIA betont ständig das Konzept der "AI-Fabrik" und hat mit Unternehmen wie SK Group, Naver, LG und Hyundai zahlreiche Kooperationen in der KI-Infrastruktur eingegangen. SK Telecom wird eine GW-Klasse KI-Cloud bauen, und Naver plant die Errichtung einer GW-Klasse KI-Fabrik, um die Anforderungen an KI-Services und Physical AI zu erfüllen.

Ali hat am 8. Juni angekündigt, die Generalisierte Large Language Model-Division und das Future Life Laboratory zu einer neuen Token Foundry-Division zusammenzuführen. In dieser Abteilung werden alle Komponenten von Chip, Modell bis hin zu Anwendungen vereinigt, um die "gesamte Lebenszyklus von Tokens" in die eigene Hand zu nehmen.

Das bedeutet, dass die Größe des Cloud-Marktes nicht mehr das zentrale Thema ist. Der Schwerpunkt liegt nun darauf, ob man die KI-Fähigkeiten mit den Branchenanforderungen in Einklang bringen kann. Beispielsweise kann man "allgemeine Technologien" in "Branchenfähigkeiten" übersetzen, "Modellfähigkeiten" in "Geschäftsergebnisse" umwandeln und die Kunden dazu bringen, die KI nicht nur einmal auszuprobieren, sondern kontinuierlich zu nutzen.

Wenn die Denkweise der Cloud-Anbieter auf der Ebene der Ressourcen bleibt, können sie diese Fragen sicher nicht beantworten.

Im Mittelpunkt des Wettlaufs: Die Umsetzungskapazität wird zum "Schlüssel zum Sieg"

Die "Strategieänderung" der Cloud-Anbieter zeigt, dass der Schwerpunkt von der "Migration in die Cloud" zur "Umsetzung der KI" verschoben hat.

Die größte Chance in der Zeit des Mobile-Internets war die Digitalisierung in allen Branchen. Unternehmen haben ihre Geschäfte online verlagert, Prozesse in Daten umgewandelt und Verbindungen zu Zugängen gemacht, was zu Billionen-Märkten geführt hat. In der KI-Zeit hat sich das Schlüsselwort von "Digitalisierung" zu "Intelligenzierung" gewandelt. Jede Branche möchte, dass die Cloud und die KI in die Geschäftsprozesse integriert werden und die Schlüsselprozesse wie Forschung und Entwicklung, Produktion, Marketing, Risikomanagement, Kundenservice und Wartung neu beleben.

Laut der allgemeinen Meinung in der Branche muss die KI-Cloud mindestens vier Hürden überwinden, um erfolgreich umgesetzt zu werden.

Die erste Hürde ist das Verständnis der Branche.

Die Umsetzung der KI ist nicht einfach das Übergeben eines allgemeinen Modells an die Kunden. Die Finanzbranche hat ihre eigene Risikomanagementlogik, die Energiebranche hat ihre eigenen Sicherheitsgrenzen, und die Automobilbranche hat ihre eigenen Engineering-Validierungszyklen... Ohne Branchenkenntnisse bleibt die KI leicht auf der Oberfläche von "scheinbar intelligenten" Anwendungen.

Die zweite Hürde ist die Ganzheitlichkeit der Fähigkeiten.

Die Cloud-Services in der Agentenzeit können nicht nur ein einzelnes Modell oder eine bestimmte Rechenleistung bieten. Der Betrieb von Agenten erfordert die koordinierte Arbeit von Rechenleistung, Cloud-Plattform, Large Language Model, Werkzeugkette, Agenten-Framework, Datenverwaltung und Sicherheitsystem. Fehlt eine einzelne Komponente, wird das Endresultat der Umsetzung beeinträchtigt.

Die dritte Hürde ist die Validierung in realen Szenarien.

Das Wichtigste bei der Umsetzung der KI ist nicht die Demo auf der Pressekonferenz, sondern ob die Kunden die KI langfristig nutzen wollen und ob sie in realen Geschäftsprozessen kontinuierlich Wert schaffen kann. Insbesondere in seriösen Branchen wie Finanz, Energie, Automobil und Regierungseinrichtungen werden die Kunden nicht einfach ihre Kernsysteme migrieren, nur weil ein Konzept neu ist.

Die vierte Hürde ist die Kostendauerhaftigkeit.

Einer der größten Faktoren bei der Skalierung von KI-Anwendungen von der Pilotphase ist die Kosten. Es ist nicht schwierig, einen Agenten zu implementieren. Schwierig ist es, die Inferenzkosten, die Datenaufrufkosten, die Wartungskosten usw. für tausende Agenten im Langzeitbetrieb akzeptabel zu halten. Viele Projekte scheitern am ROI.

Wir können mutig eine Eins

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Von Alibaba bis Baidu: Große Tech-Konzerne wetteifern um die Vorteile der „neuen Infrastruktur“ im Bereich KI-Cloud

Die Anforderungen haben sich geändert: Von "Ressourcenmiete" zu "Ergebnisgewinnung"

Der Wendepunkt hat sich geändert: Beschleunigte Evolution zur "Intelligenten Fabrik"

Im Mittelpunkt des Wettlaufs: Die Umsetzungskapazität wird zum "Schlüssel zum Sieg"