Google und Alibaba kollektiv: Das Ende der Ära des Dienstes für Menschen?

Wenn KI zur Produktivkraft wird, wenden sich die Konzerne kollektiv um.

Zusammenfassung:

Eine Codeanweisung hat die traditionelle Unternehmenswebsite ersetzt. Am 20. Mai hat Alibaba Cloud das "Qianwen Cloud" gestartet. Auf der Startseite steht nur eine Anweisung, damit der Agent seine eigenen Skills installiert. Gleichzeitig hat die Google Developer Conference ein ähnliches Signal gesendet: Die Hauptnutzer von Cloud Computing werden von Menschen zu intelligenten Agenten.

Wenn man die Website von "Qianwen Cloud" öffnet, steht auf der Startseite nur: Installiere Skills npx skills add QianWen-AI/qianwen-ai.

Es gibt keine Produktliste, keinen Zugang zum Steuerungskonsolen und keine komplizierten Navigationen, an die sich die Mobile-Internet-Branche in den letzten zehn Jahren gewöhnt hat. Dies ist die komplette Startseite des neuen Produktportals "Qianwen Cloud" von Alibaba Cloud, das seit seiner Gründung vor 17 Jahren erstmals außerhalb der Hauptwebsite eingeführt wurde — eine für Agenten lesbare Prompt-Anweisung, die bedeutet, dass der intelligente Agent die Qianwen-Cloud-Skills selbst installieren soll. Die Nutzer von Cloud Computing werden von menschlichen Ingenieuren zu intelligenten Agenten, und Alibaba Cloud hat beschlossen, sein gesamtes Techniksystem dafür neu zu gestalten.

"Alibaba Cloud führt eine umfassende Technologieinnovation durch und verbessert von der untersten Chip-Ebene, über die Agentic Cloud und die Modelle bis hin zur Inferenzplattform alles. Alibaba Cloud will die größte KI-Fabrik Chinas werden." Am 20. Mai gab Liu Weiguang, der leitende Vizepräsident der Alibaba Cloud Intelligence Group und der Präsident der Public Cloud Business Unit, auf der Alibaba Cloud Summit 2026 bekannt.

Gleichzeitig hat Google auf seiner jährlichen Developer Conference einen ähnlichen Schwerpunkt gesetzt. "Google hat in den letzten Tagen auch eine Konferenz abgehalten, und das Thema scheint das gleiche wie unseres zu sein. Wir haben die gleiche Idee." In einem kleinen Gruppengespräch nach der Konferenz antwortete Liu Weiguang auf die Medien, darunter Phoenix Tech.

Dies ist kein Zufall. Laut offiziellen Angaben von Google belief sich die monatliche Verarbeitung von Token in Googles Produkten vor zwei Jahren auf 9,7 Billionen, stieg beim I/O des vergangenen Jahres auf etwa 480 Billionen und sprang dieses Jahr direkt auf über 3,2 Quadrillionen pro Monat, was einer siebenfachen Zunahme entspricht. Die globale IT-Forschungs- und Beratungsinstitution Gartner hat eine noch anschaulichere Prognose abgegeben: Bis Ende 2026 werden 40 % der Unternehmensanwendungen KI-Agenten integrieren — vor einem Jahr lag dieser Anteil noch unter 5 %.

Hinter der "gleichen Idee" und der steilen Wachstumskurve verbirgt sich ein reibungsloser Wechsel des Wachstumsantriebs von Cloud Computing und ein zwangsläufig beschleunigter und entschiedener Weg der Eigenentwicklung.

Neuordnung des Zugangs: Wenn Menschen nicht mehr die Hauptverbraucher von Cloud Computing sind

"In Zukunft werden die Hauptnutzer von Cloud Computing-Produkten allmählich von menschlichen Ingenieuren zu Agenten werden." Zu Beginn des Jahres wurde in Alibaba Cloud eine entscheidende Einschätzung getroffen.

Seit der Gründung der Alibaba Cloud-Website im Jahr 2009 hat sich die Schnittstellenlogik nicht geändert: Menschen melden sich an, durchsuchen die Menüs und finden in der umfangreichen Produktlinie Cloud-Server, Datenbanken und Speicher und konfigurieren die Parameter manuell. Dieser Weg ist für Agenten jedoch bedeutungslos. Agenten betrachten keine Webseiten und klicken nicht auf Schaltflächen. Sie benötigen strukturierte Fähigkeitsbeschreibungen, klare Aufrufprotokolle und vorhersagbare Rückmeldemechanismen.

Liu Weiguang enthüllte ein Detail: Nachdem das "Lobster" während des chinesischen Neujahrs sehr populär wurde, haben einige externe Kunden von Alibaba Cloud ähnliche "Lobster"-Produkte eingeführt. Wenn ein Agent wie "Lobster" entsteht, "muss nicht mehr von Menschen aktiviert werden, sondern "Lobster" aktiviert automatisch die Cloud Computing-Ressourcen im Hintergrund". Was in der Vergangenheit von menschlichen Ingenieuren zwei Wochen gedauert hätte, wurde binnen eines Tages erledigt. "Agenten nutzen die Cloud still und automatisch."

Auf der Grundlage dieser Beobachtung hat Alibaba Cloud die Entscheidung für "Qianwen Cloud" getroffen.

"Qianwen Cloud" ist als "eine reine Website für KI und Agenten" konzipiert. Sie ist einfacher gestaltet und bietet hauptsächlich Modelle und verwandte Anwendungen an. Sie ist vollständig "Skill-fähig". "Wenn Agenten direkt darauf zugreifen, ist die Erfahrung viel besser als bei der Alibaba Cloud-Website."

Früher suchten Menschen zuerst nach Datenbanken, wenn sie eine Website besuchten. In Zukunft werden Agenten zuerst nach Modellen suchen. Die Entstehung von "Qianwen Cloud" zeigt Alibaba Clouds Entschlossenheit, sich vollständig auf Agenten zu konzentrieren: Wenn alle Anwendungen von KI neu geschrieben werden und alles für KI ist, muss die Priorität der Zugänge umgekehrt werden.

Token-Ökonomie: Ein 15-facher Sprung von "Zusatzleistung" zu "Kernmotor"

Die Veränderung des Zugangs ist nur die Oberfläche. Die treibende Kraft hinter dieser Neuordnung ist das explosive Wachstum der Token-Ökonomie.

Dabei hat der Sprung in der Coding-Fähigkeit den Cloud-Anbietern einen neuen Service-Raum eröffnet.

"Letztes Jahr habe ich gesagt, dass die Token-Ausgaben in den IT-Budgets von Unternehmen weniger als 1 % betrugen. Damals war KI nur eine "Effizienzsteigerung" und hat die Natur des Geschäfts nicht verändert." Liu Weiguang resümierte, "Aber seit der Entstehung der Coding-Fähigkeit ist dies ein großer Wendepunkt — KI beginnt, Arbeit zu schaffen, die Menschen nicht tun können."

Er gab ein Beispiel: Viele alte Anwendungen, die in den 70er und 80er Jahren in COBOL, C und Java geschrieben wurden, haben ihre Kommentare verloren, und die Programmierer sind bereits in den Ruhestand gegangen. Aber KI kann diese "Code-Fossilien" dekonstruieren und sie in die Cloud bringen.

"Das Auftauchen von KI-Coding führt nicht nur zur Erstellung neuer Anwendungen, sondern auch zur Dekonstruktion alter Anwendungen und zur Entstehung einer neuen Welle von Anwendungen." Liu Weiguang beurteilte.

Ein größerer Wandel kommt von der Fähigkeitssteigerung der Inferenzmodelle und Videomodelle. Ein Kunde hat drei Monate lang einen Open-Source-Modell mit eigenen Daten optimiert. Dann ist ein neues Großmodell aufgetaucht, das "fast alles, was zuvor existierte, überwältigt hat. Heute ist der Wert von Großmodellen viel größer als der von Open-Source-Modellen mit Datenoptimierung."

In der Videobranche glaubt er, dass sich die chinesische Werbebranche in Zukunft stark verändern wird. "Jeder kann Werbung machen und Filme produzieren."

Der Wertsprung, den die KI-Fähigkeiten bringen, spiegelt sich direkt in der Zahlungsbereitschaft wider.

Aktuell können die Token-Ausgaben von KI-nativen Start-ups bis zu 100 % der IT-Kosten betragen; bei Internet-Unternehmen liegen sie zwischen 15 % und 20 %; bei traditionellen Unternehmen sind sie noch unter 5 %.

Liu Weiguang stellte klar, dass es in der Marktansicht einen Irrtum gibt. Derzeit werden in der Marktstatistik "Video-Token und Inferenz-Token zwangsläufig zusammengezählt. Aber aus technischer Sicht sind dies zwei verschiedene Statistikmethoden. Heute sollten wir "den Marktplatz nach Modalitäten und Modellen betrachten".

Deshalb hat Alibaba Cloud die Vertriebsteams mit vielfältigeren Zielen beauftragt, darunter: die Anzahl und die Abdeckung der bezahlenden Token-Kunden; ob die Kunden Token nutzen, um dringende Bedürfnisse zu befriedigen und in das Kernsystem einzubinden; die Effizienz, mit der die von Alibaba-Modellen erzeugten Agenten einen geschlossenen Kreis autonom abschließen, usw.

Als er gefragt wurde, ob das KI-Geschäftsmodell eher nach "Verbrauch" oder nach "Ergebnis" berechnet werden sollte, antwortete Liu Weiguang auf Phoenix Tech: "Das Endziel muss die Ergebnisbilling sein. Derzeit wird eher nach Menge abgerechnet, aber es gibt bereits Anzeichen, dass Kunden bereit sind, für das Ergebnis zu bezahlen."

Der heimliche Wettlauf um Chip und Modell: Warum muss man den "Google TPU-Weg" gehen?

Allerdings steht der Chip, der die Token-Ökonomie stützt, vor einer beispiellosen Unsicherheit.

Auf der Alibaba Cloud Summit wurde erstmals das Roadmap des Zhenwu-Chip-Serien vorgestellt. Der neu vorgestellte M890-Chip hat einen Speicher von 144 GB und eine Inter-Chip-Verbindungsbandbreite von 800 GB/s. Seine Leistung ist dreimal so hoch wie die des Vorgängers 810E.

Gao Hui, der stellvertretende Präsident von Pingtouge Semiconductor, sagte auf der Summit, dass Agenten möglicherweise binnen Millisekunden mehrere Dutzend Modellaufrufe auslösen können, was eine enge Zusammenarbeit zwischen CPU, GPU, Netzwerk und Speicher erfordert. Die eigenentwickelte Chip-Matrix auf ganzer Linie dient dazu, die systemweite Zusammenarbeit von Rechenleistung, Netzleistung und Speicherleistung zu erreichen. Pingtouge hat gleichzeitig den Iterationspfad für die nächsten zwei Jahre bekannt gegeben: Die V900 und J900 werden nacheinander eingeführt.

Als er gefragt wurde, warum er zu diesem Zeitpunkt seine Karten auf den Tisch gelegt hat, antwortete Liu Weiguang: "Im Gegensatz zu Start-up-Chip-Unternehmen haben wir unser Produkt erst nach langer Markttestung auf den Markt gebracht." Er sagte, dass der Zhenwu-Chip vor der offiziellen Veröffentlichung bereits in Alibaba, Ant Group, der autonomen Fahrtechnik, der Finanzbranche, der öffentlichen Verwaltung und bei Telekommunikationsanbietern von der Markt akzeptiert wurde.

Dies ist fast eine Kopie des klassischen Wegs von Googles TPU in Kombination mit Gemini. Liu Weiguang räumte seine Zustimmung zum "Google-Weg" nicht aus: "Eigene Chips und eigene Modelle können definitiv die beste Kosteneffizienz erreichen. Die Kombination von Googles TPU und Gemini hat die höchste Leistung erzielt."

Er gab dann seine Einschätzung ab: "Wenn wir in Zukunft auf jedem Chip mehr Token und höherwertige Token erzeugen können als unsere Konkurrenten, dann haben wir gewonnen."

Es ist bemerkenswert, dass Google vor einem Monat ebenfalls eigene Chips entwickelt hat — es hat den für das Pre-Training optimierten TPU 8t und den für die Inferenz optimierten TPU 8i veröffentlicht, um "gegen" NVIDIA anzugehen. Anschließend hat der CFO in der neuesten Quartalsbesprechung mit den Investoren bekannt gegeben, dass Googles jährliche Kapitalausgaben auf etwa 180 bis 190 Milliarden US-Dollar erhöht werden sollen.

Auf der Google I/O 2025 Developer Conference hat Google ebenfalls ein komplettes Paket für die Zusammenarbeit auf ganzer Linie gezeigt: Von Ironwood bis zu Gemini 2.5, von Vertex AI bis zum Browser-integrierten Agent, Google geht ebenfalls den Weg der geschlossenen Schleife von Chip-Modell-Inferenz-Agent-Zugang auf ganzer Linie.

Sundar Pichai sagte in seiner Keynote: "Wir befinden uns in einer neuen Phase der Transformation der KI-Plattform." Was Google tun will, ist "die Hürden zu senken und die Schaffung zu beschleunigen". Er kündigte an, dass intelligente Agenten in Googles Hauptgeschäft, die Suche, und den KI-Assistenten Gemini integriert werden sollen, und dass durch die Kombination von Gemini und Suche eine neue KI-Suchfunktion eingeführt wird.

Die beiden führenden Cloud-Anbieter in China und den USA setzen an demselben Punkt auf eigenentwickelte Chips und die Zusammenarbeit auf ganzer Linie, was die logische Veränderung des Branchenwettbewerbs zeigt: Der Wettbewerb in der Token-Ökonomie hat sich von "Wer hat mehr GPU" zu "Wer kann mit geringeren Chipkosten höherwertige Token produzieren" verschoben.

Die Effizienz dieser "Kopplung von Chip und Modell" hat sich bereits in der Praxis gezeigt. Auf der Summit wurde bekannt gegeben, dass Qwen3.7-Max auf dem bisher unbekannten M890-Chip 35 Stunden lang autonom arbeitete, nur anhand einer Aufgabenbeschreibung. Es hat unabhängig die Schreibung und Optimierung eines produktionsreifen KI-Rechenkerns abgeschlossen, und die endgültige Leistung war um das Zehnfache höher als die der offiziellen Version.

Als er gefragt wurde, wie der Fortschritt des Ziels von "80 % des Wachstumsmarktes von KI-Cloud" sei, das Ende des vergangenen Jahres aufgestellt wurde, gab Liu Weiguang eine genauere Zahl an: "Derzeit haben wir bereits mehr als 20 % des Inferenzmarktes erobert. Wir haben bei allen großen Kundenverträgen gewonnen." Aber er räumte auch ein, "Der Wachstumsspeed des neuen Marktes ist zu schnell. Das Einkommen in einem Quartal ist sogar größer als in den letzten Jahren. Die Vergangenheit ist nicht so wichtig. Der Schlüssel liegt in der Zukunft."

Nach den Statistiken von Alibaba Cloud hat der Token-ARR des LLM auf der Alibaba Cloud BaiLian-Platt

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Google und Alibaba wenden sich kollektiv: Die Ära des Dienstes für Menschen ist vorbei.

Neuordnung des Zugangs: Wenn Menschen nicht mehr die Hauptverbraucher von Cloud Computing sind

Token-Ökonomie: Ein 15-facher Sprung von "Zusatzleistung" zu "Kernmotor"

Der heimliche Wettlauf um Chip und Modell: Warum muss man den "Google TPU-Weg" gehen?