Die Einnahmen aus MaaS haben in fünf Monaten einen 15-fachen Anstieg verzeichnet. Alibaba Cloud hat einen Weg gefunden, um das Token-Geschäft zu erweitern.
Text | Deng Yongyi
Editor | Zhang Yuxin
„Die Token-Einnahmen des MaaS-Geschäfts von Alibaba Cloud haben in den letzten fünf Monaten des Jahres 2026 um das 15-fache gestiegen. Der monatliche Token-Umsatz hat bereits das Niveau von Hunderten von Millionen Yuan erreicht.“ Dies sind die neuesten Zahlen, die Alibaba Cloud auf der Pressekonferenz am 20. Mai präsentiert hat. Der direkte Grund für diesen Umsatzzuwachs ist ein Wort: Agent.
An diesem Tag hat Alibaba Cloud eine Reihe von Produkten wie das neue Flaggschiffmodell Qwen 3.7 Max vorgestellt. Nur einen Monat ist seit der Veröffentlichung von Qwen 3.6 Max vergangen.
Warum so eilig? Seit der großen Popularität von OpenClaw im Februar dieses Jahres haben alle Modellhersteller begonnen, ihre Modelle in Bezug auf die Coding-Fähigkeiten für Agenten zu verbessern. Der Wettlauf um die Coding-Fähigkeiten von Large Language Models wird immer heftiger. Alibaba muss daher ein Modell präsentieren, das in Sachen Coding leistungsstark ist, um die Wettbewerbsfähigkeit seines MaaS-Geschäfts aufrechtzuerhalten. „Die Zukunft gehört der Agent Cloud“, sagte Liu Weiguang, Präsident des öffentlichen Cloud-Bereichs von Alibaba Cloud.
Zufällig fand auch an diesem Tag auf der anderen Seite des Ozeans in Silicon Valley die Google I/O-Konferenz statt, deren Thema ebenfalls Agent Cloud war. Fast alle neu veröffentlichten Produkte von Google, wie Chips, Modelle und Anwendungen, drehen sich um Agenten.
Agent Coding ist derzeit ein globales AI-Konsens.
△Quelle: Alibaba Cloud
Agenten konsequent entwickeln
Als erstes wurde auf der Pressekonferenz die neue Website von Qianwen Cloud vorgestellt. Dies ist eine für Agenten konzipierte Webseite und auch die erste unabhängige Website, die Alibaba Cloud seit seiner Gründung vor 17 Jahren für ein einzelnes Geschäft erstellt hat.
△Quelle: Qianwen Cloud
„Qianwen Cloud ist für Agenten und nicht für Menschen entwickelt“, sagte Liu Weiguang, Leiter der öffentlichen Cloud-Business Unit von Alibaba Cloud. Dies basiert auf einer internen Einschätzung von Alibaba Cloud Ende 2024: Die Hauptnutzer zukünftiger Cloud-Computing-Produkte werden allmählich von menschlichen Ingenieuren zu Agenten werden.
Bisher musste ein Entwickler oder ein Unternehmen, das Dienste in der Cloud bereitstellen wollte, die Website öffnen, sich registrieren und dann aus Hunderten von Produktkategorien wählen, die Maschine auswählen, das Netzwerk konfigurieren, die Instanz starten, die Umgebung installieren und die API einstellen – jeder Schritt erforderte die Entscheidung eines menschlichen Ingenieurs, und die Einstiegshürde war nicht gering.
Nach dem Launch der Qianwen Cloud-Website ändert sich der Prozess: Der Agent sucht zuerst nach einem Modell, dann nach Tools und Fähigkeiten und erst zuletzt nach den unterliegenden Cloud-Ressourcen. Die Reihenfolge ist umgekehrt.
Ein Beispiel: Nach dem Launch von Lobster hat Alibaba Cloud festgestellt, dass ein Agent die Cloud-Computing-Ressourcen innerhalb eines Tages automatisch aktivieren kann. Dies war in der Vergangenheit eine Aufgabe, die ein Mensch zwei Wochen lang erledigen musste. „In Zukunft wird der Agent die Cloud-Computing-Ressourcen automatisch im Hintergrund aktivieren“, sagte Liu Weiguang.
Die Website ist nur der Vorspeise. Alibaba Cloud hat von den obersten Modellen über die Infrastruktur bis hin zu den untersten Chips alles neu für Agenten angepasst.
Zuerst wurde das neue Flaggschiffmodell Qwen 3.7 Max vorgestellt, nur einen Monat nach der Veröffentlichung von Qwen 3.6 Max.
Obwohl Alibaba in der Open-Source-Branche schon lange einen guten Ruf und Einfluss hat, hat sein Flaggschiffmodell im Vergleich zu den chinesischen Modellen Zhipu GLM und Kimi nicht den größten Nutzen aus der Lobster-Technologie gezogen.
Die Veröffentlichung von Qwen 3.7 Max ist Alibabas Versuch, in der Coding-Branche aufzuholen.
In den derzeit autoritativsten Tests für Code-Fähigkeiten hat Qwen 3.7 Max die stärkste Version von DeepSeek eingeholt. In Tests für komplexe Projektaufgaben hat Qwen 3.7 Max auch den ersten Platz belegt.
△Qwen3.7-Max kann langwierige und komplexe Aufgaben über 35 Stunden hinweg unabhängig ausführen. Die Anzahl der Tool-Aufrufe liegt auch bei den verschiedenen Modellen an der Spitze. Quelle: Alibaba Cloud
Im Vergleich zu der Vorgängerversion Qwen 3.6 Max Preview hat Qwen 3.7 Max vor allem eine stark verbesserte Fähigkeit für langfristige Aufgaben – der Agent kann komplexe Aufgaben über mehrere Stunden und tausende Schritte hinweg autonom ausführen, ohne dass menschliche Eingriffe erforderlich sind.
Je stärker die Fähigkeit für langfristige Aufgaben ist, desto höher ist die Komplexität der Aufgaben, die der Agent unabhängig erledigen kann, und desto weniger menschliche Eingriffe sind erforderlich. Dies ist auch die Kernkompetenz von aktuellen Top-Agent-Produkten wie Claude Code und Gemini Deep Research.
Zhou Jingren, CTO von Alibaba Cloud, gab ein Beispiel: Auf der neuen Chip-Plattform von Pingtouge hat Qwen3.7-Max durch autonomes Programmieren und über 1.000 Tool-Aufrufe die Selbstentwicklung des Kernsystems der Plattform erreicht. Die Infrarotschaltgeschwindigkeit hat sich im Vergleich zur ursprünglichen Version um das 10-fache verbessert.
Dies bedeutet, dass das Modell wie ein erfahrener Ingenieur unabhängig Probleme in den Codes beheben und Ingenieuren bei der Entwicklung komplexer Funktionen helfen kann.
Das Erreichen dieser Aufgaben hängt auch von der Anpassung der Chips und der Infrastruktur ab: Auf der Chip-Ebene sind Alibabas neues Trainings- und Infrarot-AI-Chip Zhenwu M890 und das selbstentwickelte Interconnect-Chip ICN Switch 1.0 auf Super-Node-Servern verbaut, die speziell für die Massenkonkurrenz-Szenarien von Agenten ausgelegt sind.
Derzeit sind bereits über 540.000 PPU-Chips von Alibaba Pingtouge verkauft worden, und diese Chips bieten bereits Infrarot-Services in AI-Anwendungen wie Wukong und Miaowu.
Wie man das Token-Geschäft immer größer macht
Der Ausbruch von Agenten hat auch einen Anstieg des Token-Verbrauchs verursacht – Agenten basieren im Wesentlichen auf Code-Generierung, und die Anzahl der Tokens, die für eine Aufgabe aufgerufen werden, ist das Zehn- oder Hundertfache eines normalen Dialogszenarios.
Das Agent-Konsens hat sich daher direkt in einen offenen Wettlauf auf dem Modellmarkt verwandelt: Wer sein Modell in Agent-Szenarien häufiger aufruft, kann schnell Einnahmen erzielen – der größte Gewinner auf dem heutigen Markt ist zweifellos Anthropic. Laut der Wall Street Journal wird der Umsatz von Anthropic im zweiten Quartal voraussichtlich um mehr als das Doppelte steigen und 10,9 Milliarden US-Dollar erreichen.
△Quelle: Wall Street Journal
Alibaba Cloud profitiert ebenfalls davon. Im Kalenderjahr 2025 hat Alibaba Cloud einen Umsatz von über 146,6 Milliarden Yuan erzielt, wobei das Wachstum um 28,6 % lag, was hauptsächlich auf die Beiträge der AI-Produkte zurückzuführen ist.
Wu Yongming, CEO von Alibaba, hat auf der Einnahmenkonferenz der vergangenen Woche angegeben, dass der jährliche wiederkehrende Umsatz (ARR) der AI-Modelle und Anwendungsdienste, einschließlich der Bailian MaaS-Plattform, im Juni-Quartal 1 Milliarde Yuan überschreiten und bis Ende des Jahres 3 Milliarden Yuan erreichen wird.
Allerdings haben Alibaba und ByteDance in diesem Token-Wettlauf zwei verschiedene Strategien gewählt.
„Die Einnahmen aus Tokens stammen hauptsächlich aus zwei Quellen: Einerseits von Large Language Modellen, repräsentiert durch Coding, und andererseits von Video-Modellen. In der Vergangenheit haben viele Menschen die Token-Zuwächse in diesen beiden Märkten verwechselt, was unangemessen ist“, betonte Liu Weiguang.
ByteDance hat sich auf den Video-Modellmarkt konzentriert – laut Schätzungen einer Forschungsinstitution hat ByteDance nach der großen Popularität von Seedance 2.0 80 % des gesamten Token-Verbrauchs pro Tag auf dem Video-Modellmarkt erobert. Ende 2025 hat Huoshan sich das Ziel gesetzt, den MaaS-Dienstumsatz 2026 auf über 1 Milliarde Yuan zu bringen. Nach der Popularität von Seedance 2.0 wurde dieses Ziel erneut angehoben.
Im Vergleich dazu hat Alibaba Cloud in der Large Language Model-Branche einen Vorteil. „Nur Unternehmen mit Entwicklern benötigen Cloud-Dienste. Daher sind fast alle bestehenden Kunden von Alibaba Cloud (die sicherlich über Entwickler verfügen) potenzielle Coding-Nutzer“, sagte Liu Weiguang.
Ende 2025 hat Alibaba Cloud das Geschäftsziel formuliert, „80 % des Zuwachses auf dem AI-Cloud-Markt 2026 zu erobern“. Alibaba Cloud hat seine gegenwärtigen Geschäftskräfte auf den Coding-Bereich konzentriert. „In den ersten fünf Monaten dieses Jahres können wir sagen, dass Alibaba Cloud 80 % des Zuwachses auf dem LLM-Modellmarkt erobert hat.“
Um dieses Ziel zu erreichen, hat Alibaba Cloud auch die Bewertungsmethode für den Vertrieb geändert – es geht nicht darum, wer die meisten Tokens verkauft, sondern wer die wertvollsten Tokens verkauft.
Einfach ausgedrückt, strebt Alibaba Cloud derzeit nicht den Token-Verbrauch durch einfache Chat-Gespräche an, da der Preis für solche Modelle bereits auf einem sehr niedrigen Niveau liegt.
Stattdessen ist ein Kernkennzeichen von Alibaba Cloud heute die Anzahl der Kernbetriebssysteme von Kunden, die mit dem Modell verbunden sind. Dies bedeutet, dass Alibaba Cloud möchte, dass die verkauften Tokens von den Kunden zur Code-Schreibung, Entscheidungsfindung und Prozessausführung verwendet werden. Sobald die Tokens in den Kernproduktionsprozess eines Unternehmens integriert werden, steigt der Token-Verbrauch exponentiell, der Preis ist höher, die Wiederholungskäufe sind stabiler, und dies entspricht einer höheren Qualität der Einnahmen.
Dies liegt daran, dass die Logik des Token-Verbrauchs bei Coding und Video unterschiedlich ist. Der Token-Verbrauch bei Video-Modellen ist einmalig – nach der Generierung eines Videos ist die Aufgabe beendet.
Der Code-Szenario ist eher ein Prozess der Selbstentwicklung: Das Modell schreibt Code, der Code wird zu einer Anwendung, die Anwendung wird in der Cloud bereitgestellt, und wenn die Anwendung läuft, muss das Modell erneut aufgerufen werden, um mehr Code zu generieren.
Der gegenwärtige Wettlauf um Large Language Models ist bereits ein Systemengineering-Wettkampf – die Kopplung von Chips, Infrastruktur und Large Language Modellen ist der wichtigste Faktor, der die Effizienz der Modelltraining und der Infrarot-Servicebereitstellung beeinflusst. Der Geschäfts-Wettbewerb beschleunigt auch, indem er die Wertigkeit der Szenarien schnell validiert und dem Modell Intelligenz zurückgibt.
„Chips, Modelle und Cloud sind jetzt wie Zahnräder, die zusammenarbeiten und sich aufwärts wenden“, sagte Liu Weiguang. Wenn in Zukunft darum geht, dass jeder Chip mehr und höhere Qualität Tokens als die Konkurrenz generieren kann, „dann haben wir gewonnen.“
Im Folgenden finden Sie weitere Einblicke von Liu Weiguang über Alibaba Cloud, die Agent-Trends und den Token-Wettlauf, bearbeitet von „Intelligent Emergence“:
1. Die Grenzen des Cloud-Computings werden durch Agenten erneut erweitert
Im Zeitalter des Cloud-Computings war unser Geschäftsmodell relativ einfach, aber es gab ein langfristiges Problem: Wenn wir die IT-Budgets der Kunden analysierten, konnten wir nicht an den Budgets für interne Softwareentwicklung und Personalvermittlung teilhaben. Jetzt ist es genau umgekehrt: Diese Budgets können von AI Coding vollständig erschlossen werden.
Wir haben festgestellt, dass die Token-Ausgaben von Internetunternehmen bereits 15 % bis 20 % der IT-Ausgaben betragen, während die Ausgaben von traditionellen Unternehmen noch unter 5 % liegen. Es gibt also noch viel Potenzial. Alibabas Ziel für dieses Jahr ist, dass der Anteil der Token-Einnahmen an den Einnahmen jedes Kunden nicht weniger als 20 % beträgt.
Nehmen wir die Automobilbranche als Beispiel. Zuvor konnten wir nur die ERP-Systeme in die Cloud migrieren, dann kamen die Rechenleistung für intelligente Fahrerassistenzsysteme, danach die Large Language Model-Dialoge, und jetzt können wir sogar in der Werbung und Marketing tätig sein. Früher war die größte IT-Investition in der Automobilbranche in das ERP-System, jetzt ist es die AI.
Das Gleiche gilt für den Finanzsektor. Früher war es schwierig, mit den Kunden in der Brokerbranche über Geschäftsthemen zu sprechen, da es sich um ein spezielles Fachgebiet handelte. Jetzt suchen die Kunden uns auf, da die Geschäftsszenarien von Top-Forschungs- und Quantifizierungsunternehmen sowie Hedgefonds eng mit Large Language Modellen verknüpft sind.
Agenten sind bereits der größte Treiber für den Modellmarkt und sogar für den bestehenden Cloud-Markt. Deshalb sind Token und Cloud bei Alibaba Cloud von Natur aus miteinander verbunden. Dies ist auch der Grund, warum Coding unsere wichtigste Richtung ist, da es für fast alles geeignet ist.
2. Agenten sind von Natur aus ein Wachstumsrad für das Cloud-Geschäft
Es gibt ein Umrechnungsverhältnis zwischen Tokens und GPUs. Aus den tatsächlichen Daten haben wir festgestellt, dass nach dem Ausbruch von Agenten die Nutzung einer GPU-Karte im Allgemeinen die Nutzung einer CPU-Karte mit sich bringt. Wenn 100 Yuan an GPU-Infrarot