StartseiteArtikel

Der Weg hin zu Super-Künstlicher Intelligenz

晓曦2025-09-29 17:30
Agent jetzt, ASI morgen: Der Full-Stack-Ansatz von Alibaba Cloud

Die industrielle Revolution hat die Dampfmaschine in die Produktionslinie integriert und die körperliche Kraft der Menschen verstärkt. Die Informationsrevolution hat den Computer in Fabriken und Büros eingeführt und die Fähigkeit der Menschen zur Informationsverarbeitung verstärkt. Wu Yongming, CEO der Alibaba-Gruppe, hat auf der Yunqi-Konferenz 2025 beurteilt, dass KI der Ausgangspunkt eines neuen Sprungs sein wird. Sie wird die Intelligenz der Menschen verstärken und schließlich zur selbstevolvierenden Super-Künstlichen Intelligenz (ASI) führen.

„Die allgemeine Künstliche Intelligenz (AGI: Artificial General Intelligence) ist nicht das Ende der KI-Entwicklung, sondern ein ganz neuer Anfang. Die KI wird nicht bei der AGI stehen bleiben, sondern zur Super-Künstlichen Intelligenz (ASI: Artificial Superintelligence) hinauswachsen, die den Menschen überlegen und in der Lage ist, sich selbst zu verbessern.“ sagte Wu Yongming in seiner Keynote-Vorlesung.

Diese Einschätzung ist nicht fern entfernt. In der täglichen Betriebstätigkeit einiger Unternehmen ersetzen immer mehr Agenten die manuellen Vergleichs- und Verarbeitungsschritte, wodurch sich wiederholende Arbeiten automatisieren lassen und komplexe Prozesse schneller und genauer werden. Agenten sind eine Möglichkeit, um große Modelle tatsächlich in der Industrie einzusetzen und reale Werte zu schaffen.

Im Mai dieses Jahres hat PricewaterhouseCoopers 300 Topmanager weltweit befragt. Die Ergebnisse zeigen, dass 79 % der befragten Unternehmen bereits in einigen Geschäftsbereichen KI-Agenten einsetzen. Davon gaben 66 % an, dass die Produktivität gestiegen sei, 57 % hätten Kostensenkungen festgestellt, 55 % hätten eine schnellere Entscheidungsfindung bemerkt und 54 % hätten die Kundenerfahrung verbessert.

Deshalb war Agent in fast allen Pressekonferenzen der Tech-Riesen dieses Jahres ein häufiges Stichwort. Von der Agent-Modus, die von OpenAI eingeführt wurde und in ChatGPT direkt Aufgaben ausführen kann, über die von Microsoft mit Copilot geschaffene „Agentic Web“ bis hin zum neuesten Jules-Agent von Google sowie Coze von ByteDance und dem plattformübergreifenden intelligenten Agent von Baidu – fast keine große Internetfirma war dabei fehlgeblieben.

Die Positionierung der Alibaba Cloud BaiLian Agent-Entwicklungsplattform hängt auch mit Alibabas Einschätzung der ASI zusammen. Sie ist keine auf den Endverbraucher zugeschnittene, auf Trendsetzen und Konzeptmarketing abzielende Erlebnisanwendung, sondern ein Nährboden, der es Unternehmen ermöglicht, auf einfache und effektive Weise Unternehmens-KI-Agenten aufzubauen. Sie bündelt alle erforderlichen Schritte für die Erstellung von Intelligenten Systemen – von der Modellaufrufung und Rahmenkonstruktion bis zur Ressourcenverwaltung und konformen Wartung – in einem System.

Die dahinterliegende Unterstützung ist eine vollständige Branchenkette: von den Tongyi-Serien-Basismodellen über die BaiLian-Unternehmens-Entwicklungsplattform bis hin zu den untersten Infrastrukturen wie Rechenleistung, Speicher und Datenbanken. Sie ermöglicht es nicht nur, dass die Unternehmens-Agenten heute tatsächlich funktionieren, sondern legt auch die Grundlage für die zukünftige Entwicklung zur Super-Künstlichen Intelligenz.

Das große zukünftige Ziel und die gegenwärtigen konkreten Anwendungen sind miteinander verbunden. Dies ist auch der konsequente Stil von Alibaba Cloud – sowohl die gegenwärtigen Probleme zu lösen als auch auf den nächsten intelligenten Sprung zu setzen.

01

Nur mit einer guten Grundlage kann ein Agent wirklich entstehen

Auf der gerade beendeten Yunqi-Konferenz hat Wu Yongming angekündigt, dass Alibaba Cloud offiziell zu einem „ganzheitlichen KI-Dienstleister“ aufgewertet werde und einen Gesamtangriff auf die zukünftige Rechenparadigma starten werde. Er hat vorgeschlagen, dass große Modelle das neue Betriebssystem seien und die Super-KI-Cloud der neue Computer. In der Zukunft werde die Welt von nur wenigen „Super-KI-Plattformen“ gemeinsam getragen.

Im Einklang mit dieser Einschätzung hat sich die Strategie von Alibaba Cloud seit jeher nicht geändert: In der Vergangenheit, Gegenwart und Zukunft setzt es unermüdlich auf die Infrastrukturentwicklung und die Verbesserung der Basismodelle und wird auch in Zukunft in diese beiden Bereiche stärker investieren. Dies ist nicht nur die Stärke von Alibaba Cloud für die nächste Phase, sondern auch die grundlegende Garantie für die langfristigen Werte der Unternehmenskunden.

Eine stabile Infrastruktur und starke Basismodelle ermöglichen es, dass Agenten tatsächlich in die Geschäftsszenarien integriert werden können.

Viele Leute, wenn sie über Agenten sprechen, richten ihre Aufmerksamkeit oft auf die Front-End-Interaktionserfahrung. Doch die echten Bewertungskriterien für Unternehmen sind meist realistischer: Ist die Plattform ausreichend stabil? Kann sie einen massiven Aufruf unterstützen? Kann sie reibungslos mit den bestehenden Systemen verbunden werden? Erst wenn die unterste Infrastruktur und die Basismodelle stark genug sind, kann man von einer wirklich guten Agentenplattform sprechen.

Die Stärke der Basismodelle bestimmt fast, in welcher Liga sie sich befinden können. Die von Alibaba selbst entwickelten Tongyi Qianwen-Serien haben in Bezug auf die chinesische Sprachverstehen, die Werkzeugnutzung und die Multimodalitätstasks eine so starke Fähigkeit, dass sie zu einem der konkurrenzfähigsten Open-Source-Systeme in China und weltweit geworden sind. In mehreren nationalen und internationalen autoritativen Bewertungen hat das Qwen-Modell in den Dimensionen der chinesischen Gesamtsfähigkeit, mathematischen und logischen Aufgaben sowie Codegenerierung weltweit Spitzenplätze erreicht. Beispielsweise hat die neueste Version von Qwen in Benchmark-Tests wie MMLU, CMMLU und AGIEval öfters internationale starke Konkurrenten wie GPT-4-turbo und Claude 3 Sonnet übertroffen.

Auf dieser Yunqi-Konferenz hat Alibaba Cloud auf einmal sechs Modelle aktualisiert und eine neue Marke vorgestellt: Qwen3-MAX mit Billionen von Parametern und Spitzenleistungen in der Programmierung und Werkzeugnutzung auf internationalen Ranglisten. Es ist in Bezug auf die Inferenz, den Code und die visuelle Darstellung auf internationales erstklassiges Niveau eingestellt. Gleichzeitig decken die abgeleiteten Versionen wie Qwen-Plus und Qwen-Flash alle Szenarien von der leichten Inferenz bis zur schweren Generierung ab. Das neue native Multimodal-Großmodell Qwen3-Omni, das Qwen3-VL, das die Welt verstehen und darauf reagieren kann, das Bildmodell Qwen-Image, das Bilder ohne Verzerrung ändern und Personen ohne Veränderung des Aussehens umkleiden kann, das Qwen3-Coder mit stark verbesserten TerminalBench-Werten, das Wan2.5-Preview zur synchronen Videoerzeugung von Ton und Bild sowie das Unternehmenssprach-Basismodell Tongyi Bailing.

Die Aktualisierung der Modelle zeigt die „Obergrenze“ der Intelligenz. Um diese Fähigkeiten tatsächlich umzusetzen, braucht es die Unterstützung von Rechenleistung, Speicher und Verwaltungssystemen.

Große Skalierbarkeit ist die erste Anforderung an KI-Plattformen in der Branche. In der realen Geschäftstätigkeit sind die Verkehrsschwankungen von Agenten oft unvorhersehbar. Es kann sein, dass heute nur einige hundert Aufrufe vorliegen, morgen aber hunderttausende. Ohne Skalierbarkeit müsste ein Unternehmen entweder wegen fehlender Rechenleistung stillstehen oder dauerhaft Ressourcen anhäufen und so enorme Kosten verursachen. Die Lösung von Alibaba Cloud ist die serverlose elastische Architektur von ACS GPU. Unternehmen können in Sekundenschnelle Instanzen von Modellen mit Hunderten von Milliarden Parametern starten und in Kombination mit dem Container-Service ACK eine Scheduling über Cluster und Regionen hinweg realisieren. Zusammen mit Inferenz-Engines wie vLLM und KServe kann die Kaltstartverzögerung erheblich reduziert werden, so dass die Rechenleistung tatsächlich wie Strom und Wasser jederzeit verfügbar ist.

Hohe Verfügbarkeit und Stabilität sind die Voraussetzung dafür, dass Unternehmen Agenten in die Kernprozesse integrieren können. Ein Fehler bei der Risikokontrolle oder ein Ausfall kann enorme Verluste verursachen. Alibaba Cloud basiert auf dem Objektspeicher OSS und behält auch bei Datenmengen im Billionenbereich die Fähigkeit zur kostengünstigen und hochparallelen Speicherung und Abfrage. Auf der Rechenschicht gewährleistet die automatische Isolierung fehlerhafter Knoten und die Selbstheilung in Minuten die kontinuierliche und stabile Ausführung von Rechenaufgaben. Auf der Datenbankebene bieten Produkte wie die Cloud-native Datenbank PolarDB eine zuverlässige Echtzeitsupport für Finanzszenarien. Diese unteren Sicherungen ermöglichen es auch, dass MoE-Modelle mit Billionen von Parametern langfristig und stabil in der Alibaba Cloud-Umgebung laufen können.

Lang- und Kurzzeitgedächtnis sowie Abfrage sind der Schlüssel dafür, ob ein Intelligentes System sich entwickeln kann. Die Branche ist sich allgemein bewusst, dass, wenn ein Agent nur „Frage-Antwort“-Konversationen führen kann und die vergangenen Gespräche und Dokumente nicht merken kann, er keine echte Produktivität schaffen kann. Alibaba Cloud hat Tablestore und Lindorm in das System integriert. Das erste trägt das Kurzzeitgespräch und das Langzeitwissensarchiv, das zweite unterstützt die einheitliche Verwaltung und Abfrage von multimodalen Daten. Sie helfen Unternehmen, SOPs, Verträge und geschäftliches Wissen zu sammeln, damit Agenten in fortlaufenden Aufgaben die vergangenen Erfahrungen nutzen und schrittweise ein echtes „Organisationsgedächtnis“ bilden können.

Die Optimierung und Beschleunigung der Inferenz sind der Kern, um zu entscheiden, ob ein Agent „wirtschaftlich“ funktionieren kann. Ein allgemeines Anliegen der Unternehmen ist: Wie lange dauert die Inferenz? Können die Kosten getragen werden? Das KI-Platform PAI von Alibaba Cloud hat auf Architekturen wie MoE, DiT und Reinforcement Learning spezielle Engines entwickelt: paiMoE verbessert die Trainingsbeschleunigung von Qwen3 um das Dreifache. paiFuser verkürzt die Stichprobenverarbeitungszeit bei der Videoerzeugung um fast ein Drittel. PAI-RL realisiert die Optimierung der mehrfachen Reinforcement Learning. Die Inferenz-Service PAI-EAS reduziert deutlich die Kaltstart- und Skalierungsverzögerung und erhöht den Durchsatz um über 70 %. Das bedeutet, dass Agenten nicht nur schneller eingesetzt werden können, sondern auch bei geringeren Kosten eine große Anzahl von Benutzern bedienen können.

Insgesamt haben die Infrastrukturen von Alibaba Cloud vier Merkmale: Große Skalierbarkeit, hohe Verfügbarkeit und Stabilität, Lang- und Kurzzeitgedächtnis sowie Abfrage und Optimierung und Beschleunigung der Inferenz. Diese Stichwörter wurden auch in den Alibaba Cloud Apsara Release Moments in den letzten Jahren wiederholt erwähnt. Sie decken die Fragen ab, die Unternehmen am meisten interessieren: „Kann es skaliert werden?“, „Darf man sich darauf verlassen?“, „Wird es vergessen?“ und „Ist es wirtschaftlich?“

02

KI-Agenten aus dem Unternehmensgeschäftsfeld entstehen lassen

Auf dieser Yunqi-Konferenz hat Wu Yongming die drei Phasen der Entwicklungspfade zur ASI erklärt: In der ersten Phase, der „Intelligenzentsprung“, gewinnt die KI durch das Lernen von riesigen Mengen an menschlichem Wissen generelle Intelligenz. In der zweiten Phase, der „Selbständigen Handlung“, erlernt die KI die Werkzeugnutzung und Programmierfähigkeit, um den Menschen zu „helfen“. Dies ist die Phase, in der sich die Branche derzeit befindet. In der dritten Phase, der „Selbstiteration“, verbindet die KI die physische Welt und lernt selbständig, um schließlich den Menschen zu „übertreffen“.

Wu Yongming hat auch erwähnt, dass wir uns derzeit in der zweiten Phase befinden. „Die gegenwärtigen Agenten sind noch in einem frühen Stadium und lösen hauptsächlich standardisierte und kurzfristige Aufgaben … In Zukunft werden vielleicht mehr Agenten und Roboter als Menschen auf der Welt mit den Menschen zusammenarbeiten und die reale Welt stark beeinflussen. In diesem Prozess kann die KI die meisten Szenarien und Daten in der realen Welt verbinden und so die Bedingungen für die zukünftige Entwicklung schaffen.“

Von der „Intelligenzentsprung“ über die „Selbständige Handlung“ bis zur zukünftigen „Selbstiteration“ erweitert sich ständig die Aufgabengrenze der großen Modelle. Die Infrastruktur-Upgrade von Alibaba Cloud zielt darauf ab, dass Unternehmen in der Lage sind, in der zunehmend komplexen Inferenz- und Planungstasks eine stabile, kontrollierbare und kostengünstige Betriebsumgebung zu haben.

Viele chinesische Hersteller haben bereits eigene Versuche unternommen. Im Vergleich zu den „anhängigen“ Erweiterungen stoßen Agenten jedoch oft auf Schwierigkeiten wie hohe Barrieren, schwierige Integration und schwierige Kostenkontrolle, wenn sie in komplexe Unternehmensprozesse eingebunden werden sollen. Alibaba Cloud BaiLian hat sich einen anderen Weg gewählt: Die Erstellung eines kompletten Systems von Grund auf, das die Modelle, die Entwicklungsrahmen und die Unternehmenswartungsanforderungen miteinander verbindet.

Um diese Probleme zu lösen, hat Alibaba Cloud das „1+2+7“-Unternehmens-Agenten-System vorgeschlagen: Ein Modell-Service, zwei Entwicklungsmodelle und sieben Schlüsselkompetenzen.

Im „1+2+7“-System von Alibaba Cloud BaiLian steht das „2“ für zwei Entwicklungsmodelle. Der low-code ADP ermöglicht es Unternehmen, wie beim Bauen mit Lego schnell Prototypen zu testen und Ideen schnell in konkrete Szenarien umzusetzen. Der high-code ADK hingegen öffnet die untersten Schnittstellen und unterstützt die tiefe Anpassung und die Massenbereitstellung komplexer Geschäftsprozesse.

Solch ein paralleles Design ist in der Branche jedoch selten. Viele Hersteller betonen entweder nur den „low-code“ und legen den Schwerpunkt auf die Benutzerfreundlichkeit, doch Unternehmen stoßen schnell auf eine Decke, die die Erweiterung erschwert. Oder sie bieten nur den „high-code“, der die Schwelle zu hoch setzt und Unternehmen dazu zwingt, viele Entwicklungsressourcen einzusetzen. Sowohl die Zeit als auch die Kosten sind kaum tragbar.

Im Gegensatz dazu ermöglicht BaiLian es Unternehmen, „schrittweise an Bord zu kommen“. In der Anfangsphase können sie den ADP nutzen, um schnell Fehler zu erkennen und effektive Anwendungsfälle zu finden. Sobald die Wirksamkeit bestätigt ist, können sie nahtlos auf den ADK umsteigen, um die tiefe Anpassung und die Massenbetrieb zu unterstützen.

So werden die Anfangsexplorationskosten gesenkt und die wiederholten Investitionen in die „Neukonstruktion“ oder „Zweitentwicklung“ vermieden. Dadurch wird die Geschäftskontinuität gewährleistet. Für traditionelle Unternehmen, die über keine starke Forschungs- und Entwicklungsteams verfügen, ist dieses zweigleisige System besonders freundlich. Sie können wie Internetfirmen schnell experimentieren und in der Massenphase die Stabilität und Erweiterbarkeit einer reifen Plattform nutzen.

Um diese Agenten tatsächlich „laufen zu