Ist der AI-Agent die größte Geschäftschance oder nur eine Blase im Jahr 2025?
ChatGPT kann nicht nur „reden“, sondern beginnt auch damit, „zu handeln“.
Am frühen Morgen des 18. Juli präsentierte Sam Altman zusammen mit vier Forschern von OpenAI in einer Live-Übertragung offiziell ChatGPT Agent – ein universelles künstliches Intelligenz-Agenten-Tool. Dies hat OpenAI, das seit langem keine großen Schritte unternommen hatte, erneut in den Fokus gerückt.
Funktionsmäßig unterscheidet sich ChatGPT Agent nicht wesentlich von bereits auf dem Markt befindlichen Agenten-Produkten. Es kann Tabellen erstellen, Informationen recherchieren und Aufgaben ausführen. Dennoch wird es von vielen als ein weiterer „Trumpf“ von OpenAI angesehen, da es eine neue, immer populärer werdende Richtung bestätigt: Das Modell ist der Agent.
Seit Anfang dieses Jahres setzen immer mehr Großmodell-Unternehmen auf das Konzept „Modell ist Agent“. Die neuen Produkte, die von xAI, Kimi, Lingyiwanwu und Alibaba Cloud vorgestellt wurden, stehen alle in irgendeiner Weise mit diesem Konzept in Verbindung.
Was bedeutet „Modell ist Agent“? Warum sind die Großmodell-Unternehmen so begeistert?
1
„Modell ist Agent“
Der unvermeidliche Weg zu AGI?
Vor 2025 schienen Großmodelle und Agenten auf getrennten Wegen zu liegen.
Üblicherweise wird erklärt, dass große Sprachmodelle wie ein wissensreicher Assistent fungieren, der Fragen beantworten und Texte generieren kann, aber an Initiative und Durchsetzungsvermögen mangelt. Ein „Agent“ hingegen ist eher wie ein virtueller Mitarbeiter mit klar definierten Zielen und eigener Denkfähigkeit. Er kann nicht nur Anforderungen verstehen, sondern auch eigenständig handeln, Aufgaben ausführen und sogar mit der externen Umgebung interagieren.
Nehmen wir als Beispiel Manus, das weltweit erste universelle KI-Assistent-Tool, das im vergangenen Jahr viel Aufmerksamkeit erregte. Durch die Integration mehrerer zugrunde liegender Modelle hat es die Fähigkeit, einen geschlossenen Kreis von Planung über Ausführung bis hin zur Ausgabe zu bilden. Es ist wie eine Kombination mehrerer Tools in einem Agenten, und obwohl es als eine Art „Frankenstein“ betrachtet werden kann, ist die Qualität dieser Kombination dennoch beachtlich.
Damals haben jedoch Fachleute darauf hingewiesen, dass die Barrieren für universelle Agenten nicht allzu hoch sind. Li Dahai, Mitbegründer und CEO von Mianbi Intelligence, sagte einst: „Wenn sich die Version eines Großmodells in Qualitätsprüfen verbessert, neigt es dazu, die gesamte Anwendungsökosystem des vorherigen Modells zu überflügeln.“
Im Jahr 2025 wird der Weg „Modell ist Agent“ immer deutlicher.
Unter „Modell ist Agent“ versteht man, dass das Großmodell selbst zum Kerngehirn und Antriebsaggregat des Agenten wird. Anders als in der Vergangenheit, als es auf komplexe Workflow-Planungen oder die Integration externer Modelle ankam, entwickelt sich die KI nun von einem bloßen „Geschwätzigen“ zu einem „Tätigen“. Dieser Wandel macht die KI zu einem intelligenten Assistenten, der den Nutzern tatsächlich bei der Erledigung von Aufgaben helfen kann.
Nehmen wir ChatGPT Agent als Beispiel. Anders als Manus führt es den gesamten Prozess des Skill-Aufrufs und der Aufgabenausführung innerhalb eines einzigen Modells durch. Währenddessen kann der Nutzer in Echtzeit die Aktionen der KI auf einem virtuellen Computer verfolgen und den gesamten Prozess von der Anforderungsverständnis über die Werkzeugauswahl und die Aktion bis hin zur Ergebnislieferung erleben. Diese „beobachtbare und interaktive“ Agenten-Form ist die einzigartige Innovation von OpenAI auf der technologischen Grundlage.
Bisher war das weltweit anerkannteste Großmodell mit der besten Programmierfähigkeit die Claude 4-Serie von Anthropic. Sie hat in Bezug auf Programmierung, logisches Denken und Agentenfähigkeiten „neue Standards gesetzt“ und kann komplexe und langwierige Aufgaben bewältigen. Viele Agenten basieren sogar auf einem „umhüllten“ Claude 4.
Dadurch ist Claude 4 zum Zielscheibe geworden. Am 9. Juli veröffentlichte xAI, das KI-Startup von Elon Musk, ein neues Großmodell namens Grok 4, das in zwei Versionen – Einzel-Agent und Multi-Agent – erhältlich ist und Funktionen wie Werkzeugnutzung und Echtzeit-Suche bietet. Es ist direkt auf Claude 4 Opus ausgerichtet.
Viele chinesische Großmodell-Unternehmen haben sich ebenfalls gewendet.
Ende des vergangenen Jahres veröffentlichte Mianbi Intelligence in Zusammenarbeit mit der Tsinghua-Universität ein neues Paradigma für die Interaktion mit aktiven Agenten. Agenten sind nicht mehr bloße Befehlsausführungen, sondern werden zu intelligenten Assistenten mit „Fingerspitzengefühl“. Li Dahai glaubt, dass das Modell selbst, nicht der Workflow, die zukünftige Richtung für KI-Agenten ist. „Das Modell ist der Agent, das Modell ist das Produkt, das Modell ist die Interaktion“, sagt er.
Am 11. Juli dieses Jahres stellte Kimi nach einem halben Jahr ein neues Basis-Modell namens Kimi K2 vor. Laut offizieller Angaben ist Kimi K2 ein Basis-Modell mit MoE-Architektur, das über stärkere Programmierfähigkeiten verfügt und sich besonders gut für universelle Agenten-Aufgaben eignet. Das Modell integriert selbst die Fähigkeit zur eigenständigen Entscheidungsfindung und Aufgabenausführung und kann als Agent komplexe Aufgaben lösen.
Am frühen Morgen des 23. Juli veröffentlichte Alibaba Cloud das neue Open-Source-Programmier-Großmodell Qwen3-Coder von Tongyi Qianwen. Auch dieses Modell betont die Agentenfähigkeit und ist besonders gut darin, langwierige, mehrstufige Aufgaben zu lösen. Es kann nicht nur den Überblick über die gesamte Aufgabe behalten und die Arbeit selbständig planen, sondern auch die Nutzung verschiedener Werkzeuge durch Agenten unterstützen, um schließlich komplexe Programmieraufgaben zu bewältigen.
2
„Halluzinationen können vielleicht nicht so schlecht sein“
Warum setzen all diese Großmodell-Unternehmen auf das Konzept „Modell ist Agent“?
„Das Konzept „Modell ist Agent“ spiegelt eine grundlegende Veränderung in unserem Verständnis der KI wider. Es geht nicht nur um technische Architekturänderungen, sondern auch um die Veränderung der Zusammenarbeit zwischen Mensch und Maschine“, sagte Fan Ling, Gründer und CEO von Tezign, einem Technologieunternehmen, in einem Interview mit einem Reporter der IT Times. Aus seiner Sicht liegt der Kernwert von „Modell ist Agent“ darin, dass große Sprachmodelle das Verhalten echter Nutzer simulieren können. Die KI kann nicht nur Fragen beantworten, sondern auch eigenständig Nutzerprofile erstellen und Entscheidungsprozesse antreiben.
Wenn man beispielsweise alle Geschichten aus der Harry-Potter-Serie in ein Großmodell eingibt, kann das Modell zu „Harry Potter“ werden und sogar wie Harry Potter denken.
Diese logische Veränderung wird eine deutliche Veränderung in der Branche bewirken. Agenten müssen sich von einem „Werkzeugdenken“ zu einem „Kollaborationspartner-Denken“ hin entwickeln. Dies wird sogar einige bisherige Vorstellungen über KI in Frage stellen. „Früher befürchtete man Halluzinationen, aber tatsächlich können sie vielleicht sogar von Vorteil sein. Wenn wir möchten, dass die KI eigenständig denken kann, müssen wir in der logischen Ebene von der derzeitigen Priorität der Konvergenz zur Priorität der Divergenz übergehen und die Denkweise der KI so offen wie möglich gestalten.“ Fan Ling glaubt, dass dieser Weg möglich ist, aber der Schlüssel liegt derzeit darin, die richtigen Anwendungsfälle zu finden.
Eine Analyse von CICC zeigt, dass das grundlegende Großmodell immer noch der Schlüssel für die Höchstleistung eines Agenten ist. Die Programmier- und Agentenfähigkeiten von Großmodellen sind die Schwerpunkte des Wettbewerbs zwischen den Herstellern.
Im Vergleich zu der schwierigeren Route „Modell ist Agent“ bietet der C-End-Agentenmarkt größere Potentiale. Das kollaborative Modell von multi-Agenten, ähnlich wie bei Manus, bei dem verschiedene Agentenrollen Aufgaben aufteilen, um vielfältige Aufgaben zu bewältigen, ist derzeit weit verbreitet.
Nach der Veröffentlichung von ChatGPT Agent veröffentlichte Manus sofort zehn praktische Beispiele, um zu zeigen, dass ChatGPT Agent in Bezug auf das Schließen von Aufgabenkreisen und die visuelle Ergebnislieferung nicht überlegen ist.
Allerdings ist es derzeit allgemein anerkannt, dass die Anwendung von universellen Agenten noch in der Anfangsphase ist und sich in einem Prozess der Erkundung von Geschäftsszenarien und der technischen Validierung befindet.
Die Marktberatungsfirma Gartner ist der Meinung, dass es immer noch „Blasen“ in diesem Markt gibt. Es wird geschätzt, dass bis Ende 2027 über 40 % der Agenten-Projekte abgebrochen werden werden.
Fan Ling stimmt dieser Meinung zu. Er glaubt, dass wie bei jeder neuen Technologie auch der Bereich der Agenten einen Zyklus von „Übererwartung“ und „rationaler Rückkehr“ durchlaufen wird. „Der Schlüssel zum Überleben liegt darin, ob der Agent geschäftliche Kernprobleme lösen kann und ein Gleichgewicht zwischen Technologie und Kosten herstellen kann. In unseren Atypica.AI-Projekten von Tezign haben wir festgestellt, dass die Zahlungsbereitschaft der Nutzer deutlich steigt, wenn die KI direkt Ergebnisse liefern kann.“
3
Das Marktgeschehen hat sich verändert
Die KI-Technologie entwickelt sich weiterhin rasant, aber die Realität ist, dass sich seit 2025 die Marktlage für Großmodell-Unternehmen erheblich verändert hat.
Zu Jahresbeginn trat DeepSeek mit einem kostengünstigen und leistungsstarken Open-Source-Modell stark auf den Markt ein. Die sechs aufstrebenden Unternehmen, die im vergangenen Jahr viel Aufmerksamkeit erregten – Zhipu AI, MiniMax, Kimi, Jieyue Xingchen, Baichuan Intelligence und Lingyiwanwu – haben alle unterschiedliche Veränderungen in Bezug auf Finanzierung, Traffic und Marktanteil erfahren. Außer Zhipu AI und Jieyue Xingchen haben die anderen Unternehmen seit der zweiten Hälfte von 2024 keine weitere Finanzierung erhalten.
Zur gleichen Zeit gehen auch Nachrichten über Nutzerverluste, Abgänge von High-Level-Managern und die Abschaffung von Geschäftsbereichen die Runde. Vor allem Baichuan Intelligence und Lingyiwanwu haben frühzeitig die Trainierung von Basis-Großmodellen aufgegeben und ihre Strategie eingeschränkt. Baichuan Intelligence konzentriert sich jetzt auf die AI-Applikationen in der Medizinbranche, während Lingyiwanwu auf die Umsetzung von AI in verschiedenen Branchen setzt.
Intelligente Agenten, die direkt „handeln“ können, sind zum zweiten großen Trend in der globalen Tech-Szene geworden. Die Marktberatungsfirma Gartner hat AI-Agenten als die wichtigste strategische Technologietendenz von 2025 bezeichnet.
Bezüglich der Umsetzung von AI-Agenten gibt es verschiedene Ansätze.
Quelle: unsplash
Zu Jahresbeginn dieses Jahres sprach ein Reporter der IT Times mit mehreren Branchenexperten über die Zukunft von Agenten. Yang Guosheng, Vizepräsident von Fanwei, sagte damals in einem Interview mit dem Reporter: „Wenn man ein universelles Großmodell in einem vertikalen Bereich anwendet, ist seine Stabilität oft enttäuschend. Dies bedeutet, dass in der B-End-Markt die Genauigkeit besonders wichtig ist. Es bedarf vieler technischer Eingriffe, um sicherzustellen, dass es tatsächlich die gewünschten Ergebnisse in einem Unternehmenskontext erzielt.“
Nach einem halben Jahr ist Agenten immer noch ein Trend, aber es scheint, dass es nicht mehr der gleiche Agent ist.
„Seit Anfang dieses Jahres hat sich der Bereich der Agenten grundlegend verändert“, sagt Fan Ling. In den Atypica.AI-Projekten von Tezign hat er festgestellt, dass viele Menschen Agenten immer noch als eine verbesserte Version traditioneller Werkzeuge betrachten. Tatsächlich hat sich jedoch die Bedeutung von Agenten verändert. Vor allem nachdem die logischen Fähigkeiten von Großmodellen deutlich verbessert wurden, kann die KI in Kombination mit verschiedenen Werkzeugen direkt Ergebnisse liefern. Multi-Agenten werden ein noch größeres Potenzial haben.
Dennoch ist Fan Ling der Meinung, dass universelle Agenten nicht alle Probleme lösen können. Wenn die Technologie auf ungedeckte Bedürfnisse stößt, entsteht ein Nährboden für die Entwicklung. Der Wert von vertikalen Agenten liegt darin, dass sie spezifische Branchenprobleme lösen können.
4
Bequemlichkeit geht Hand in Hand mit Risiken
Zur gleichen Zeit dürfen einige Risiken nicht vernachlässigt werden.
Technisch gesehen kann das KI-Modell Risiken wie Bias aufweisen. Beispielsweise kann Algorithmus-Diskriminierung zu unfairen Ergebnissen führen. Unzureichende Trainingsdaten oder fehlerhafte Anwendungen können auch dazu führen, dass das Modell versagt. Darüber hinaus darf man die Netzwerksicherheit nicht außer Acht lassen. DeepSeek war beispielsweise schon einmal Opfer eines DDoS-Angriffs.
Ein Reporter der IT Times bemerkte auch, dass OpenAI nach der Veröffentlichung von ChatGPT Agent eine ausführliche Warnung herausgab, in der die Nutzer auf die potenziellen Risiken der Nutzung von AI-Agenten hingewiesen wurden. Obwohl ChatGPT Agent in der Lage ist, komplexe Aufgaben zu bewältigen, betont OpenAI, dass die potenziellen Risiken des Produkts immer noch bestehen. Beispielsweise können kriminelle Elemente versuchen, die AI-Agenten zu täuschen, um private Informationen zu erhalten oder unangemessene Handlungen auszuführen.
Quelle: unsplash
Deshalb hat OpenAI die Kontrolle über hochriskante Aufgaben verstärkt und mehrere Sicherheitsmaßnahmen ergriffen: Kritische Aktionen müssen von den Nutzern explizit autorisiert werden; Hochriskante Aufgaben (wie das Senden von E-Mails) er