Wetten auf Agent: Der mittelfeldliche Kampf der Techriesen im Bereich KI
Während Sie noch die praktische Wertigkeit von großen KI-Modellen in Zweifel ziehen, sind KI-Agenten (AI agents) wie ein Sturm aufgetaucht und haben weltweit eine neue technologische Welle ausgelöst. An der Spitze steht die Plattform Manus, die als "der weltweit erste universelle KI-Agent" bezeichnet wird.
Manus wurde von einem chinesischen Team entwickelt. Einige bezeichnen es als den besten derzeitigen KI-Agenten, eine schwarze Technologie wie aus dem All. Die Entstehung von Manus wird als der "DeepSeek-Moment" der KI-Agenten gefeiert.
Manus nutzt ein Architektur mit kollaborierenden Multi-Agenten und kann Aufgaben automatisch bearbeiten. Wenn Sie beispielsweise 10 Bewerbungsunterlagen verarbeiten müssen, können Sie diese auf Manus hochladen. Es kann den Inhalt der Bewerbungen automatisch lesen, Daten analysieren und automatisch einen Bericht erstellen. Während es Ihnen hilft, können Sie Ihren Computer beiseite legen, sich eine Tasse Kaffee holen und später den Bericht lesen.
Im Alltag: Wenn Sie sich in einer Stadt ein Haus kaufen möchten, mussten Sie bisher mühsam die Immobilienangebote recherchieren und die Preise vergleichen. Mit Manus kann es die Aufgabe "Hauskauf" in kleinere Teilaufgaben zerlegen, Python-Skripte schreiben, um das Budget zu berechnen und Ihnen einen detaillierten Bericht wie von einer Immobilienmaklerfirma ausgeben.
Im Vergleich zu KI-Agenten erscheinen die großen generativen KI-Modelle, die auf dem "Frage-Antwort"-Muster basieren und stark von den Eingaben des Nutzers abhängen, weniger flexibel.
Ist Manus wirklich so wunderbar, wie die Außenwelt es beschreibt? Sind KI-Agenten eine echte Bedürfnisbefriedigung oder nur ein Hype? Wie reagieren die großen chinesischen und internationalen Technologieunternehmen auf diese neue technologische Welle?
1. Manus: Zwei Welten auf dem chinesischen und ausländischen Markt
Vor einigen Monaten war Manus in China ein Riesenhit. Die Einladungscodes wurden bis auf mehrere Tausend Yuan versteigert.
Am 12. Mai hat Manus die kostenlose Registrierung weltweit eröffnet. Jeder kann sich ohne Einladungscode anmelden und erhält täglich 1000 Punkte, um kostenlos Aufgaben auszuführen.
Um sich wirtschaftlich zu ernähren, bietet Manus drei Tarife für bezahlte Abonnements an, die den Nutzern mehr Zugangsberechtigungen, exklusive Funktionen und bevorzugte Dienstleistungen bieten, um über die Mitgliedschaftsgebühren Einnahmen zu erzielen.
Manus entwickelt sich ständig weiter. Am 4. Juni hat es die Funktion "KI-Text-zu-Video" eingeführt. Benutzer müssen nur einige Schlüsselwörter eingeben, und das System plant automatisch jede Szene und erstellt visuelle Effekte, um einen Teil des Marktes von Videoerstellungsprodukten wie Sora zu erobern.
Manus wird von Anhängern in China und ausländisch als technologisches Wunderwerk bezeichnet, aber der chinesische Markt akzeptiert die Bemühungen von Manus nicht.
Manus geriet in die Kritik wegen seiner Marketingstrategie. Einige halten die früher sehr begrenzten Test-Einladungscodes für eine bewusste Hunger-Marketing-Strategie.
Am schwierigsten zu akzeptieren für den chinesischen Markt ist, dass Manus ein "Wrapper"-Produkt ist. Der chinesische KI-Markt schätzt vor allem eigenentwickelte große Modelle. Manus hat kein eigenes großes Modell, sondern verwendet im Ausland Claude von Anthropic und in China Tongyi Qianwen von Alibaba. Seine Funktionen sind aus verschiedenen Anwendungen zusammengefügt. In den Augen der meisten Menschen hat es dadurch seinen Kernvorteil aufgegeben und keine Wettbewerbsvorteile.
Aber für die Silicon Valley in den USA ist das "Wrapper"-Konzept von Manus gerade sein Vorteil. Denn Manus löst das Problem der letzten Meile der KI. Selbst wenn es keine Grundlagenforschung an den Modellen vornimmt, ist die Innovation auf der Anwendungsseite sehr wichtig. Ausländische Investoren halten Manus für einen wichtigen technologischen Fortschritt.
Der Fortschritt von Manus basiert auf einer revolutionären technologischen Verbesserung der intelligenten Agenten mit dem CodeAct-Framework, das ihnen drei Kernfähigkeiten verleiht: Erstens kann es direkt Python-Code ausführen, um hochkomplexe Aufgaben zu bewältigen. Zweitens kann es die Handlungsstrategie dynamisch an die Aufgabenanforderungen anpassen. Drittens hat es die Fähigkeit zur Selbstregulation und Optimierung der Agenten. Im Wesentlichen ist dies eine technologische Innovation, die neue Anwendungsbereiche für KI eröffnet. Manus hat schnell Kapital beschafft, ist im Ausland sehr erfolgreich und hat zahlreiche Anhänger.
Das Gründerteam von Manus scheint dem Schema "Ausland zuerst" zu folgen. Der Gründer sitzt vor der Kamera und erklärt auf fließendem Englisch, welche universellen Aufgaben sein KI-Agent erledigen kann, und zeigt den Nutzern konkrete Beispiele auf dem Bildschirm.
Die International Data Corporation (IDC) prognostiziert, dass das chinesische KI-Marktvolumen bis 2026 auf 26,44 Milliarden US-Dollar steigen wird, was einem Anstieg von etwa 17,9 % gegenüber 2021 entspricht. Das weltweite KI-Marktvolumen wird bis 2026 auf 301,43 Milliarden US-Dollar geschätzt, wobei China etwa ein Elftel des weltweiten Gesamtvolumens ausmacht. Dass das Manus-Team seinen Schwerpunkt auf den ausländischen Markt legt und den riesigen chinesischen Markt vernachlässigt, scheint keine sehr rationale Entscheidung zu sein.
Der Hauptgrund für dieses Verhalten könnte sein, dass Manus als junges Unternehmen nicht mit den großen chinesischen KI-Unternehmen konkurrieren möchte.
Manus hat kein eigenes großes Modell, die Kosten sind relativ hoch, und die Preise seiner Produkte werden von den Anbietern großer Modelle begrenzt. Die Preise können nicht gesenkt werden, und es kann nicht mit den kostenlosen KI-Agenten der großen chinesischen Unternehmen konkurrieren.
In China haben die großen Unternehmen bereits begonnen, sich intensiv auf den KI-Agenten-Markt vorzubereiten, als Manus Bekanntheit erlangte.
2. Coze Space führt die neue Welle der KI-Arbeitsumgebung an
Am 18. April löste die AI-Agenten-Anwendung Coze Space von ByteDance, als es die interne Testphase eröffnete, eine Furore aus.
Eine große Anzahl begeisterter Benutzer hat den Server überlastet, und die Einladungscodes waren kaum zu bekommen. Es war genau wie bei Manus. Der Erfolg dieses Produkts zeigt die starke Nachfrage nach KI-Agenten, die die Anforderungen in konkreten Arbeitsumgebungen erfüllen können.
Coze Space kann Berichte schreiben, Recherchen durchführen, PowerPoint-Präsentationen gestalten und sogar Websites erstellen. Wenn Sie es mit einer komplexen Aufgabe konfrontieren, kann es diese in kleinere Schritte zerlegen und selbständig ausführen. Der Prozess ist einfach und schnell, was den Bedürfnissen der Arbeitsbevölkerung entspricht. Dies ist auch die Produktpositionierung von Coze Space: "Beginne deine Arbeit mit Agenten".
Coze Space hat zwei Modi: den Entdeckungsmodus und den Planungsmodus. Im Entdeckungsmodus führt es automatisch Aufgaben gemäß den Nutzereingaben aus. Im Planungsmodus gibt es zuerst einen Plan zur Aufgabenbearbeitung und beginnt dann mit der Ausführung. So kann die Interaktion zwischen dem KI-Agenten und dem Nutzer das Problem besser lösen.
Nach den Testergebnissen verhält sich Coze Space wie ein Praktikant im Büro. Der Nutzer kann ihm einfache Arbeitsaufgaben zuweisen, und es kann wie ein Mensch Daten sammeln und Ergebnisse liefern.
Wenn Sie Coze Space bitten, ein Pflanzenkunde-Spiel zu erstellen, kann es Ihnen ein Webbrowser-Spiel geben, das Wetter, Pflanzeninformationen und Sammelkarten enthält. Mit einem Klick auf die Pflanzeninformationen können Sie Wissenswertes über die Pflanzen erfahren. Darüber hinaus gibt es eine interaktive Webdatei, mit der der Nutzer den gesamten Prozess verfolgen und zu jedem Schritt springen kann, um die Details zu lesen.
Coze Space ist nicht nur zufrieden, als Praktikant für normale Benutzer zu fungieren, sondern möchte auch ein Experte in speziellen Bereichen werden, um die Anforderungen von tiefgreifenden Nutzern zu erfüllen.
Dadurch hat der Nutzer mehr Handlungsspielraum und verschiedene Modi zur Auswahl, was die Arbeitsproduktivität erhöht. Coze Space hat seine Fähigkeiten in der Marktforschung, bei der Erstellung von Aktien-Morgenberichten und im interaktiven Unterricht gezeigt, insgesamt in mehr als zehn Arbeits- und Lebenssituationen.
Allerdings ist Coze Space noch nicht perfekt. Es ist noch ein unreifes Produkt. Wenn der Nutzer zu komplexe Anforderungen stellt, kann es diese möglicherweise nicht erfüllen und kann nicht vollständig die individuellen Bedürfnisse der Nutzer befriedigen.
Im Zeitalter der ständigen Entwicklung der KI-Technologie wird 2025 als das Jahr der KI-Agenten angesehen. Die Einführung von Coze Space ist der Anfang, dass die großen Unternehmen in den Wettbewerb um KI-Agenten eintreten.
3. Der Durchbruch von Baidu Miaoda
Baidu versucht, sich im heftigen Wettbewerb um KI-Agenten einen Weg zu bahnen. Am 24. März hat Baidu in Peking eine große Pressekonferenz abgehalten und die kommerzielle Nutzung seiner eigenentwickelten generativen KI-Anwendungsplattform "Miaoda" angekündigt.
Die Frage ist: Es gibt in der KI-Branche ein Dutzend Unternehmen, die Programmierwerkzeuge entwickeln. Was macht Miaoda so besonders?
Die Antwort liegt in drei Worten: "Codefrei".
Andere KI-Programmierwerkzeuge erfordern von den Nutzern einen gewissen Programmierkenntnisstand, um später Änderungen vornehmen zu können. Miaoda erfordert keine Programmierkenntnisse. Solange der Nutzer eine Idee hat und sie ausdrücken kann, kann er wie ein Programmierer Anwendungen entwickeln.
Li Yanhong sagte: "Solange Sie eine Idee haben, können Sie Ihre Träume verwirklichen. Wir stehen vor einer Zeit, in der man nur mit Ideen Geld verdienen kann."
Diese Aussage basiert auf drei Eigenschaften von Miaoda: codefreies Programmieren, kollaborierende Multi-Agenten und die Fähigkeit, mehrere Werkzeuge aufzurufen.
Zuerst das codefreie Programmieren: Aufgrund der Entwicklungsfähigkeit des Wenxin-Modells ist das Programmieren für jedermann zugänglich und hat die traditionelle Programmierweise revolutioniert. Die kollaborierende Multi-Agenten-Architektur zerlegt automatisch komplexe Aufgaben und koordiniert die Aktivitäten verschiedener Agenten. Der Vorteil besteht darin, dass die Effizienz und Qualität der Entwicklung komplexer KI-Anwendungen verbessert werden. Die Fähigkeit, mehrere Werkzeuge aufzurufen, integriert die Werkzeuge und Dienstleistungen aus dem Baidu-Ökosystem. Nutzer müssen nur ihre Anforderungen beschreiben, und das System gibt das beste Ergebnis aus.
Einfach ausgedrückt: Beschreiben Sie Ihre Anforderungen in chinesischer Sprache, und Miaoda gibt Ihnen eine Programmieranwendung.
Wenn Luobo Kuaipao eine Pressekonferenz organisieren möchte, aber nicht weiß, wie man ein Online-Anmeldesystem erstellt, kann es Miaoda nutzen. Nach der Beschreibung der genauen Anforderungen und dem Hochladen einer Datei mit Zeit, Ort und Thema der Konferenz wird Miaoda Ihnen ein funktionierendes Anmeldesystem für die Pressekonferenz geben.
Nachdem viele Nutzer Miaoda benutzt haben, haben sie festgestellt, dass es nicht das perfekte Produkt ist, wie es in der Werbung dargestellt wird.
Miaoda funktioniert gut bei der Entwicklung einfacher Spiele und Websites, aber bei komplexeren Anwendungen wie einem intelligenten Quizsystem ist die Verständnisfähigkeit des Produkts nicht stark genug. Es muss mit einer großen Anzahl von Eingabewörtern justiert werden, und der Vorgang ist recht umständlich.
Insbesondere bei der Änderung komplexer Anwendungen kann man nur über die Dialogfunktion Änderungen vornehmen und kann den Quellcode nicht herunterladen. Dies ist für die Nutzer ein deutlicher Nachteil. Wenn das erstellte Produkt Probleme hat, ist die Problemlösungskapazität von Miaoda zweifelhaft, und es ist für den Nutzer schwierig, mit dem Server zu interagieren.
Insgesamt ist die Funktion von Miaoda noch relativ stark. Wenn ein Programmierer keine grafische Benutzeroberfläche hat, kann er Miaoda als Referenz nutzen, aber es kann nicht als Produktionswerkzeug verwendet werden. Die Ergebnisse liegen auf einem akzeptablen Niveau, aber insgesamt ist es eher durchschnittlich. Es hat etwas zu bieten, aber nicht viel.
4. Quark und DingTalk: Alibabas Doppelfront-Strategie
Während die Konkurrenten noch über die Form von Agenten diskutieren, hat Alibaba bereits KI-Agenten in der Geschäftspraxis eingesetzt, um echten Wert zu schaffen.
Zuerst Quark: Quark hat sich von einem einfachen Browser zu einer vielseitigen AI-gestützten App "Neues Quark" entwickelt. Die Super-Suchleiste von Quark bricht mit dem traditionellen Suchmodell. Wenn der Nutzer seine Anforderungen in der "Leiste" beschreibt, kann er einen Bericht, eine Anleitung oder einen Plan erhalten, der von der KI mit Hilfe aller verfügbaren Werkzeuge erstellt wird. Es ist ein KI-Agent, der Ergebnisse liefert.
Bei einer Werbekampagne von Quark gab es eine Plakatwerbung mit der Aufschrift "Verabschiede dich von der Suche". Dies ist der Kernvorteil von Quark. Die Super-Suchleiste ist nicht nur ein Suchwerkzeug, sondern ein KI-Produkt, das den Nutzern hilft, Probleme zu lösen. Es kann alle internen Werkzeuge von Quark nutzen, um den Nutzern Dienstleistungen anzubieten.
Als App mit dem Label "All in One" kann der Nutzer in der Quark-Super-Suchleiste nicht nur Text eingeben, sondern auch Fotos aufnehmen oder Spracheingaben tätigen, was die Bedienung vereinfacht.
Da Quark auf das Alibaba-Ökosystem zurückgreifen kann, kann es Einkaufsdaten von Taobao, Standortdaten von Gaode und Transaktionsdaten von Alipay nutzen, um den Nutzern hochpersonalisierten Service zu bieten.
Dann DingTalk: Wenn Quark ein C-Endprodukt für die Privatpersonen ist, ist DingTalk eine klassische Unternehmensplattform.
DingTalk hat