Gibt es bei KI mehr als nur große Modelle? Warum wird Agent zum Hype in 2025? | Ein Gespräch mit Liu Zhiyi
36Kr "Karriere-Bonus" (ID: ZhiChangHongLi)
In den letzten zehn Jahren sind in China Tausende von Millionen Internetprodukten entstanden, aber nur 44 von ihnen haben noch immer eine monatliche Aktivität von über einer Milliarde Benutzern. Neun von ihnen sind in den letzten zehn Jahren entstanden, und mehr als die Hälfte davon gehören ByteDance, zwei gehören Tencent [1].
Bisher war es fast unmöglich, ByteDances "Herrschaft" in den To-C-Produkten zu erschüttern. Im Frühlingsfest 2025 wurde DeepSeek die erste Applikation in der Geschichte, die ohne Marketingkosten binnen eines Monats nach dem Start über eine Milliarde Downloads erreichte.
Davor war Byte gerade in die Gerüchte verwickelt, dass es monatlich über 100 Millionen Yuan für Werbeplatzierungen ausgegeben habe. In diesem kampflosen Kampf hat DeepSeek [2] die zehn Jahre andauernde "Herrschaft" namhafter Großkonzerne gebrochen und den Branchenmitgliedern Zuversicht geschenkt.
Aber im Bereich der Basis-Modelle, in dem die Giganten die Macht teilen, gibt es keinen Platz für neue Start-up-Unternehmen mehr.
Damit die KI weiterentwickelt werden kann, braucht der Markt neue Geschichten.
Nach dem Ende des Sturms beginnt alles von Neuem. Der Fortschritt der Inferenzfähigkeit von DeepSeek hat die Entwicklung von AI-Agenten, repräsentiert durch Manus, vorangetrieben. Die Verbesserung der Inferenzfähigkeit bedeutet, dass das große Modell die Absichten der Benutzer tiefer verstehen kann und die Genauigkeit der Entscheidungsfindung und der Inhaltsgenerierung erhöhen kann. Laut öffentlichen Daten haben sich innerhalb von nur zwei Tagen nach der Veröffentlichung von Manus über 1,2 Millionen Menschen angemeldet, und dieser Wert stieg später auf 2,6 Millionen. Wenn die Kosten für eine einzelne Aufgabe von Manus nicht 2 US-Dollar betragen würden, würde diese Zahl weiter steigen.
Manus hat die Begeisterung des Marktes für Agenten bestätigt. Nach Manus sind immer mehr Konkurrenten wie Baidu Xinxiang, Genspark, Fellou und Coze Space aufgetaucht, und AI-Agenten sind zur nächsten Richtung geworden, die die Unternehmen anstreben.
Agenten sind der Trend, um den sich alle Unternehmen im Jahr 2025 bemühen.
Die derzeitigen Agenten haben Nachteile wie langsame Reaktionszeit, Neigung zu Halluzinationen und unfreundliche reinen Texteingaben. Aber trotz dieser Mängel haben Agenten nicht nur ein kluges "Gehirn" in Form eines großen Modells, das Aufgaben autonom ausführen und die Effizienz erhöhen kann, sondern können auch dem großen Modell "Hände und Füße" geben, um die Welt zu erkunden und sogar Skaleneffekte zu erzielen. Durch Ingenieurtechnik können die Modelle die Fähigkeit zur kontinuierlichen Reflexion und zum Lernen erlangen - etwas, das mit der bestehenden Modellstruktur nicht möglich ist.
Andererseits hat der Markt auch mit echten Geldern abgestimmt: Manus hat im April eine Finanzierung in Höhe von 75 Millionen US-Dollar abgeschlossen, und sein Unternehmenswert hat sich verzehnfacht. Gleichzeitig haben die Branchenriesen laut geworden. Der CEO von OpenAI, Sam Altman, hat gesagt, dass Agenten im Jahr 2025 der Arbeitskräfte hinzugefügt werden; der CEO von Microsoft, Satya Nadella, hat vorhergesagt, dass Agenten bestimmte wissensbasierte Jobs ersetzen werden.
Wenn Technologie-Riesen und Kapitalmärkte gemeinsam auf die Zukunft von Agenten setzen, hat "Karriere-Bonus" den Autor von "Das Zeitalter der Agenten", Liu Zhiyi, eingeladen, tiefgehende Analysen anzubieten: Was sind Agenten? Wie wird sich die Arbeitswelt des Menschen im Zeitalter der Agenten neu gestalten? Wie wird sich der Kernwert des Menschen ändern, wenn Agenten repetitive Arbeiten übernehmen?
Liu Zhiyi ist ein führender chinesischer Wissenschaftler auf dem Gebiet der Künstlichen Intelligenz. Derzeit ist er Forscher am Qingyuan-Institut der Shanghai Jiao Tong Universität und gleichzeitig Chefscientist für Künstliche Intelligenz eines börsennotierten Unternehmens. Seit mehr als zehn Jahren hat er intensiv an der KI geforscht und praktiziert. Er hat in AI-Unternehmen wie Baidu und SenseTime gearbeitet und sich hauptsächlich auf intelligente Berechnungen, räumliche Intelligenz und die Ausrichtung von Super-KI konzentriert. Er wurde von Forbes China 2024 zu einem der "Zehn einflussreichsten Personen in der Künstlichen Intelligenz" ernannt. Darüber hinaus hat er mehrere akademische Monographien und populärwissenschaftliche Bücher wie "Die Enstehung der Intelligenz", "Embodied Intelligence" und "Digital Economics" geschrieben.
"Wenn standardisierte Denkweisen zur Norm werden, wird nicht-standardisierter Inhalt immer knapper." Liu Zhiyi ist der Meinung, dass im kommenden Zeitalter der Agenten nicht-standardisierte berufliche Eigenschaften - wie vielfältigere, komplexere und untypischere - der Kernwettbewerbsvorteil des Menschen gegenüber der Künstlichen Intelligenz sein werden.
[1] Datenquelle: "Das Produktparadigma der Großkonzerne wird erschüttert, und die Chancen für Start-ups kehren zurück."
[2] DeepSeek ist das Mutterunternehmen von DeepSeek, offiziell "Hangzhou DeepSeek Künstliche Intelligenz Grundlagenforschungstechnologie Co., Ltd.". Es wurde am 17. Juli 2023 von dem bekannten quantitativen Vermögensverwaltungsriesen Magic Square Quant gegründet. Der Unternehmenssitz befindet sich in Hangzhou, Provinz Zhejiang.
Was sind Agenten und was ist der Wert des Menschen im Zeitalter der Agenten? ╱ 1
Welche Zukunft wird der Arbeitsmarkt durch Agenten erhalten? ╱ 2
Was sind Agenten und was ist der Wert des Menschen im Zeitalter der Agenten?
Karriere-Bonus: Warum wird gesagt, dass DeepSeek ein neues Zeitalter der Agenten eröffnet hat?
Liu Zhiyi : Der Begriff "Agent" ist nicht neu. Das theoretische Framework wurde erstmals 1986 von Marvin Minsky in seinem Buch "The Society of Mind" systematisch vorgestellt. Natürlich hat sich der Begriff der Agenten im Laufe der Zeit auch verändert. Im engeren Sinne verstehen wir heute unter Agenten Tools, die auf der Grundlage von großen Modellen in der Lage sind, autonom Pläne zu entwickeln, Werkzeuge zu nutzen und multimodale Fähigkeiten zu besitzen. Es ist auch die technische Logik, die die Fähigkeiten der KI von passiver Reaktion zu aktiver Ausführung hochstuft.
Wenn wir heute über Agenten sprechen, sprechen wir oft über DeepSeek oder das Zeitalter der großen Modelle. Zurzeit gibt es zwei Logiken, um den Fortschritt der Künstlichen Intelligenz zu beurteilen: Erstens, dass die großen Modelle von passiven Werkzeugen zu aktiven Systemen werden, ein Prozess von Passivität zu Aktivität; zweitens, die Zusammenarbeit zwischen großen Modellen und Menschen. Anfangs waren die Fähigkeiten der Modelle möglicherweise schlechter als die der Menschen, aber allmählich haben sie die Fähigkeiten der meisten Menschen übertroffen, was bedeutet, dass das Intelligenzniveau der Modelle steigt. DeepSeek ist genau der Schritt, der diesen Prozess vorantreibt.
Karriere-Bonus: Welche Beziehung besteht zwischen Agenten und digitalen Personen? Ist es jetzt der richtige Zeitpunkt, um Agenten mit embodied intelligence zu verbinden?
Liu Zhiyi : Digitale Personen betonen eher eine multimodale visuelle Technologie. Zwischen 2015 und 2022 sind viele digitale Personen auf dem Markt erschienen, und es gibt auch relativ ausgereifte Anwendungen. Agenten hingegen sind eine tiefere technische Fähigkeit. Man kann sich vorstellen, dass die technologische Entwicklung von Agenten die digitale Person oder die Automatisierung anderer Softwareprojekte vorantreiben kann.
Karriere-Bonus: Innerhalb von nur zwei Monaten nach Manus sind Konkurrenten wie Baidu Xinxiang, 360, Genspark, Fellou und Coze Space aufgetaucht, aber nur wenige von ihnen sind wirklich öffentlich nutzbar. Auf was basiert die Entwicklung von Agenten hauptsächlich, und wo liegen die derzeitigen Engpässe?
Liu Zhiyi : Die Planung und Entscheidungsfindung von Agenten hängen von dem "Gehirn" des großen Modells ab, d. h. von den Fortschritten der Basis-Modelle. Je stärker die Fähigkeiten der Basis-Modelle sind, desto stärker sind die Automatisierungs- und Generalisierungsfähigkeiten der Agenten bei der Ausführung komplexer Aufgaben. Der Durchbruch in dieser Hinsicht war die Verbesserung der Inferenzfähigkeit, die Kimi 1.5 und DeepSeek vor dem Frühlingsfest gebracht haben.
Ein weiterer Kernpunkt bei Agenten ist die langfristige, enge dynamische Suche und die Modalitätsverknüpfung. Nehmen wir einen medizinischen Agenten als Beispiel. Wir möchten, dass er bei der Diagnose die Krankheitssymptome des Patienten merkt und auf der Grundlage dieser Symptome eine Suche durchführt, um eine Reihe von Aufgaben auszuführen, anstatt dass seine Diagnose oder seine Handlungen voller Halluzinationen sind.
Karriere-Bonus: Welche relativ ausgereiften Anwendungsfälle für Agenten sehen Sie derzeit?
Liu Zhiyi : Zurzeit hat sich das Framework für die Zusammenarbeit mehrerer Agenten noch nicht gebildet, daher werden hauptsächlich Anwendungen in vertikalen Branchen getestet. Beispielsweise werden in der Kundenservicebranche viele große Anbieter bereits massiv Agenten-Kundenservice einsetzen. Auch in der Finanzbranche werden Agenten für intelligente Anlageberatung und intelligente Anlageforschung getestet. Im Gesundheitswesen gibt es auch Agenten-Ärzte, die bei der Diagnose unterstützen.
Karriere-Bonus: Auf dem Markt haben die Unternehmen, die an Agenten arbeiten, möglicherweise unterschiedliche Ansätze. Gibt es insgesamt verschiedene Schulen?
Liu Zhiyi : Die Unternehmen, mit denen ich gesprochen habe, lassen sich grob in zwei Kategorien einteilen. Eine Kategorie ist die "Technologie", die andere ist die "Anwendungsbranche".
Die Technologie-Unternehmen bieten ein technologisches Framework an, mit dem die Kosten für die Nutzung von Agenten gesenkt werden können. Diese Unternehmen versuchen, dieses Framework zu einem standardisierten Werkzeug zu machen, das von anderen Unternehmen für die Nutzung von KI eingesetzt werden kann. Manus hat angegeben, dass die Kosten für eine einzelne Aufgabe etwa 2 US-Dollar betragen, hauptsächlich aufgrund der Abhängigkeit von der Claude 3.5-API von Anthropic und des hohen Rechenleistungsbedarfs (die Token-Menge pro Aufgabe erreicht die Million).
Die andere Kategorie sind die Unternehmen, die ich gerade erwähnt habe, die vertikale Anwendungen in Branchen wie Lieferdienst, Finanzwesen und Gesundheitswesen entwickeln.
Es gibt auch eine Art von Unternehmen, auf die man normalerweise nicht so viel achtet, die offene Protokolle entwickeln. Nehmen wir die am häufigsten verwendeten Sozialmedien als Beispiel. Wenn diese Apps keine Lieferdienstfunktion haben, können sie ein offenes Protokoll entwickeln, mit dem die Benutzer auf ihrer eigenen Benutzeroberfläche auf externe Lieferdienstplattformen zugreifen können, um Bestellungen aufzugeben. Dies ähnelt etwas der Apple Intelligence von Apple.
Karriere-Bonus: Welche technologischen und kommerziellen Durchbrüche würden bedeuten, dass der Markt für Agenten seine Endphase erreicht?
Liu Zhiyi : Erstens ist die Verbesserung der Fähigkeit zur Zusammenarbeit von Agenten zwischen verschiedenen Organisationen wichtig. Dies würde dazu führen, dass die hierarchische Architektur mehrerer Agenten sich zu einem einheitlichen technologischen Framework zusammenzieht und standardisierte technische Werkzeuge entstehen.
Zweitens ist die Verbesserung der Interaktionsfähigkeit von Agenten mit der physischen Welt wichtig. Wenn die Omniverse-Physiksimulationsplattform von NVIDIA und die dazugehörige Weltmodellgenerierungstechnologie entwickelt und praktisch angewendet werden können, wird dies ein wichtiger technologischer Durchbruch im Bereich der KI sein.
Drittens ist die Reife der Open-Source-Ökosysteme wichtig. Das von DeepSeek veröffentlichte R1 ist ein typisches Beispiel für die Ergebnisse der Modell-Open-Source. Die Reife des technologischen Frameworks der Open-Source-Ökosysteme für Agenten wird auch zu einem zehn- oder hundertfachen Wachstum des Marktvolumens führen.
Welche Zukunft wird der Arbeitsmarkt durch Agenten erhalten?
Karriere-Bonus: Welche Jobs werden in Zukunft möglicherweise stark mit Agenten kooperieren?
Liu Zhiyi : Dies kann aus zwei Perspektiven betrachtet werden. Einerseits wird oft angenommen, dass die KI Jobs mit hoher Wiederholung und geringer Kreativität ersetzen wird, aber in der Praxis wird eher die Zusammenarbeit zwischen Menschen und KI die bestehende Arbeitsweise ersetzen. Ein Experiment, das von einem Studenten während eines Austauschs an der Universität von Hongkong durchgeführt wurde, hat gezeigt, dass Buchhalter, Anwälte und andere, die die KI verstehen, ihre Arbeit effizienter erledigen können. Daher kann der individuelle Arbeitswert eher von Kollegen, die die KI verstehen, ersetzt werden, als dass die KI direkt den Job ersetzt.
Andererseits möchten Unternehmen von der Unternehmensleitung aus die Effizienz steigern und die Organisation verändern, indem sie Agenten-Clustern nutzen. Dies führt dazu, dass mittlere Manager zu "Kognitionsarchitekten" werden, die systemisches Denken, Mensch-Maschine-Kooperationsdenken und die Optimierung des Zielmanagements und der Teamzusammenarbeit durch KI-Werkzeuge beherrschen müssen. Wie die Dampfmaschine das Handwerkssystem erschüttert hat, wird das Zeitalter der Agenten das Konzept des "Superindividuums" und des Agenten-Clusters hervorbringen, und neue Berufe wie KI-Trainer werden entstehen.
Karriere-Bonus: Welche Branchen glauben Sie, werden zuerst von Agenten tiefgreifend verändert oder neu strukturiert werden?
Liu Zhiyi : Wir können sehen, dass die Branchen Gesundheitswesen, Finanzwesen, Fertigung und Bildung bereits tiefgreifende Innovationen vornehmen. Dies umfasst auch die intelligente Regierung. Beispielsweise hat der Distrikt Futian in Shenzhen 70 "KI-Digitalmitarbeiter" basierend auf dem DeepSeek-Großmodell eingesetzt, die 240 Szenarien wie die Verarbeitung von Verwaltungsdokumenten und die öffentliche Dienstleistung abdecken, und die Genauigkeit einer Antwort liegt bei fast 90%.
Karriere-Bonus: Welchen Branchen können Agenten Vorteile bringen?
Liu Zhiyi : Ich bin persönlich besonders optimistisch für zwei Bereiche. Der erste ist die Tourismus- und Kulturbranche, da sie die meisten Modalitäten umfasst. Beispielsweise die KI-basierte Arbeit an Gebäuden wie dem Kaiserpalast oder dem Wasserstadion sowie digitale Reiseführer.
Der zweite Bereich ist die Immobilienbranche, aber nicht der traditionelle Verkauf von Wohnungen. Viele Gewerbeimmobilienunternehmen nutzen Agenten, um ihre Vermarktung und Mietangebote zu verwalten, sowie intelligente Assistenten für den Mietmarkt.
Karriere-Bonus: Wird sich die Unternehmensauswahl bei der Einstellung von Mitarbeitern aufgrund der Entwicklung von Agenten ändern?
Liu Zhiyi : Die Entwicklung von Agenten wird die Sichtweise und das Verständnis der Menschen gegenüber KI-Technologien verändern. Die KI wird von einem Werk