Auf der „US-AI-Jahresgala“ wird kaltes Wasser über Agenten geschüttet.
Text | Zhou Xinyu
Redaktion | Su Jianxun
Im Dezember 2025, wenn Sie ein Flugzeug nach den Vereinigten Staaten besteigen, werden Sie höchstwahrscheinlich zwei Gruppen von Menschen treffen:
Eine Gruppe besteht aus Doktoren, die intensiv über Deep Learning und Attention-Mechanismen diskutieren, Topmanagern großer Unternehmen und Investoren. Ihr Ziel ist San Diego, die Veranstaltungsstadt der "Oskar" der KI-Forschung, der NeurIPS (Neural Information Processing). Sie setzen auf die zukunftsträchtigsten KI-Forschungsprojekte und Talente.
Die andere Gruppe zielt auf die derzeit praktikabelste Umsetzung von KI. Eine Gruppe von KI-Unternehmern und Geschäftspartnern, die ihre Visitenkarten in der Tasche haben, strömt nach Las Vegas. Sie suchen auf der wichtigsten Jahresschau von Amazon Web Services, der re:Invent, nach sicheren Chancen in der KI-Branche.
Was diese sicheren Chancen angeht – nach Gesprächen mit mehr als einem Dutzend US-amerikanischen Entwicklern auf der re:Invent haben wir festgestellt, dass auf beiden Seiten des Ozeans die Meinung besteht: Die Ära der Agenten ist da.
Matt Garman, CEO von Amazon Web Services, hat 12 neue KI-Ankündigungen getätigt, die alle auf die Infrastruktur, Entwicklung und Verwaltung von Agenten abzielen. In seiner Rede hat er festgestellt, dass das Auftauchen von KI-Agenten den wahren Wert der KI freisetzt.
Ein US-amerikanischer Ingenieur von Amazon Web Services hat die Veränderungen deutlich gespürt. Auf der re:Invent im vergangenen Dezember waren die Plakate auf der ganzen Messe mit "AI Cloud" und "Model as a Service" überschrieben. Nur weniger als fünf Hersteller wie DataDog sprachen über Agenten.
Aber in diesem Jahr ist es anders. "Wenn Sie jedem Aussteller, der behauptet, an Agenten zu arbeiten, einen Toast ausrichten würden, selbst wenn sie es nicht tun", hat er einen Witz gemacht, "wären Sie schon nach der Hälfte betrunken."
△ Im Messesaal
△ Im Messesaal
Allerdings steht der verlockenden "Agenten-Welle" die Zurückhaltung der meisten US-amerikanischen Entwickler gegenüber.
"Ich möchte etwas kalte Wasser werfen. Sowohl in Bezug auf die Kosten als auch auf die KI-zentrierte Fähigkeit finde ich, dass die Infrastruktur für Agenten derzeit noch sehr schwach ist." Huang Dongxu, Mitbegründer und CTO des Datenbankservice-Anbieters PingCAP, der seit vielen Jahren in Silicon Valley lebt, hat gegenüber "Intelligent Emergence" offen zugegeben.
Der oben erwähnte Amazon Web Services-Ingenieur hat ähnliche Ansichten. "Die Entwicklung der Agenten ist sprunghaft." Er hat erwähnt, dass, wenn die Hersteller die tausendfache Effizienz der Agenten gegenüber Menschen erkennen, ihre Nachfrage nach Agentenentwicklung exponentiell steigt.
Dies bringt enorme Herausforderungen für die Rechenleistung bei Training und Inferenz sowie für die Hardware und Software zur Datenspeicherung (als Ressource für das Training von Agenten) mit sich. "Der Mangel an GPUs hat sich nun allmählich in einen Mangel an Arbeitsspeicher gewandelt." Er hat "Intelligent Emergence" mitgeteilt.
Unter dem enormen Druck der Inferenzkosten ist Develop for Cost (Entwicklung mit Kostensenkung im Blick) in der US-amerikanischen Agenten-Startup-Szene zu einem neuen Bewertungssystem für Wettbewerbsfähigkeit geworden.
Aus Gründen der begrenzten Inferenzfähigkeit der Modelle müssen Agenten oft auf "Pro"-Modelle zurückgreifen, um komplexe Aufgaben oder die Verarbeitung langer Texte zu bewältigen. Dies führt zu hohen Kosten für den Modellaufruf.
Zhu Zheqing, Gründer und CEO von Pokee.AI, hat öffentlich erklärt, dass durchschnittlich 80 bis 90 Prozent der Kosten von KI-Agenten auf dem Markt auf die Inferenz entfallen. Er hat erwähnt, dass KI-Anwendungsunternehmen erst dann echte Gewinne erzielen können, wenn sie die Inferenzkosten um 80 Prozent senken können.
"Eine Frage, die Venture Capitalgeber derzeit häufig an Agenten-Startups stellen, lautet: Wie hoch sind die Inferenzkosten? Können die Abonnements die Inferenzkosten decken?" Ein US-amerikanischer Agenten-Unternehmer hat uns auf der re:Invent erzählt.
Außerdem stellen die Entwickler eine andere zentrale Frage: Sind die Softwareprodukte auf dem Markt bereit, von Agenten aufgerufen zu werden?
"Die derzeitige Software-Ökosystem ist für Menschen und nicht für KI-Agenten entwickelt." Ein Code-Produktmanager von Anthropic hat uns gesagt.
Huang Dongxu, ein Veteran in der Datenbankbranche, teilt diese Ansicht. "Menschen und KI haben unterschiedliche Präferenzen bei der Software-Nutzung."
Zum Beispiel hassen KI-Systeme Datensilos, die mehr Token verbrauchen, um verbunden zu werden. Und wenn es viele Aufruf-Schnittstellen gibt, neigen KI-Systeme aufgrund der Ablenkung zu Halluzinationen und Leistungseinbußen, was zu "Kontrollverlust" führt.
Huang Dongxu glaubt, dass die Hersteller eine Software-Revolution umsetzen müssen, die auf die "Nutzung durch Agenten" abzielt:
Erstens muss die Benutzeroberfläche der Software es Agenten ermöglichen, ihre flexiblen Anforderungen auf die einfachste Weise auszudrücken. Beispielsweise könnte man eine Datenbank-Sprache wie SQL für KI entwickeln. Zweitens sollten keine Datensilos geschaffen werden. Drittens müssen die Kosten kontrolliert werden.
Allerdings bedeutet das "Kaltwasserwerfen" auf die Agenten auch, dass es für die Hersteller der Modellschicht, der Infrastrukturschicht und der Datenschicht als Agenten-Infrastruktur noch viel Raum für Verbesserungen und Geschäftschancen gibt.
Eine neue Investitionswelle in die KI-Infrastruktur erobert Silicon Valley. Die Optimierung der KI-Infrastruktur und die Senkung der Inferenzkosten bei der Modellnutzung werden zur neuen Richtung für Startups in der Infrastrukturbranche.
Beispielsweise wurde im September 2025 bekannt, dass NVIDIA über 900 Millionen US-Dollar ausgegeben hat, um die Technologielizenz des KI-Infrastruktur-Startups Enfabrica zu erwerben und den CEO einzustellen. Ein Datenbankaussteller hat "Intelligent Emergence" mitgeteilt, dass er derzeit plant, in einige KI-Infrastrukturprojekte von chinesischen US-Amerikanern zu investieren.
Eine andere wichtige Infrastruktur für Agenten, die Daten, wird ebenfalls zunehmend beachtet. Auf der re:Invent-Messe nehmen Datenbankhersteller wie Snowflake, MongoDB und Databricks die Hälfte des Platzes in Anspruch. Ein Mitarbeiter von Snowflake hat uns gesagt, dass die Daten die Grundlage für das Verständnis von Geschäftsprozessen und Szenarien durch Agenten bilden.
Deshalb besteht für Datenbankhersteller die neue Aufgabe, einerseits eine Datenbankform zu finden, die effizienter mit Agenten interagieren kann, und andererseits die Kapazität zu erweitern, um der plötzlich steigenden Nachfrage nach Agentenentwicklung gerecht zu werden.
△
"Die Agenten sind derzeit kein Blasenphänomen." Ein Mitarbeiter von Anthropic hat zusammengefasst. "Aber wenn alle nur nach den offensichtlichsten Anwendungen suchen und niemand sich um die passende Infrastruktur kümmert, wird es zu einem Blasenphänomen werden."
△ Der Stand von Anthropic war voller Zuhörer, die sich Vorträge anhören. Foto: Autor
Gerne ins Gespräch kommen!