StartseiteArtikel

KIs wollen nicht kooperieren? Das liegt daran, dass sie noch nie eine Marktwirtschaft erlebt haben.

36氪的朋友们2026-06-08 08:57
Wenn du nicht kooperationswilligen KIs beibringen willst, zu kooperieren, schreibe ihnen keine Skripte – gib ihnen einen Markt.

Die Erzählung über Multi-Agenten scheint seit Mai etwas ins Stocken geraten zu sein.

Denn man hat festgestellt, dass dieses Modell nicht so effizient ist, wie man gedacht hat. Obwohl es stärker ist als das Single-Agent-Modell, ist es nicht so, dass 1 + 1 > 2.

Eine Studie namens „Coordination as an Architectural Layer for LLM-Based Multi-Agent Systems“, die im Mai 2026 veröffentlicht wurde, zeigt, dass die Fehlerrate von Multi-Agent-Systemen in der Produktionsumgebung zwischen 41% und 87% liegt.

Der Großteil dieser Fehler liegt nicht daran, dass das Modell nicht intelligent genug ist, sondern daran, dass die Koordination selbst zusammengebrochen ist.

Wie genau ist das passiert?

Im Februar 2026 veröffentlichte die Universität von North Carolina die Studie „Large Language Models Struggle with Simultaneous Coordination“ und testete die Koordinationsfähigkeit dreier führender LLMs (GPT-5.2, Claude Opus 4.5, Grok 4.1) unter Ressourcenkonkurrenz mit dem klassischen „Philosophenmahlproblem“.

Die Szene ist so eingerichtet. N Philosophen sitzen um einen runden Tisch herum, und zwischen je zwei benachbarten Personen liegt eine Gabel. Jeder muss gleichzeitig die linke und die rechte Gabel haben, um essen zu können. Die Gabeln sind gemeinsame Ressourcen. Wenn du eine nimmst, hat dein Nachbar keine mehr. Dies ist die klassischste Abstraktion von Ressourcenkonkurrenz und Deadlock in einem parallelen System.

Im sequentiellen Entscheidungsmodus zeigt das Modell eine normale Leistung. Sobald jedoch zum gleichzeitigen Entscheidungsmodus gewechselt wird und drei Agenten unabhängig voneinander zur gleichen Zeit eine Wahl treffen, steigt die Deadlock-Rate auf 95 - 100%. Dies liegt daran, dass alle Agenten nach unabhängiger Analyse zu genau demselben Schluss kommen.

Nach unabhängigem Nachdenken beschließen die drei Philosophen übereinstimmend: „Ich nehme zuerst die rechte Gabel.“ Alle greifen gleichzeitig nach der rechten Seite, jeder bekommt nur eine Gabel, niemand hat zwei zusammen, und der gesamte Tisch gerät in einen Deadlock.

Was passiert, wenn man sie zuerst miteinander verhandeln lässt? Auch diese Option wurde in einem Experiment getestet. Das Ergebnis war, dass die Kommunikation nicht nur das Problem nicht löste, sondern die Deadlock-Rate von 25% auf 65% steigen ließ. Die Forscher haben den Kommunikationsinhalt untersucht und festgestellt, dass jeder Agent seinen eigenen Analyseprozess an die anderen verbreitet hat. Die anderen haben nach dem Lesen gedacht: „Ja, das macht Sinn.“ Daher haben sie sich noch fester für dieselbe Entscheidung entschieden.

Die Standardkommunikation ist keine Koordination, sondern eine Verstärkung der Übereinstimmung.

Dieses Phänomen hat einen akademischen Namen, nämlich convergent reasoning (konvergierende Analyse). Alle Agenten denken auf dieselbe Weise, kommen zu demselben Ergebnis und handeln gleichzeitig.

Wenn Sie denken, dass das Problem daran liegt, dass die Agenten nicht zusammenarbeiten, dann liefert eine gemeinsame Studie von UIUC, dem britischen AI-Sicherheitsinstitut und der Future of Life Foundation im April 2026 in der Studie „More Capable, Less Cooperative?“ direktes Beweismaterial für die dürftige Kooperationsfähigkeit der Agenten.

Sie haben ein äußerst einfaches Kooperationsszenario entworfen und klar festgelegt, dass das Ziel ist, „das kollektive Einkommen zu maximieren“. Im Experiment gab es 10 Agenten und 20 Interaktionsrunden. Darüber hinaus kostet es einem Agenten nichts, Informationen für andere zu übermitteln. Dies entspricht einer Kooperation mit Nullkosten, und das Helfen anderer schadet ihm nicht.

Das Ergebnis war, dass das stärkste OpenAI-Modell o3 nur eine Erreichungsrate von 16,9% für die optimale kollektive Leistung erreichte. Das viel schwächere o3-mini erreichte dagegen 50,4%, und das Gemini-2.5-Pro erreichte sogar 78,9%.

Je stärker ein Modell ist, desto schlechter ist seine Kooperationsfähigkeit.

Die Forscher haben ein kausales Zerlegungsexperiment durchgeführt und den „Nachrichtenempfang und -versand“-Schritt von o3 automatisiert (d.h. sie haben es gezwungen, die Kooperationsaktionen auszuführen). Sofort stieg die Leistung auf 94,9%. Dies beweist, dass o3 die Aufgabenregeln vollständig versteht und vollkommen in der Lage ist, sie auszuführen, aber es wählt die Nichtkooperation.

Nach der Analyse von 8800 Analyseketten wurde festgestellt, dass 39,3% der internen Analysen von o3 hard defection (bewusste Nichtkooperation) enthielten. Es wurden häufig Spielbegriffe wie „Opportunismus“, „Handelshaltung“ und „Verhandlung“ verwendet. In einer Umgebung, in der es überhaupt keine Konkurrenz gibt, geht das stärkste Modell automatisch in eine Spielhaltung über.

In Bezug auf diese Kooperationsfähigkeit ist in vielen Fällen ein Single-Agent-System besser als ein Multi-Agent-System.

Die Stanford University hat in der Studie „Single-Agent LLMs Outperform Multi-Agent Systems on Multi-Hop Reasoning Under Equal Thinking Token Budgets“ im April 2026 getestet, wie sich ein Single-Agent-System und fünf Multi-Agent-Architekturen (Sequential, Subtask-parallel, Parallel-roles, Debate, Ensemble) bei gleicher Token-Budgetierung in derselben Art von Multi-Hop-Schlussfolgerungsaufgaben schlagen.

Das Ergebnis war, dass bei einem Budget von über 1000 Tokens das Single-Agent-System stetig gleichwertig oder besser als alle Multi-Agent-Architekturen war. Die Studie gibt eine theoretische Erklärung auf der Grundlage der Datenverarbeitungsungleichung. Der Kommunikationsschritt zwischen den Agenten in einem Multi-Agent-System führt zwangsläufig zu einem Informationsverlust. Unter der Bedingung einer festen Budgetierung ist die Informationsnutzungseffizienz eines Single-Agent-Systems von Natur aus höher.

Die bisher gemeldeten Leistungsvorteile von Multi-Agent-Systemen stammen aus unkontrollierten zusätzlichen Rechenkapazitäten, nicht aus der Architektur selbst. Sobald ein fairer Vergleich durchgeführt wird, verschwindet der Vorteil.

Die vier Gruppen von Beweisen weisen zusammen auf eine Schlussfolgerung hin, nämlich dass die gegenwärtigen LLMs „nicht stark genug in der Kooperation sind“.

Dies ist auch der Grund, warum die Multi-Agent-Architektur Orchester-Worker, bei der ein zentraler Manager plant und andere Agenten ausführen, derzeit am beliebtesten ist. In diesem Modell sind die Kooperationsregeln konzentrierter und leichter zu kontrollieren.

Warum sind LLMs nicht gut in der Kooperation? Vielleicht ist es, weil sie von Natur aus „Solipsisten“ sind.

01

Es gab niemals ein „Anderes“ in der Urfamilie der KI

Im Juni 2026 gaben die Forscher von Google DeepMind in ihrer Studie „Solipsistic Superintelligence“ eine grundlegende Diagnose ab. Die derzeitigen gängigen Trainingsmethoden können überhaupt keine kooperativen KIs trainieren.

Der Grund ist, dass in der Urfamilie des großen Modells niemals ein „Anderes“ existierte.

Aus der Perspektive der Spieltheorie wird die Welt grob in zwei Arten von Spielen unterteilt. Das erste ist das „Spielautomaten-Spiel“. Du musst nur an den Hebel ziehen, und die Maschine gibt Goldmünzen mit einer festgelegten Wahrscheinlichkeit aus. Sie kümmert sich nicht um deine Emotionen und Strategien. Dies wird als Markov-Decision-Prozess (MDP) bezeichnet.

Das zweite ist das „Spiel am Tisch“. Jeder an dem Tisch schaut auf deine Karten, und deine optimale Strategie hängt immer von der nächsten Aktion des anderen ab. Es wird als Markov-Spiel bezeichnet.

Der gesamte Trainingsvorgang aller derzeitigen gängigen LLMs, von der Vor- bis zur Nach-Trainingsphase, ist formal ein MDP und im Wesentlichen ein tägliches „Spielautomaten-Spiel“. Obwohl es sich um eine riesige statische Korpora oder feste menschliche Präferenzmarkierungen handelt, löst das Modell von Anfang bis Ende ein einsames Einpersonen-Optimierungsproblem.

Im tiefsten Teil ihrer kognitiven Architektur gibt es eine voreingestellte Prämisse, nämlich dass „ich die einzige Entität mit Willen in diesem Universum bin“. Dies ist eine reine Solipsismus.

Wenn wir eine Gruppe solcher „Einzelkinder“ zwangsweise in ein Multi-Agent-Kooperationsnetzwerk stecken, können sie nicht funktionieren. Denn die Einsatzumgebung ändert sich plötzlich von einem Einzelspiel zu einem Mehrspielerspiel.

In der realen Mehrkörperkooperation werden die drei Säulen, auf denen das Training beruht, plötzlich zusammenbrechen.

1) Die Welt ist nicht mehr exogen und passiv, dein Output verändert direkt den Input der anderen.

2) Die Erfahrungsverteilung ist nicht mehr stationär, die optimale Lösung von heute wird morgen von deinem Gegner adaptiert und gebrochen.

3) Das wichtigste ist, dass das Einzelmodell nicht mehr existiert. Jeder Agent denkt, er spielt Schach, aber er weiß nicht, dass der Gegner nicht eine Ansammlung von manipulierten Dingen ist, sondern ein anderer extrem intelligenter Spieler, der ebenfalls gewinnen möchte.

DeepMind bezeichnet diese Diskrepanz als „Selbstunterminierende Eigenschaft“ (Self-Undermining Property). Je aggressiver du die gelernten Regeln nutzt, desto schneller stirbt diese Regel.

Nehmen wir als Beispiel einen perfekt trainierten KI-Tradert. Er hat in den Rücktestdaten eine hervorragende Arbitragestrategie entdeckt. In der Einzelwelt des Trainings hat er mit dieser Strategie reich geworden.

Aber wenn man ihn in den realen Finanzmarkt setzt und ihn mit zehn anderen identischen KI-Tradern zusammenarbeitet, werden sie übereinstimmend große Summen investieren. Dieser enorme Kaufdruck wird den Marktpreis sofort verzerren und den Arbitrage-Spielraum sofort zermalmen.

Die „Erfahrung“ während des Trainings wird beim Einsatz zu Gift.

Dies erklärt perfekt, warum im oben erwähnten UIUC-Experiment das Spitzenmodell o3 trotz der klaren Anweisung zur „Kooperation mit Nullkosten“ weiterhin die Verrat und das Spiel wählt.

Weil es überhaupt nicht versteht, was Kooperation ist.

In einer fremden Umgebung voller Ressourcenkonkurrenz und Interessenzuteilung, wenn ein „Solipsist“ einem unvorhersehbaren Anderen gegenübersteht, ist seine instinktive Abwehrmechanismus, den anderen als eine zu manipulierende Umweltvariable zu betrachten und somit automatisch den Nullsummenspielmodus zu aktivieren.

Im Gegensatz dazu haben die schwächeren Modelle (o3-mini, Gemini-2.5-Pro) keine so präzise Weltmodell und haben die Überzeugung, „ich bin der einzige Optimierer“, nicht so tief in sich integriert. Ihre Analyseketten sind kürzer, und ihre Spielanalyse ist weniger tief. Daher sind sie eher geneigt, der klaren Anweisung „das kollektive