Veröffentlichung des nationalen Standards für die Vernetzung von Agenten: Warum bleibt die physische Welt möglicherweise auch nach Schnittstellenvereinheitlichung unverbunden?

Die grundlegende Logik hinter dem Durchbruch der Agenten entschlüsseln

Spät im Juni hat die Staatliche Marktaufsichtsverwaltung (Staatliche Kommission für Normung) offiziell die Veröffentlichung von sieben nationalen normativen technischen Dokumenten aus der Reihe "Künstliche Intelligenz – Vernetzung von Agenten" genehmigt.

Quelle: Pressekonferenz der Marktaufsichtsverwaltung zur Normung der Agentenvernetzung

Diese sieben Teile decken nacheinander die Gesamtarchitektur, Identifikationscodes, Identitätsverwaltung, Agentenbeschreibung, Entdeckung, Interaktion sowie Werkzeugaufrufe ab. Sie fungieren wie eine präzise Reißzwecke, die den geschlossenen Kreis von der "Identifizierung" bis zur "kooperativen Interaktion" der Agenten vollständig schließt und damit die Lücke in den nationalen Standards auf diesem Gebiet schließt.

Dieses Dokument, das vom China National Institute of Standardization für Elektronische Technologien in Führung gestellt und von über 30 Einrichtungen wie Huawei, Xiaomi, Lenovo, Ant und verschiedenen Cloud-Anbietern mitentwickelt wurde, wurde von der offiziellen Seite als "agile Normungsmaßnahme in der Branchenentwicklungsphase" eingestuft. Der Zweck ist klar: Es soll alles in sich vereinen, Raum für Fehlversuche bei der Innovation lassen und drei tiefliegende Probleme in der Branche lösen:

Die Überwindung von Ökosystembarrieren: Die Schnittstellen und Protokolle zwischen den Agenten verschiedener Hersteller sind nicht einheitlich, was zu "Agenteninseln" führt und die skalierbare kooperative Anwendung stark einschränkt.

Die Bewältigung der Vertrauenskrise: Agenten verfügen über keine einheitliche Identitätsauthentifizierung und Nachverfolgungsmechanismen. Beim interdomänenen Austausch bestehen Sicherheitsrisiken wie Identitätsfälschung und Datenschutzverletzung.

Die Senkung der Innovationskosten: Das Fehlen von allgemeinen Interaktions- und Beschreibungsspezifikationen führt zu redundanten Investitionen von Unternehmen und hohen Kosten für die Systemintegration und Anpassung.

Zusätzlich hat die offizielle Seite angekündigt, dass die Entwicklung von detaillierten Regeln für die Prüfung und Transaktion von Agenten beschleunigt werden wird. Viele Medien haben dies als "Ende der Informationsinseln" und "Eroffnung einer großen Periode für die KI-Anwendung" interpretiert.

Wenn wir jedoch die "Geschichte der Vernetzung" in der Technologiebranche betrachten, zeigt die Geschichte immer wieder entgegengesetzte Lehren: Die Etablierung von Standards ist oft nicht das Ende des Wettbewerbs, sondern der Beginn einer neuen verdeckten Schlacht.

Insbesondere in einer Zeit, in der die KI beschleunigt in die physische Welt vorstößt, liegt das Kerninteresse der Großkonzerne weder in der Hardware auf der untersten Ebene noch im superintelligenten Clouddienst, sondern genau in dem Aufrufeprotokoll, das "Absichten" in "Aktionen" übersetzt.

Denn die Hardware ist nur die "Muskulatur", die jederzeit ersetzt werden kann, und das Large Language Model ist wie ein "Gehirn im Tank", gefangen im Cloud. Nur dieses Aufrufeprotokoll ist die "Schlüsselstelle" zwischen der virtuellen und der realen Welt.

Obwohl jetzt die Standards festgelegt sind, wurden die Inseln in der Geschichte der Vernetzung immer durch eine Fehlanpassung von Anreizmechanismen und Kontrollrechten verursacht. Wenn keine Einigung über die kommerziellen Interessen erzielt werden kann, kann die bloße Vereinheitlichung der technischen Schnittstellen das Problem nicht wirklich lösen.

Dieser Artikel wird in drei Teile unterteilt, um die zugrunde liegende Logik hinter dieser "Durchbrechung der Agentenbarrieren" zu analysieren:

Teil 1: Die Skalierbarkeitsprüfung. Schafft die Vernetzung tatsächlich Mehrwert oder führt sie zu einer "Homogenisierung" der Unternehmen?

Teil 2: Die verdeckte Schlacht um die Kontrolle. Warum ist das "Recht der Absichtübersetzung" im Zeitalter der Agenten und der Embodied AI der wahre Schauplatz des Wettbewerbs?

Teil 3: Die Maschinenselbstverwaltung. Wie kann die Branche die neuen Inseln überwinden und echte AIoT-Agenten schaffen?

Das Spiegelbild der Geschichte: Fehlangepasste Interessen und entlaufene Kontrollrechte

Das "Vernetzen" in der industriellen Internetbranche wird seit zehn Jahren propagiert, bleibt aber dennoch schwierig umzusetzen.

Das McKinsey Global Institute (MGI) hat in seinem klassischen Bericht "Das Internet der Dinge: Über die Hype hinaus, die reale Wertschöpfung nachweisen" klar berechnet, dass im gesamten potenziellen Wert, den das Internet der Dinge freisetzen kann, durchschnittlich 40 % und in einigen Szenarien fast 60 % nur durch die Interoperabilität zwischen Systemen erreicht werden können.

Die Realität ist jedoch, dass das Problem auf der Geräteschicht liegt. Das Feldnetz wird seit langem von wenigen Herstellern dominiert, und inkompatible industrielle Protokolle wie Profinet von Siemens und CC-Link von Mitsubishi teilen sich die Macht und sind eng mit den Geräten verknüpft.

Warum lässt sich die Vernetzung nicht vorantreiben? Weil die Kosten und Risiken der Vernetzung von den etablierten Großkonzernen getragen werden, während die Gewinne an kleine und mittlere Unternehmen sowie die Endnutzer fließen. Wenn die Anreizmechanismen und die kommerziellen Interessen auseinanderklaffen, ist niemand bereit, seine eigene Schutzmauer zu brechen.

Der Standard Matter für die intelligente Heimautomatisierung auf der Konsumseite bietet ein noch verwirrenderes Beispiel.

Anscheinend fehlt Matter nicht an Anziehungskraft. Apple, Google und Amazon haben es gemeinsam unterstützt, und es gibt Tausende von global zertifizierten Produkten. Doch seine tatsächliche Umsetzung bleibt leider auf dem *"kleinsten gemeinsamen Nenner" stehen, das heißt, alle Parteien haben sich nur auf die grundlegendsten und am wenigsten differenzierten Funktionen geeinigt, um einen Konsens zu erreichen.

Das Problem bei der Umsetzung liegt genau hier: Viele Matter-zertifizierte Geräte öffnen beim plattformübergreifenden Betrieb nur die grundlegendsten Schalt- und Dimmungskommandos, während die höherwertigen Funktionen, die wirklich das Produkt und die differenzierte Benutzererfahrung ausmachen (wie AI-gestützte adaptive Beleuchtung, genaue Energiemonitoring, komplexe Sicherheitssynchronisation usw.), weiterhin von den Großkonzernen in ihren eigenen nativen Apps fest verschlossen sind. Selbst wenn eine Funktion in die Matter-Spezifikation aufgenommen wurde, ist es oft erst nach langer Zeit, dass sie in den Verkaufsgeräten weit verbreitet oder in den Apps der verschiedenen Ökosysteme vollständig geöffnet wird.

Obwohl die Fragmentierung scheinbar kleiner geworden ist, hat der kommerzielle Wettbewerb nicht aufgehört, sondern es hat sich eine neue Fragmentierung auf der "Funktionsschicht" gebildet. Die Vernetzung bleibt auf der "Basisebene", während die echte Kontrolle in die "privaten Ebenen" entweicht.

Diese zwei Beispiele offenbaren eine harte Wahrheit: Wenn die Vernetzung das Preissetzungsrecht und die Kundenbindung berührt und keine neue Wertkompensation besteht, werden die etablierten Anbieter entweder widerstehen oder die Vernetzung auf der "Basisebene" blockieren.

Deshalb liegt der Kern bei der Prüfung des Erfolgs von Standards in der "Skalierbarkeitsprüfung": Vergrößert sie den Kuchen oder teilt sie ihn nur unter sich auf?

TCP/IP hat die Welt beherrscht, weil es durch die "Entkopplung der untersten Ebene" ein exponentiell neues Marktpotenzial eröffnet hat. Vor seiner Entstehung war das Netzwerk ein geschlossener Garten der Großkonzerne wie IBM. Nach seiner Entstehung hat es das Netzwerk in standardisierte Leitungen umgewandelt und eine barrierefreie Ökosystementwicklung ausgelöst. Als TCP/IP 1983 als Standard angenommen wurde, gab es nur etwa 500 Hosts im gesamten Netzwerk. Um 1995 stieg diese Zahl auf über zehn Millionen, was eine digitales Neuland geschaffen hat, das vorher nicht vorstellbar war. Es hat die Gewinne der Hardwarehersteller nicht beschränkt, sondern den gesamten Hardwaremarkt erweitert.

Im Gegensatz dazu stoßen Matter und die tiefe Vernetzung von industriellen Protokollen auf Schwierigkeiten, weil sie im Wesentlichen die Unternehmen "kanalisieren" und "homogenisieren".

TCP/IP standardisiert die "Übertragungskanäle", während Matter versucht, die "Kontrollrechte" zu standardisieren. Sobald die vollständige Vernetzung erreicht wird, wird der Unterschied zwischen hochwertigen Marken und weißen Markenprodukten verschwinden, und die Schutzmauern der Ökosysteme einiger Unternehmen werden in einem Augenblick zusammenbrechen. Diese Art der Vernetzung schafft keinen Mehrwert, sondern verschiebt die Unternehmensgewinne durch Preiskämpfe. Angesichts der Forderung, sich selbst zu "revolutionieren", verhalten sich viele Unternehmen, insbesondere die Großkonzerne, oft zweideutig.

Was ist nun mit der Vernetzung von Agenten? Werden die sieben nationalen Standards wie TCP/IP eine blühende "Maschinenselbstverwaltungsökonomie" hervorbringen oder in eine Abwehrschlacht zwischen den Large Language Model-Anbietern verfallen?

Der Schlüssel liegt darin, ob diese Standards in der Lage sind, bei der Überwindung der Barrieren die Industrie auf das "exponentiell wachsende Neuland" hin zuweisen.

Die "neuen Probleme" der Embodied AI: Die Verantwortungsgrenze in der physischen Welt und die Datenschutzmauer

Wo liegt nun das "Neuland" der Agentenvernetzung?

Theoretisch liegt es in der weiten "Blauen See" der "Maschinenselbstverwaltung": Von der adaptiven Zusammenarbeit von Geräten über Produktionslinien in der Fabrik bis zur nahtlosen Dienstleistung von Haushaltsgeräten verschiedener Marken zu Hause und schließlich zur autonomen Übergabe von Drohnen und Fahrzeugen im Logistiknetzwerk. Dieses Neuland verspricht eine hohe systemweite Effizienz, die nicht nur Mehrwert schafft, sondern sogar die Produktionsfunktion der gesamten Gesellschaft neu gestalten kann.

Doch derzeit bleibt dieses Neuland größtenteils in der "Phantasie". Wenn wir die "Absichtsexektionsschicht" mit der "Skalierbarkeitsprüfung" messen, werden wir feststellen, dass sie nicht nur die "alten Probleme" der Vernetzung geerbt hat, sondern auch die "neuen Probleme" des Zeitalters der Embodied AI bekommen hat.

Schauen wir uns zuerst die "alten Probleme" an: Das Nullsummenspiel zwischen Kontrollrecht und Preissetzungsrecht.

Im Ökosystem der Agenten sind die Superplattformen mit den meisten Zugangspunkten (wie die Large Language Model-Anbieter oder Endgerätekonzerne) die neuen "Kontrollisten". Sie werden sich gerne mit der "Vernetzungsgrundebene" einverstanden erklären, aber sie werden sicherlich ihre privaten Gebiete über der Grundebene verteidigen, wie die Orchestrierungslogik von mehreren Agenten, die Langzeitgedächtnisbank und die komplexen Handlungssemantik.

Weil wenn die vollständige Vernetzung erreicht wird, besteht die Gefahr, dass die Hardwarehersteller zu austauschbaren "dummen Ausführungsgeräten" werden und die Preissetzungsrechte in der Branche unvermeidlich auf die Aufruf- und Orchestrierungsschicht in der Cloud konzentrieren werden.

Was die Agentenvernetzung von der Geschichte unterscheidet, sind ihre "neuen Probleme": Die "Verantwortungsgrenze" in der physischen Welt.

In der reinen digitalen Welt hat ein intersubjektiver API-Aufruf nahezu keine Kosten. Wenn ein Fehler auftritt, kann man einfach erneut versuchen.

Aber in der physischen Welt ist jeder Maschinenaufruf zwischen verschiedenen Herstellern mit realen Grenzkosten, irreversiblen physischen Folgen und klaren Verantwortlichkeiten verbunden.

Stellen Sie sich vor: Der Agent eines Herstellers A ruft einen Roboterarm eines Herstellers B auf, um eine hochpräzise Aktion auszuführen, und es kommt zu einer Geräteschädigung oder einer Produktionsunterbrechung. Wem sollte diese Rechnung zugerechnet werden? Hat A die Absicht fehlerhaft übermittelt oder hat B die Ausführung nicht präzise genug durchgeführt? Bevor die Zuständigkeitsdefinition und die kommerzielle Versicherungsmethode etabliert sind, werden die rationalen Akteure aus Angst vor "physischen" Katastrophenrisiken ihre Vernetzungsreichweite reduzieren und die Rechte für interdomänene Aufrufe einschränken.

In der digitalen Welt können Bugs behoben werden, aber in der physischen Welt muss man für fehlerhafte Aktionen entschädigen. Diese Verantwortungsgrenze, die der Embodied AI im Weg steht, ist eine harte Barriere, die es in der Zeit der Softwarevernetzung nie gegeben hat.

Der Schlüssel zum Erfolg: Die Kontrolle über das "Preissetzungsrecht für Aufrufe" und die Überwindung der Barrieren zwischen Verantwortung und Interesse

Daraus geht hervor, dass das Problem der Agentenvernetzung schließlich auf eine fehlende Anreizstruktur und fehlende Verantwortlichkeit zurückzuführen ist. Jede Maßnahme muss genau auf das Problem zugeschnitten sein.

Um das "alte Problem" der fehlenden Anreizstruktur zu lösen, liegt der Schwerpunkt in der Etablierung einer neutralen Preissetzungs- und Abrechnungsschicht.

Der Schlüssel zum Erfolg liegt darin, dass die Vernetzung tatsächlich den Kuchen für die Teilnehmer vergrößert. Sobald physische Aktionen standardisiert aufgerufen werden können, sollte jede Ausführung in ein messbares, preisbares und abrechenbares kommerzielles Ereignis umgewandelt werden, ähnlich wie die "API-Ökonomie" in der digitalen Welt.

Nur wenn die neuen Einnahmen, die die Hardwarehersteller durch die Öffnung ihrer Schnittstellen erzielen, ausreichen, um die Verluste aufgrund der "Kanalisierung" auszugleichen, kann die Vernetzung die "Skalierbarkeitsprüfung" bestehen. Die Ankündigung der Aufsichtsbehörde auf der Pressekonferenz, dass die Standards für "Transaktion und Prüfung" weiterentwickelt werden, bestätigt genau dies: Die zugrunde liegenden kommerziellen Regeln, die die Interessenzuteilung bestimmen, sind der Schlüssel zur Vernetzung.

Um das "neue Problem" der physischen Verantwortlichkeit zu lösen, liegt der Kern in der Schaffung eines Mechanismus, der die Verantwortung und die Entschädigung verbindet.

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Veröffentlichung des nationalen Standards für die Vernetzung von Agenten: Warum kann die physische Welt auch nach der Vereinheitlichung der Schnittstellen möglicherweise nicht verbunden werden?

Das Spiegelbild der Geschichte: Fehlangepasste Interessen und entlaufene Kontrollrechte

Die "neuen Probleme" der Embodied AI: Die Verantwortungsgrenze in der physischen Welt und die Datenschutzmauer

Der Schlüssel zum Erfolg: Die Kontrolle über das "Preissetzungsrecht für Aufrufe" und die Überwindung der Barrieren zwischen Verantwortung und Interesse