Google Chrome hat in der späten Nacht eine Überraschungsaktualisierung veröffentlicht. Der Agent muss nicht mehr als Mensch "passieren". Ist die letzte Frontlinie für Front-End-Entwickler zusammengebrochen?
Heute hat das Google Chrome-Team eine Bombe geworfen: WebMCP (Web Model Context Protocol) ist offiziell aufgetaucht.
Es ermöglicht es künstlichen Intelligenz-Agenten, die „menschliche Benutzeroberfläche“ zu umgehen und direkt mit bestehenden Websites und Web-Anwendungen in tiefer Ebene zu interagieren.
In der frühen Vorschauversion von Chrome 146 kann man WebMCP aktivieren, indem man bestimmte Flags setzt.
Dies verleiht den Agenten eine „Supermacht“. Von nun an müssen sie nicht mehr „wie Menschen handeln“, um Webseiten zu betrachten, Buttons zu suchen oder Links zu klicken.
Nur über eine API: navigator.modelContext kann die KI die grafische Benutzeroberfläche umgehen und direkt mit dem Kern der Web-Anwendung kommunizieren.
Angenommen, man möchte ein Flugticket buchen. Der Agent muss nicht auf dem Bildschirm klicken, sondern kann direkt über das zugrunde liegende Protokoll Befehle an die Website der Fluggesellschaft senden und direkt das Ergebnis erhalten.
Wie der Entwickler Alex Volkov sagt: „WebMCP ist wie die API in der UI.“
Man kann sagen, dass die Entstehung von WebMCP ein äußerst eindeutiges Signal sendet –
Die zugrunde liegende Logik der Interaktion zwischen künstlichen Intelligenz-Agenten und Webseiten wird grundlegend neu gestaltet.
Es hat den Sprung von der „visuellen Simulation“ zur „logischen direkten Verbindung“ bewirkt und bringt das traditionelle Paradigma der Web-Interaktion zum Ende.
WebMCP taucht auf und erschüttert die Welt
Startet eine Revolution in der Agenten-Interaktion
Vielleicht hat noch nicht viele Menschen die Wichtigkeit von WebMCP erkannt.
Der Kern von WebMCP besteht darin, dass es die Art und Weise, wie Agenten Dienste erhalten, verändert und ihnen den direkten Zugang zu den Webseiten verschafft.
In den letzten Wochen war die ganze Welt von OpenClaw fasziniert. Wenn die Interaktion in Zukunft noch weiter verbessert wird, könnte dies möglicherweise eine weitere große Veränderung auslösen.
Man muss bedenken, dass die Art und Weise, wie Agenten derzeit mit Webseiten interagieren, eher klobig und uralt ist, und die gegenwärtigen Integrationsmethoden sind einfach „zu schlecht“.
Im Wesentlichen simulieren sie menschliches Verhalten – Screenshots machen, die Position von Buttons erkennen, Klicks simulieren, DOM-Elemente erfassen …
Diese Methode hat offensichtliche Nachteile:
- Hocher Kosten: Eine einfache Suche kann Tausende von Token verbrauchen, um Screenshots zu verarbeiten und die Seite zu analysieren;
- Niedrige Stabilität: Sobald eine Website überarbeitet wird, kann der Agent „paralysiert“ werden, weil er die Buttons nicht finden kann;
- Niedrige Effizienz der Rückmeldung: Der Agent muss den Bildschirm wiederholt „betrachten“, um zu überprüfen, ob die Aktion erfolgreich war.
Keine menschliche Simulation mehr, Niedergewichtenangriff
Jetzt, mit WebMCP, können Webseiten ihre Dienstschnittstellen direkt an künstliche Intelligenz zugänglich machen. Agenten können Dienste direkt abfragen und ausführen, ohne die „visuelle Front-End-Oberfläche“ zu durchlaufen.
WebMCP wird die traditionelle Methode des „Screen-Scraping“ ersetzen und so eine stabilere und effizientere Interaktion mit Webseiten und Informationssuche ermöglichen.
Wie ein Netizen sagte, werden künstliche Intelligenz-Agenten zu den „ersten Bürgern“ des Internets.
Im offiziellen Blog von Google Chrome 146 werden Entwicklern zwei flexible Methoden zur API-Integration angeboten:
- Deklarative API: Standardaktionen, die direkt in HTML-Formularen definiert werden können, ausführen;
- Imperative API: Komplexe und dynamischere Interaktionen, die JavaScript erfordern, ausführen.
Diese beiden Methoden ermöglichen es Entwicklern, künstlichen Intelligenz-Agenten ein direktes Toolset bereitzustellen, damit sie die visuelle Erkennung umgehen und direkt auf die strukturierten Funktionen hinter den Webseiten zugreifen können.
Früher hat der Google-Softwareingenieur Khushal Sagar in einem Vortrag gesagt, dass WebMCP das Ziel hat, die USB-C-Schnittstelle im Bereich der künstlichen Intelligenz-Anwendungen zu werden.
Es geht nicht nur darum, dass Agenten Benutzer ersetzen, sondern auch darum, ein Kooperationsmodell zu schaffen:
- Benutzer, Webseiten und Agenten teilen sich die Oberfläche und arbeiten zusammen.
- Spezielle Pfade für Agenten: Entwickler können bei der Gestaltung der UI für Menschen auch strukturierte API-Pfade für Agenten bereitstellen.
Zwei Tech-Riesen arbeiten zusammen
Soll das Front-End abgeschafft werden?
Es ist erwähnenswert, dass WebMCP nicht nur Google's Angelegenheit ist.
Schon am 13. August 2025 haben Google- und Microsoft-Entwickler zusammen das WebMCP-Projekt auf GitHub eingereicht.
Open-Source-Projekt: https://github.com/webmachinelearning/webmcp
Derzeit werden künstliche Intelligenz-Agenten normalerweise über Protokolle wie MCP im Back-End integriert.
Aber für Web-Entwickler müssen sie oft eine Back-End-Server mit Python oder NodeJS schreiben, um die Funktionen der Webseite freizugeben, anstatt die ihnen vertraute Browser-JavaScript zu verwenden.
Nach der Projektbeschreibung ermöglicht WebMCP es Webseiten, einen „spezifischen Kanal für Agenten“ in der UI bereitzustellen.
Im Gegensatz zur Back-End-Integration werden die WebMCP-Tools auf der Client-Seite ausgeführt und sind erst verfügbar, nachdem der Agent die Seite geladen hat.
Der Agent kann immer noch die Seite beobachten und Aktionen simulieren, wie ein Mensch es tun würde. Aber mit den Tools kann er sein Ziel direkter und effizienter erreichen.
Laut der offiziellen Beschreibung hat WebMCP die folgenden drei Hauptvorteile:
- Code-Wiederverwendung: Direkte Nutzung der bestehenden Front-End-Codes;
- Einheitliche Oberfläche: Benutzer und Agenten teilen sich eine Oberfläche, was die Authentifizierung und die Status-Synchronisierung bei der Interaktion vereinfacht;
- Werkzeug für Barrierefreiheit: Ermöglicht es Hilfstechnologien, höhere Ebenen von Seitenaktionen auszuführen, nicht nur einfache Klicks.
Genauer gesagt, ermöglicht WebMCP es Benutzern und Agenten, an derselben Webseite Seite an Seite zu arbeiten, sowohl die bestehende Anwendungslogik zu nutzen als auch den Kontext und die Kontrolle des Benutzers aufrechtzuerhalten.
Umgehe alle UI, beherrsche das Internet
Wie wird sich der Agent in Zukunft unter der Unterstützung von WebMCP entwickeln?
Entwickler haben drei Szenarien vorgestellt: E-Commerce, Reisebuchung und Kundensupport.
Zunächst könnte sich unser Einkaufserlebnis in Zukunft grundlegend ändern.
Mit einem Befehl muss der Agent nicht mehr auf der Seite nach Gutschein-Eingängen suchen. Er kann mit einem Funktionsaufruf von WebMCP in Sekundenschnelle die Bestellung abgeben.
Er kann Produkte leicht finden, spezifische Einkaufsoptionen konfigurieren und den gesamten Bestellprozess abschließen.
Im Bereich der Reisebuchung kann der Agent ein präziserer Buchungsexperte werden, indem er strukturierte Daten verwendet, um zu suchen, Ergebnisse zu filtern und Buchungen zu verarbeiten.
Da er die verwirrende UI umgeht, kann er sicherstellen, dass die Suchergebnisse immer genau sind und komplexe Reisekombinationen direkt im Hintergrund abwickeln.
Darüber hinaus kann WebMCP als Brücke für automatisierte Dienste dienen, damit der Agent automatisch die erforderlichen technischen Details ausfüllen kann, um detaillierte Kundensupport-Tickets zu erstellen.
Entwickler, die WebMCP ausprobiert haben, waren beeindruckt und haben sofort zwei Vorteile von WebMCP entdeckt.
Die Zeit der geschichteten Webseiten beginnt
Die Hälfte für Agenten
Der Entwickler Nikoloz Turazashvili hat in einem neuen Artikel erklärt, was die Entstehung von WebMCP für die Entwicklung bedeutet.