Ist die Zeit der Agenten angebrochen und hat die GUI nicht länger das Monopol auf die Software-Eingänge?
Seit Anfang 2026 taucht allmählich eine Veränderung auf, die ursprünglich hinter der Benutzeroberfläche der Internetbranche verborgen war.
Google, Atlassian und Google Cloud haben nacheinander die Developer Knowledge API, den Rovo MCP Server und den verwalteten Remote-MCP-Service eingeführt. Auf den ersten Blick erscheinen diese Aktionen in Dokumenten, Kollaborationssoftware und Cloud-Plattformen verteilt, aber sie zeigen auf dasselbe Ziel: Wenn Agenten in den Arbeitsablauf integriert werden, bauen Softwareunternehmen eine neue Schnittstelle für Agenten auf.
Ein Agent ist ein intelligentes System, das Werkzeuge selbstständig aufrufen und Aufgaben ausführen kann; API ist die Schnittstelle, über die Software extern zugänglich gemacht wird; MCP, die Abkürzung für Model Context Protocol, ist ein allgemeines Protokoll, das große Modelle mit externen Werkzeugen, Daten und Systemen verbindet; CLI, die Kommandozeilenoberfläche, ist eine Interaktionsart, die sich besser für die direkte Aktivierung von Funktionen durch Programme und Agenten eignet; Skills können als eine Gruppe von vorkonfigurierten Werkzeugfunktionen verstanden werden, die Agenten sagen, was sie können und wie sie die Werkzeuge nutzen sollen.
Zusammen gesehen zielen all diese Elemente auf dasselbe ab: Agenten sollen es leichter haben, Werkzeuge zu finden, sich mit ihnen zu verbinden und sie zu nutzen.
Wenn man dies im Blick hat, werden die Aktionen von Google, Atlassian und Google Cloud, obwohl unterschiedlich, in ihrer Richtung sehr ähnlich. Sie bringen die in Dokumenten, Arbeitsabläufen, Cloud-Ressourcen und Produktfunktionen verborgenen Fähigkeiten in eine Form, die Agenten direkt entdecken, verstehen und nutzen können.
In der Vergangenheit haben Menschen hauptsächlich über die GUI, die grafische Benutzeroberfläche, in Seiten, Buttons, Menüs und Formularen Schritt für Schritt ihre Aktionen ausgeführt. Jetzt entwickelt die Software eine zusätzliche Schnittstelle, über die Agenten direkt auf die Funktionen zugreifen können.
Die GUI existiert weiterhin, aber sie hat die Monopolstellung als Softwarezugang verloren.
Diese Entwicklung ist nicht weit von den normalen Menschen entfernt. Heute ist die KI hauptsächlich auf die "Fähigkeit zu sprechen" beschränkt. Um in die Phase der "Fähigkeit zu handeln" zu gelangen, muss sie in der Lage sein, Dokumente, Kalender, Anwendungen und Prozesse aufzurufen und Aufgaben selbstständig zu erledigen, um direkt Ergebnisse für die Benutzer zu liefern.
01
Softwareunternehmen bauen eine neue Schnittstelle auf
Die in letzter Zeit häufigen Veränderungen scheinen auf den ersten Blick als verstreute Produktaktionen zu erscheinen: Manche veröffentlichen eine CLI, andere stellen einen MCP-Server online, wieder andere machen Dokumente in maschinenlesbare Schnittstellen um, und einige organisieren die für Entwickler vorgesehenen APIs, Plugins und Wissensdatenbanken neu, um sie von Agenten nutzbar zu machen.
Obwohl die Aktionen unterschiedlich sind, ist die Richtung einheitlich. Alle Softwareunternehmen befassen sich mit demselben Problem: Wie können die Softwarefunktionen nach der Integration von Agenten in den Arbeitsablauf stabiler entdeckt, verstanden, aufgerufen und ausgeführt werden?
In den letzten Monaten haben die Aktionen von Google, Atlassian und Google Cloud die Konturen dieser Veränderung immer deutlicher gemacht.
Im Februar 2026 hat Google die Developer Knowledge API und den dazugehörigen MCP-Server veröffentlicht. Auf den ersten Blick scheint dies die Bearbeitung von Entwicklungsdokumenten zu betreffen, aber es geht tiefer. Google will das in Webseiten, Anleitungen und Tutorials verstreute Wissen in eine Form bringen, die von Programmen aufgerufen, von Modellen gelesen und von Agenten genutzt werden kann. Entwicklungsdokumente sind nicht nur Hilfsmaterialien, sondern auch die Anleitung und die Grenzen der Produktfunktionen. Indem Google diesen Inhalt direkt an Maschinen zur Verarbeitung übergibt, zeigt es, dass das Lesen von Dokumenten, das Finden von Funktionen, das Verstehen von Regeln und das Aufrufen von Schnittstellen nicht mehr nur Menschen vorbehalten ist.
Atlassian hat dieselbe Veränderung in die Unternehmenskollaborationssoftware gebracht. Im Februar 2026 hat Atlassian die allgemeine Verfügbarkeit des Rovo MCP Servers angekündigt, wodurch externe KI-Clients auf die Arbeitsabläufe und Wissensinhalte in Jira und Confluence zugreifen können. In der offiziellen Mitteilung wird wiederholt auf Sicherheit, Berechtigungen und Governance hingewiesen, was von entscheidender Bedeutung ist. Dies zeigt, dass diese Art der Integration nicht nur eine technische Demonstration ist, sondern allmählich in die reale Unternehmensumgebung einfügt. Früher mussten Menschen in die Benutzeroberfläche gehen und Schritt für Schritt Aufgaben, Dokumente und Wissen öffnen. Jetzt werden diese Inhalte über einen anderen Kanal für Agenten zugänglich gemacht.
Google Cloud hat diese Entwicklung von der Ebene einzelner Produkte auf die Plattformebene gehoben. Im Dezember 2025 hat Google Cloud die offizielle MCP-Unterstützung für Google Services und Google Cloud Services angekündigt und voll verwaltete Remote-MCP-Server eingeführt. Die Bedeutung dieser Aktion liegt nicht nur darin, dass "MCP unterstützt wird", sondern auch darin, dass die komplexen Cloud-Service-Funktionen in ein Framework gebracht werden, das für Agenten leichter nutzbar ist. Die Cloud-Plattform hat bereits viele Ressourcen, Schnittstellen und Berechtigungskontrollen. Google Cloud ermöglicht es den Agenten nun, nicht mehr mühsam durch Dokumente und Konsolen zu navigieren, sondern direkt auf diese Funktionen zuzugreifen.
Wenn man die Aktionen dieser Unternehmen betrachtet, wird die Richtung klar. Obwohl ihre Produkte, Szenarien und Zielgruppen unterschiedlich sind, tun sie alle dasselbe: Sie extrahieren die Softwarefunktionen und gestalten sie so, dass Maschinen sie leichter verstehen und Agenten sie leichter aufrufen können.
Man kann dies als "Doppelschicht-Entwicklung" der Softwarezugänge verstehen. Eine Schicht richtet sich weiterhin an Menschen und ist für die Darstellung, Navigation, Konfiguration, Kollaboration und Bestätigung zuständig - dies ist immer noch das Stärken der GUI. Die andere Schicht richtet sich mehr an Agenten und ist für die Entdeckung von Funktionen, die Übertragung von Parametern, die Ausführung von Aufgaben, die Rückgabe von Ergebnissen, den Zugriff auf andere Systeme und die automatische Orchestrierung verantwortlich.
Google macht Dokumentenwissen in maschinenlesbare Schnittstellen um, Atlassian verbindet Unternehmensarbeitsabläufe und Wissensinhalte mit externen KI-Clients, und Google Cloud organisiert die Service-Funktionen in verwaltete MCP-Services. Diese Aktionen zusammen zeigen, dass es sich nicht um vereinzelte Experimente handelt, sondern um eine branchenübliche Anpassung.
Daraus folgt, dass die Softwareunternehmen die "Zugänge" nicht mehr nur als Bildschirm, Startseite, Konsole oder Navigationsleiste verstehen. Ein Zugang kann auch ein Befehl, ein maschinenlesbares Dokument, ein MCP-Server oder eine von Agenten erkennbare und aufrufbare Skills-Beschreibung sein. Die Verbindung zwischen Menschen und Software ist nicht verschwunden, sondern es gibt nun eine zusätzliche Möglichkeit der Interaktion.
02
Wenn die Ausführungsrolle von Menschen auf KI erweitert wird
Bei der Vorstellung von AI DingTalk 2.0 am 17. März hat Chen Hang, Gründer und CEO von DingTalk, eine Einschätzung abgegeben: Die echten großen Veränderungen in der KI-Zeit liegen nicht nur in der Stärkung der Modelle, sondern auch darin, dass die Akteure im Internet von "Menschen" auf "KI" erweitert werden.
Dieser Satz erklärt genau, warum in letzter Zeit die CLI, MCP und A2A an Popularität gewonnen haben. Der Schlüssel liegt nicht in der plötzlichen Popularität neuer Begriffe, sondern in der Veränderung der Benutzer der Software. Menschen sind noch da, aber auch KI hat ihren Weg in die Software gefunden. Wenn die Software beide Gruppen bedienen muss, treten viele Probleme an der Oberfläche, die zuvor tief im System verborgen waren.
Die GUI hat sich über lange Zeit als Hauptform der Software etabliert, weil sie sich am besten für Menschen eignet. Menschen können Seiten lesen, Buttons finden und Schritt für Schritt über Navigation, Formulare und Prozesse ihre Aufgaben ausführen. Viele Softwarefunktionen sind ursprünglich auf diese Weise organisiert worden.
KI funktioniert jedoch anders. Sie muss nicht erst eine Seite verstehen und dann langsam den Weg finden. Sie interessiert sich eher für die vorhandenen Funktionen im System, die Art und Weise, wie Schnittstellen aufgerufen werden, wie Parameter übergeben werden, wie Ergebnisse zurückgegeben werden, wo die Berechtigungsgrenzen liegen und welche Aktionen fortgesetzt werden können. An diesem Punkt müssen die in der Benutzeroberfläche verborgenen Funktionen neu organisiert werden. Die Seite existiert zwar weiterhin, aber sie reicht nicht mehr aus.
Deshalb ist es zwar die Begriffe wie CLI und MCP, die in letzter Zeit in den Fokus gerückt sind, aber die eigentliche Veränderung liegt in der Organisationsweise der Software.
In der Vergangenheit war man mehr an der Frage "Wie klickt man?" interessiert, jetzt geht es zunehmend um die Frage "Wie ruft man auf?". Das erste ist die Logik der Benutzeroberfläche, das zweite die Logik der Funktionen. Die Logik der Benutzeroberfläche dient hauptsächlich Menschen, die Logik der Funktionen wird zunehmend von KI genutzt.
Eine Software, die nur aus Buttons, Menüs und Seitenpfaden besteht, ist für KI schwierig zu nutzen. Sobald jedoch die Funktionen in klarere Schnittstellen und direktere Aufrufmethoden umgewandelt werden, verändert sich die Beziehung zwischen Software und KI grundlegend.
Die Veränderungen auf der Protokollebene verdeutlichen diese Entwicklung noch deutlicher. Im Dezember 2025 hat Anthropic das MCP an die Agentic AI Foundation unter der Linux Foundation gespendet. Die Bedeutung dieser Aktion liegt darin, dass die Art und Weise, wie KI mit externen Werkzeugen, Daten und Systemen verbunden wird, nicht mehr nur eine interne Optimierung eines einzelnen Unternehmens ist, sondern ein gemeinsames Fundament für die gesamte Branche werden muss.
Wenn KI tatsächlich in den Arbeitsablauf integriert wird, kann sie nicht für immer im Chatfenster bleiben. Sie muss auf Dokumente, Datenbanken, Unternehmensanwendungen und Cloud-Ressourcen zugreifen. Wenn die Verbindungsarten in privaten Schnittstellen verteilt bleiben, wird die Kosten hoch und die Ökosysteme ungeordnet. Indem das MCP in ein neutraleres Framework eingebracht wird, wird im Grunde ein Fundament für die Frage "Wie verbindet KI die Welt?" geschaffen.
Google's Förderung von A2A geht in die gleiche Richtung. A2A befasst sich nicht mit der Frage, wie KI einzelne Werkzeuge aufruft, sondern mit der Frage, wie KI-Systeme untereinander Informationen austauschen und Handlungen koordinieren können. Das bedeutet, dass in Zukunft nicht nur eine KI Werkzeuge aufrufen wird, sondern auch KI-Systeme miteinander verbunden werden und die Funktionen mehrerer Systeme verknüpfen können.
An diesem Punkt verändert sich die Verbindungsstruktur in der Softwarewelt. Es ist nicht mehr nur "Menschen öffnen eine Seite und führen Aufgaben über einen Pfad aus", sondern es wird zunehmend zu "KI ruft Werkzeuge auf, KI sucht andere KI und kollaboriert über Systeme hinweg".
Ein von Cloudflare kürzlich offenbartes technisches Detail verdeutlicht dies gut. Es wurde erwähnt, dass es sehr kostspielig wäre, das eigene umfangreiche API-System direkt an KI zu exponieren. Ein äquivalenter nativer MCP-Server würde 1,17 Millionen Tokens verbrauchen, was die Kontextfenster vieler Modelle überschreitet. Um dieses Problem zu lösen, hat Cloudflare den Code Mode eingeführt, der die umfangreichen API-Funktionen in eine kompaktere Form bringt, so dass KI mit zwei Tools und einem Kontext von etwa 1.000 Tokens annähernd "das gesamte API" nutzen kann.
Dieses Beispiel zeigt, dass in der KI-Zeit die Software nicht nur ihre Funktionen offenlegen muss, sondern auch die Funktionen neu organisieren, beschreiben, komprimieren und verwalten muss. Viele Softwareprodukte haben bereits APIs, aber das bedeutet nicht, dass sie von Natur aus für KI geeignet sind. Die Fähigkeit, KI in der Lage zu stellen, Funktionen kostengünstig zu entdecken, genau zu verstehen und stabil aufzurufen, ist zu einem neuen Produktentwicklungsprozess geworden.
Deshalb hat sich auch die Herausforderung für Softwareunternehmen verändert. Wenn die Software sowohl Menschen als auch KI bedient, geht es nicht nur darum, ob die Benutzeroberfläche benutzerfreundlich ist, sondern auch darum, wer am schnellsten die Funktionen organisiert, die Prozesse verbindet und das Risiko kontrolliert. Letztendlich geht es nicht nur um die Hinzufügung einiger neuer Funktionen, sondern um die Neuentwicklung der gesamten Software.
Diese Veränderung wird sich auch auf die Budgetverteilung auswirken.
In der Vergangenheit haben Softwareunternehmen ihre Investitionen hauptsächlich auf die Benutzeroberfläche, die Interaktion, die Navigationspfade und das Wachstum konzentriert, um es Menschen leichter zu machen, die Software zu verstehen, zu bedienen und zu nutzen. Nachdem Agenten in den Arbeitsablauf integriert wurden, fließen die Mittel zunehmend in die Umstrukturierung der Funktionen, die Einbindung von Protokollen, die Verbesserung der Governance sowie die Optimierung der Kosten für die Inferenz und den Funktionsaufruf.
Cloudflares Versuch, die Token-Ausgaben bei der Exposition der API an KI zu reduzieren, und Atlassians Stärkung der Berechtigungskontrolle, der Nutzungsaufzeichnung und der Governance im Rovo MCP Server zeigen, dass Softwareunternehmen in Zukunft nicht nur die Benutzeroberfläche verbessern müssen, sondern auch die Funktionen leichter zugänglich, besser verwaltbar und kostengünstiger machen müssen.
03
Der Wettbewerbsfokus verschiebt sich hinter die Benutzeroberfläche
Der Investmentkreis hat diese Veränderung bereits eingehend untersucht. Am 18. März hat Zhong Tianjie, Investmentdirektor des ZhenFund, in einem Artikel argumentiert, dass der Wettbewerbsfokus von Softwareunternehmen in der Agenten-Zeit von der Benutzeroberfläche auf die nutzbaren Funktionen verschoben wird. Er geht sogar so weit zu behaupten, dass "wir vielleicht nicht mehr in Softwareunternehmen investieren sollten, die auf die GUI ausgerichtet sind".
Dieser Artikel ist noch keine Branchenkonvention, aber er bringt ein aufkommendes Problem ans Licht: Wenn KI zu einem neuen Ausführungsaktor wird, müssen die Produktlogik, die Wettbewerbslogik und die Wertlogik der Softwareunternehmen, die in der Vergangenheit um die GUI herum aufgebaut wurden, neu bewertet werden.
Auch die offiziellen Aussagen der großen Unternehmen ändern sich. Die neuesten Geschäftsberichte zeigen, dass Alibaba und Tencent zwar noch nicht direkt die CLI in ihre Erfolgsberichte aufgenommen haben, aber die Richtung "KI in die reale Aufgabenausführung integrieren" und "KI-native Anwendungen in die Wachstumslogik integrieren" wird immer deutlicher.
Alibaba hat erwähnt, dass Qwen in Szenarien wie Taobao, Echtzeit-Einkauf, Gaode, Fliggy und Alipay integriert wurde und dass KI-Agenten nun in großem Maßstab reale Aufgaben ausführen. Tencent hat den Schwerpunkt auf die Verbesserung der Produktivität durch KI, die Förderung der Forschung und Entwicklung sowie die Infrastrukturinvestitionen sowie die Stimulierung des Geschäftsekosystems durch KI-Plugins und KI-native Mini-Programme gelegt.
Die Begriffe CLI und MCP sind noch nicht offiziell in die Geschäftsberichte aufgenommen, aber die Aussagen "KI geht von der Chat-Funktion zur Aufgabenausführung über" und "KI tritt in den realen Arbeitsablauf ein" nähern sich immer mehr den offiziellen Äußerungen der großen Unternehmen.
Auch bei den Aktionen auf der Ebene der chinesischen Produkte ist die Richtung bereits sehr klar. Seit 2026 haben mehrere der führenden chinesischen Software- und Cloud-Plattformunternehmen nacheinander die Integration von MCP, Agent-Plugins, Werkzeugfunktionen und CLI-Veränderungen in den Vordergrund gestellt. Obwohl die Aktionen unterschied