Agent时代降临，GUI是否不再垄断软件入口？

入口一变，竞争重点就变了，预算流向也会跟着变。

2026年初以来，互联网行业一层原本藏在界面背后的变化，正慢慢浮出水面。

Google、Atlassian、Google Cloud先后推出Developer Knowledge API、Rovo MCP Server和托管型远程MCP服务。表面看，这些动作分散在文档、协作软件和云平台上，底下指向的却是同一件事：当Agent进入工作流，软件公司正在补建一层面向Agent的新入口。

Agent，是能自己调用工具、执行任务的智能体；API，是软件对外开放的调用接口；MCP，全称Model Context Protocol，是让大模型和外部工具、数据、系统连起来的一套通用协议；CLI，也就是命令行界面，是一种更适合程序和Agent直接调起能力的交互方式；skills，则可以理解成一组已经打包好的工具能力，让Agent知道自己能做什么、该怎么调用。

它们合在一起，指向的是同一件事：让Agent更容易找到工具、连上工具、用起工具。

这样再回头看，Google、Atlassian、Google Cloud这几家公司虽然动作不同，方向却很接近。它们都在把原来藏在文档、工作流、云资源和产品功能里的能力，整理成Agent可以直接发现、理解和调用的新入口。

过去，人主要通过GUI，也就是图形界面，在页面、按钮、菜单和表单里一步步完成操作；现在，软件也在长出另一层入口，给Agent直接调能力。

GUI还在，但它已经不再垄断软件入口。

这件事，离普通人并不远。今天的AI更多还停在“会说”，接下来要往“会做”走，就得能调文档、调日历、调应用、调流程，自己把事情干了，直接给用户结果。

01 软件公司在补一层新入口

这一轮密集出现的变化，表面看是分散的产品动作：有人发布CLI，有人上线MCP server，有人把文档做成机器可读接口，也有人把原本面向开发者的API、插件、知识库，重新整理成Agent可调用的工具层。

动作分散，方向却很一致。软件公司都在处理同一个问题：Agent进入工作流后，软件能力怎样才能被更稳定地发现、理解、调用和执行。

最近几个月，Google、Atlassian、Google Cloud的一系列动作，让这层变化的轮廓越来越清楚。

2026年2月，Google发布Developer Knowledge API和配套MCP server。表面看，这像是在处理开发文档，实际指向更深。Google要做的，是把原本散落在网页、说明文档、教程页面里的知识，整理成一个程序可以调用、模型可以读取、Agent可以接入的官方真源。开发文档从来不只是辅助材料，它本身就是产品能力的说明书和使用边界。Google把这部分内容直接交给机器去读，说明一件事：以后读文档、找能力、理解规则、调接口，不再只是人来完成。

Atlassian的动作，则把同样的变化带进了企业协作软件。2026年2月，Atlassian宣布Rovo MCP Server GA，让外部AI客户端能够接入Jira、Confluence里的工作流和知识内容。官方表述里反复强调安全、权限和治理，这一点很关键。它说明这类接入已经不只是技术展示，而是逐步进入真实组织环境。原来，人要进界面一层层打开任务、文档和知识，现在，这些内容通过另一条通道，向Agent开放。

Google Cloud的推进，又把这件事从单个产品拉到了平台层。2025年12月，Google Cloud宣布对Google services和Google Cloud services提供official MCP support，推出fully-managed remote MCP servers。这个动作的意义，不只是“支持了MCP”，更在于它把原本复杂的云服务能力，重新整理进一套更适合Agent调用的框架中。云平台本来就有很多资源、很多接口、很多权限控制。Google Cloud现在做的，是让Agent不用再沿着一层层文档和控制台去摸索，而是能通过更直接的方式接近这些能力。

把这几家公司放在一起看，轮廓就很清楚了。它们做的产品不同，场景不同，服务的人群也不同，但底层都在做同一件事：把软件能力重新抽出来，做成机器更容易读懂、Agent更容易调起的入口。

可以把它理解成软件入口的“双层展开”。一层继续面对人，负责展示、浏览、配置、协作和确认，这还是GUI最擅长的部分。另一层更多面对Agent，负责能力发现、参数传递、任务执行、结果返回、跨系统调用和自动化编排。

Google把文档知识做成机器可读入口，Atlassian把企业工作流和知识内容接到外部AI客户端，Google Cloud把服务能力整理成托管型MCP服务，这几种动作放在一起，已经足够说明，这不是零星试水，而是一种带有行业共性的调整。

从这里再往下看，软件公司对“入口”的理解，已经不再只是一块屏幕、一个首页、一个控制台、一个导航栏。入口也可以是一条命令、一份机器可读文档、一个MCP server，或者一个可被Agent识别和调用的技能描述。人和软件之间的连接方式没有消失，只是增加了另一层通道。

02 当执行主体从人扩展到AI

在3月17日的AI钉钉2.0发布会上，钉钉创始人、CEO陈航提到一个判断：AI时代真正大的变化，不只是模型变强了，而是互联网的主体，正在从“人”扩展到“AI”。

这句话，刚好能解释最近这轮CLI、MCP、A2A为什么会一起升温。问题的关键，不在某个新名词突然流行，而在软件面对的使用者变了。人还在，AI也进来了。软件一旦同时服务这两类主体，很多原本藏在系统深处的问题，就会一起冒出来。

GUI之所以能长期成为软件的主形态，说到底，是因为它最适合人。人会看页面，会找按钮，会顺着导航、表单和流程一步步完成操作。很多软件能力，原本就是按这种方式组织起来的。

但AI不是这样工作的。AI不需要先看懂页面，再一点点摸索路径。它更关心的是，系统里到底有什么能力，接口怎么调，参数怎么传，结果怎么返回，权限边界在哪里，哪些动作可以接着往下执行。走到这一步，原来包在界面里的能力，就得重新被整理出来。页面当然还在，但页面本身已经不够了。

所以，这一轮表面上热起来的是CLI、MCP这些词，底下真正变化的，其实是软件的组织方式。

以前大家更在意“怎么点”，现在越来越在意“怎么调”。前者是界面逻辑，后者是能力逻辑。界面逻辑主要服务人，能力逻辑越来越多地服务AI。

一个软件如果只有按钮、菜单和页面路径，AI很难高效使用它；可一旦这些能力被整理成更清楚的接口和更直接的调用方式，软件和AI之间的关系就会完全不一样。

协议层的变化，把这件事看得更清楚。2025年12月，Anthropic把MCP捐给Linux Foundation旗下的Agentic AI Foundation。这个动作的意义在于，AI怎么连接外部工具、数据和系统，已经不再只是某一家公司的内部优化，而要变成整个行业都要共用的一块底座。

因为，只要AI真的进入工作流，它就不可能永远停在聊天框里。它一定要去接文档、接数据库、接企业应用、接云资源。连接方式如果一直碎在各家私有接口里，成本会很高，生态也会很散。MCP放进一个更中立的框架里，本质上就是在给“AI怎么接世界”这件事修底座。

Google推动A2A，也是同一个方向。A2A关注的，不是AI怎么调用单个工具，而是AI和AI之间怎么交换信息、协调行动。也就是说，未来不只是一个AI去调工具，还会出现一个AI去连接另一个AI，再把多个系统里的能力串起来。

走到这一步，软件世界的连接关系就变了。它不再只是“人打开页面，按路径完成任务”，还会越来越多变成“AI调工具、AI找AI、跨系统协作”。

Cloudflare最近披露的一个工程细节，也很能说明问题。它提到，如果把自家庞大的API体系直接原样暴露给AI，代价会非常高。一个等价的原生MCP server会消耗117万个tokens，已经超过很多模型的上下文窗口。为了解决这个问题，它提出Code Mode，把大规模API能力压缩成更紧凑的方式，让AI用两个tools和约1000tokens的上下文，就能接近“拿到整个API”。

这个例子说明，AI时代的软件，不是把能力开放出来就够了，还得重新组织能力、描述能力、压缩能力、治理能力。很多软件原来早就有API，但那并不等于它天然适合AI。能不能让AI低成本发现能力、准确理解能力、稳定调用能力，已经变成一项新的产品工程。

因此，软件公司面对的考题也变了。软件同时服务人和AI后，拼的就不只是界面顺不顺手了，还要看谁能更快把能力理出来，把流程接起来，把风险管起来。说到底，这已经不是加几个新功能的问题了，而是软件要重新长一遍。

这层变化，最后也会落到预算重排上。

过去软件公司的投入，更多围着界面、交互、路径和增长转，重点是让人更容易看懂、点动、留下来。Agent进入工作流后，钱会更多流向另一层：能力重构、协议接入、治理补强，以及推理和调用成本优化。

Cloudflare去压缩API暴露给AI后的token开销，Atlassian在Rovo MCP Server里强化权限控制、usage logs和治理能力，这些动作意味着，软件公司接下来要比拼的，已经不只是界面体验，也是谁能把能力做得更容易接入、更容易治理、也更省成本。

03 竞争重点正在往界面背后移动

投资圈已经深入研究这种变化了。3月18日，真格基金投资总监钟天杰在一篇署名文章中提出，Agent时代到来后，软件公司的竞争重点，正在从界面体验转向可调用能力。他甚至进一步判断，“我们也许不该再投资GUI思维的软件公司”。

这篇文章当然还不是行业定论，但它把一个正在升温的问题摆到了台面上：当AI成为新的执行主体，软件公司过去围绕GUI建立起来的产品逻辑、竞争逻辑和价值逻辑，都要重估。

投资圈之外，大厂的官方口径也在变化。最新财报显示，阿里和腾讯虽然都还没有直接把CLI写进业绩叙事，但“AI进入真实任务执行”“AI原生应用进入增长逻辑”的方向，已经越来越清楚。

阿里提到，Qwen已接入淘宝、即时零售、高德、飞猪、支付宝等场景，并明确写到，AI agents正在大规模执行真实世界任务。腾讯则把重点放在AI提升生产力、带动研发和基础设施投入，以及AI插件、AI原生小程序对业务生态的拉动上。

CLI、MCP这些词还没有正式进入财报语言，但“AI从聊天走向执行”“AI进入真实工作流”，已经越来越接近大厂的官方表述。

再看国内产品层面的动作，方向也已经非常明确。2026年以来，国内几家主流软件和云平台公司，陆续把MCP、Agent插件、工具化能力和CLI化改造推到前台。动作分散，指向却很一致：把原来藏在界面后面的能力，整理成AI可以调用的工具、服务和接口。

走到这一步，国内软件公司真正要补的，大致就是三层。

第一层，是把能力理出来。很多软件这些年积累了大量功能，但这些功能长期都是按“给人怎么用”来组织的，藏在页面、按钮、菜单和表单后面。人可以一层层点进去找，AI不行。AI更需要清楚的工具定义、明确的动作边界和稳定的返回结果。飞书和阿里云最近的动作，最值得看的地方都在这里。它们做的，不只是多了一个新接口，而是在把原有能力重新整理成更适合AI调用的一层工具。

第二层，是把这些能力接进更通用的协议和生态里。因为能力就算拆出来了，如果还是各家各接、各说各话，这层新入口就很难真正长大。腾讯云把MCP纳入插件体系，阿里云把官方MCP服务和自定义MCP部署都做进了平台里，背后其实都在回答同一个问题：未来AI不会只待在一家公司的单一产品里，它会在更多工作流、更多平台、更多工具链之间来回穿梭。谁先把自己的能力接进主流协议，谁就更有机会被下一轮Agent工作流接住。

第三层，是把治理补齐。这一步更难，也更现实。AI能不能做事，当然重要；但到了企业场景，真正决定一家公司敢不敢把AI放进真实流程里的，往往是另一层问题：权限谁来给，调用留不留痕，错误能不能回退，误操作怎么兜底，敏感数据怎么隔离。钉钉这次“悟空”发布，值得注意的不只是CLI化和能力原子化，还有它反复强调的权限控制、安全沙箱、快照和回退体系。因为AI一旦碰审批、文档、表格、知识库和业务系统，风险也会一起放大。企业不会只问“它厉不厉害”，也会问“它出了问题怎么办”。

这样连起来看，软件公司接下来真正要做的，其实就是三件事一起往前推：先把能力从界面后面理出来，再把能力接进更通用的协议里，最后把权限、审计、回退和安全边界补齐。少一步都不行。只有能力，没有协议，这些能力还是散的；只有能力和协议，没有治理，企业不敢把AI真正放进核心流程；只有治理，没有能力重构，AI又只能停留在表层交互，进不到系统深处。

这也会反过来改变GUI的位置。GUI当然不会消失。浏览信息、发起协作、做判断、做审阅、做最终确认，很多时候还是离不开界面。变化在于，它不再垄断软件的使用路径了。一个成熟的软件系统，越来越像两层结构：上面一层是给人看的界面，负责展示、协作和确认；下面一层是给AI调用的能力网络，负责执行、调度和连接。

说到底，这已经不是“要不要拥抱AI”的问题了。更现实的问题是，软件公司愿不愿意把自己重新拆开一遍。把原来长在GUI里的能力抽出来，把原来只对人开放的流程重新定义，把原来靠人工兜底的风险变成系统级约束。谁先完成这一步，谁就更有机会在下一轮入口变化里占住位置。

因为，AI入口一旦真正长成，软件竞争拼的，就不只是好不好用，也是谁更像一套能被调用、能被连接、能被纳入工作流的能力系统。

本文来自微信公众号“嗅态”，作者：石灿，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Agent时代到来，GUI不再垄断软件入口？

01

软件公司在补一层新入口

02

当执行主体从人扩展到AI

03

竞争重点正在往界面背后移动