首页文章详情

Agent时代到来,GUI不再垄断软件入口?

嗅态2026-03-20 10:47
入口一变,竞争重点就变了,预算流向也会跟着变。

2026年初以来,互联网行业一层原本藏在界面背后的变化,正慢慢浮出水面。

Google、Atlassian、Google Cloud先后推出Developer Knowledge API、Rovo MCP Server和托管型远程MCP服务。表面看,这些动作分散在文档、协作软件和云平台上,底下指向的却是同一件事:当Agent进入工作流,软件公司正在补建一层面向Agent的新入口。

Agent,是能自己调用工具、执行任务的智能体;API,是软件对外开放的调用接口;MCP,全称Model Context Protocol,是让大模型和外部工具、数据、系统连起来的一套通用协议;CLI,也就是命令行界面,是一种更适合程序和Agent直接调起能力的交互方式;skills,则可以理解成一组已经打包好的工具能力,让Agent知道自己能做什么、该怎么调用。

它们合在一起,指向的是同一件事:让Agent更容易找到工具、连上工具、用起工具。

这样再回头看,Google、Atlassian、Google Cloud这几家公司虽然动作不同,方向却很接近。它们都在把原来藏在文档、工作流、云资源和产品功能里的能力,整理成Agent可以直接发现、理解和调用的新入口。

过去,人主要通过GUI,也就是图形界面,在页面、按钮、菜单和表单里一步步完成操作;现在,软件也在长出另一层入口,给Agent直接调能力。

GUI还在,但它已经不再垄断软件入口。

这件事,离普通人并不远。今天的AI更多还停在“会说”,接下来要往“会做”走,就得能调文档、调日历、调应用、调流程,自己把事情干了,直接给用户结果。

01

软件公司在补一层新入口

这一轮密集出现的变化,表面看是分散的产品动作:有人发布CLI,有人上线MCP server,有人把文档做成机器可读接口,也有人把原本面向开发者的API、插件、知识库,重新整理成Agent可调用的工具层。

动作分散,方向却很一致。软件公司都在处理同一个问题:Agent进入工作流后,软件能力怎样才能被更稳定地发现、理解、调用和执行。

最近几个月,Google、Atlassian、Google Cloud的一系列动作,让这层变化的轮廓越来越清楚。

2026年2月,Google发布Developer Knowledge API和配套MCP server。表面看,这像是在处理开发文档,实际指向更深。Google要做的,是把原本散落在网页、说明文档、教程页面里的知识,整理成一个程序可以调用、模型可以读取、Agent可以接入的官方真源。开发文档从来不只是辅助材料,它本身就是产品能力的说明书和使用边界。Google把这部分内容直接交给机器去读,说明一件事:以后读文档、找能力、理解规则、调接口,不再只是人来完成。

Atlassian的动作,则把同样的变化带进了企业协作软件。2026年2月,Atlassian宣布Rovo MCP Server GA,让外部AI客户端能够接入Jira、Confluence里的工作流和知识内容。官方表述里反复强调安全、权限和治理,这一点很关键。它说明这类接入已经不只是技术展示,而是逐步进入真实组织环境。原来,人要进界面一层层打开任务、文档和知识,现在,这些内容通过另一条通道,向Agent开放。

Google Cloud的推进,又把这件事从单个产品拉到了平台层。2025年12月,Google Cloud宣布对Google services和Google Cloud services提供official MCP support,推出fully-managed remote MCP servers。这个动作的意义,不只是“支持了MCP”,更在于它把原本复杂的云服务能力,重新整理进一套更适合Agent调用的框架中。云平台本来就有很多资源、很多接口、很多权限控制。Google Cloud现在做的,是让Agent不用再沿着一层层文档和控制台去摸索,而是能通过更直接的方式接近这些能力。

把这几家公司放在一起看,轮廓就很清楚了。它们做的产品不同,场景不同,服务的人群也不同,但底层都在做同一件事:把软件能力重新抽出来,做成机器更容易读懂、Agent更容易调起的入口。

可以把它理解成软件入口的“双层展开”。一层继续面对人,负责展示、浏览、配置、协作和确认,这还是GUI最擅长的部分。另一层更多面对Agent,负责能力发现、参数传递、任务执行、结果返回、跨系统调用和自动化编排。

Google把文档知识做成机器可读入口,Atlassian把企业工作流和知识内容接到外部AI客户端,Google Cloud把服务能力整理成托管型MCP服务,这几种动作放在一起,已经足够说明,这不是零星试水,而是一种带有行业共性的调整。

从这里再往下看,软件公司对“入口”的理解,已经不再只是一块屏幕、一个首页、一个控制台、一个导航栏。入口也可以是一条命令、一份机器可读文档、一个MCP server,或者一个可被Agent识别和调用的技能描述。人和软件之间的连接方式没有消失,只是增加了另一层通道。

02

当执行主体从人扩展到AI

在3月17日的AI钉钉2.0发布会上,钉钉创始人、CEO陈航提到一个判断:AI时代真正大的变化,不只是模型变强了,而是互联网的主体,正在从“人”扩展到“AI”。

这句话,刚好能解释最近这轮CLI、MCP、A2A为什么会一起升温。问题的关键,不在某个新名词突然流行,而在软件面对的使用者变了。人还在,AI也进来了。软件一旦同时服务这两类主体,很多原本藏在系统深处的问题,就会一起冒出来。

GUI之所以能长期成为软件的主形态,说到底,是因为它最适合人。人会看页面,会找按钮,会顺着导航、表单和流程一步步完成操作。很多软件能力,原本就是按这种方式组织起来的。

但AI不是这样工作的。AI不需要先看懂页面,再一点点摸索路径。它更关心的是,系统里到底有什么能力,接口怎么调,参数怎么传,结果怎么返回,权限边界在哪里,哪些动作可以接着往下执行。走到这一步,原来包在界面里的能力,就得重新被整理出来。页面当然还在,但页面本身已经不够了。

所以,这一轮表面上热起来的是CLI、MCP这些词,底下真正变化的,其实是软件的组织方式。

以前大家更在意“怎么点”,现在越来越在意“怎么调”。前者是界面逻辑,后者是能力逻辑。界面逻辑主要服务人,能力逻辑越来越多地服务AI。

一个软件如果只有按钮、菜单和页面路径,AI很难高效使用它;可一旦这些能力被整理成更清楚的接口和更直接的调用方式,软件和AI之间的关系就会完全不一样。

协议层的变化,把这件事看得更清楚。2025年12月,Anthropic把MCP捐给Linux Foundation旗下的Agentic AI Foundation。这个动作的意义在于,AI怎么连接外部工具、数据和系统,已经不再只是某一家公司的内部优化,而要变成整个行业都要共用的一块底座。

因为,只要AI真的进入工作流,它就不可能永远停在聊天框里。它一定要去接文档、接数据库、接企业应用、接云资源。连接方式如果一直碎在各家私有接口里,成本会很高,生态也会很散。MCP放进一个更中立的框架里,本质上就是在给“AI怎么接世界”这件事修底座。

Google推动A2A,也是同一个方向。A2A关注的,不是AI怎么调用单个工具,而是AI和AI之间怎么交换信息、协调行动。也就是说,未来不只是一个AI去调工具,还会出现一个AI去连接另一个AI,再把多个系统里的能力串起来。

走到这一步,软件世界的连接关系就变了。它不再只是“人打开页面,按路径完成任务”,还会越来越多变成“AI调工具、AI找AI、跨系统协作”。

Cloudflare最近披露的一个工程细节,也很能说明问题。它提到,如果把自家庞大的API体系直接原样暴露给AI,代价会非常高。一个等价的原生MCP server会消耗117万个tokens,已经超过很多模型的上下文窗口。为了解决这个问题,它提出Code Mode,把大规模API能力压缩成更紧凑的方式,让AI用两个tools和约1000tokens的上下文,就能接近“拿到整个API”。

这个例子说明,AI时代的软件,不是把能力开放出来就够了,还得重新组织能力、描述能力、压缩能力、治理能力。很多软件原来早就有API,但那并不等于它天然适合AI。能不能让AI低成本发现能力、准确理解能力、稳定调用能力,已经变成一项新的产品工程。

因此,软件公司面对的考题也变了。软件同时服务人和AI后,拼的就不只是界面顺不顺手了,还要看谁能更快把能力理出来,把流程接起来,把风险管起来。说到底,这已经不是加几个新功能的问题了,而是软件要重新长一遍。

这层变化,最后也会落到预算重排上。

过去软件公司的投入,更多围着界面、交互、路径和增长转,重点是让人更容易看懂、点动、留下来。Agent进入工作流后,钱会更多流向另一层:能力重构、协议接入、治理补强,以及推理和调用成本优化。

Cloudflare去压缩API暴露给AI后的token开销,Atlassian在Rovo MCP Server里强化权限控制、usage logs和治理能力,这些动作意味着,软件公司接下来要比拼的,已经不只是界面体验,也是谁能把能力做得更容易接入、更容易治理、也更省成本。

03

竞争重点正在往界面背后移动

投资圈已经深入研究这种变化了。3月18日,真格基金投资总监钟天杰在一篇署名文章中提出,Agent时代到来后,软件公司的竞争重点,正在从界面体验转向可调用能力。他甚至进一步判断,“我们也许不该再投资GUI思维的软件公司”。

这篇文章当然还不是行业定论,但它把一个正在升温的问题摆到了台面上:当AI成为新的执行主体,软件公司过去围绕GUI建立起来的产品逻辑、竞争逻辑和价值逻辑,都要重估。

投资圈之外,大厂的官方口径也在变化。最新财报显示,阿里和腾讯虽然都还没有直接把CLI写进业绩叙事,但“AI进入真实任务执行”“AI原生应用进入增长逻辑”的方向,已经越来越清楚。

阿里提到,Qwen已接入淘宝、即时零售、高德、飞猪、支付宝等场景,并明确写到,AI agents正在大规模执行真实世界任务。腾讯则把重点放在AI提升生产力、带动研发和基础设施投入,以及AI插件、AI原生小程序对业务生态的拉动上。

CLI、MCP这些词还没有正式进入财报语言,但“AI从聊天走向执行”“AI进入真实工作流”,已经越来越接近大厂的官方表述。

再看国内产品层面的动作,方向也已经非常明确。2026年以来,国内几家主流软件和云平台公司,陆续把MCP、Agent插件、工具化能力和CLI化改造推到前台。动作分散,指向却很一致:把原来藏在界面后面的能力,整理成AI可以调用的工具、服务和接口。

走到这一步,国内软件公司真正要补的,大致就是三层。

第一层,是把能力理出来。很多软件这些年积累了大量功能,但这些功能长期都是按“给人怎么用”来组织的,藏在页面、按钮、菜单和表单后面。人可以一层层点进去找,AI不行。AI更需要清楚的工具定义、明确的动作边界和稳定的返回结果。飞书和阿里云最近的动作,最值得看的地方都在这里。它们做的,不只是多了一个新接口,而是在把原有能力重新整理成更适合AI调用的一层工具。

第二层,是把这些能力接进更通用的协议和生态里。因为能力就算拆出来了,如果还是各家各接、各说各话,这层新入口就很难真正长大。腾讯云把MCP纳入插件体系,阿里云把官方MCP服务和自定义MCP部署都做进了平台里,背后其实都在回答同一个问题:未来AI不会只待在一家公司的单一产品里,它会在更多工作流、更多平台、更多工具链之间来回穿梭。谁先把自己的能力接进主流协议,谁就更有机会被下一轮Agent工作流接住。

第三层,是把治理补齐。这一步更难,也更现实。AI能不能做事,当然重要;但到了企业场景,真正决定一家公司敢不敢把AI放进真实流程里的,往往是另一层问题:权限谁来给,调用留不留痕,错误能不能回退,误操作怎么兜底,敏感数据怎么隔离。钉钉这次“悟空”发布,值得注意的不只是CLI化和能力原子化,还有它反复强调的权限控制、安全沙箱、快照和回退体系。因为AI一旦碰审批、文档、表格、知识库和业务系统,风险也会一起放大。企业不会只问“它厉不厉害”,也会问“它出了问题怎么办”。

这样连起来看,软件公司接下来真正要做的,其实就是三件事一起往前推:先把能力从界面后面理出来,再把能力接进更通用的协议里,最后把权限、审计、回退和安全边界补齐。少一步都不行。只有能力,没有协议,这些能力还是散的;只有能力和协议,没有治理,企业不敢把AI真正放进核心流程;只有治理,没有能力重构,AI又只能停留在表层交互,进不到系统深处。

这也会反过来改变GUI的位置。GUI当然不会消失。浏览信息、发起协作、做判断、做审阅、做最终确认,很多时候还是离不开界面。变化在于,它不再垄断软件的使用路径了。一个成熟的软件系统,越来越像两层结构:上面一层是给人看的界面,负责展示、协作和确认;下面一层是给AI调用的能力网络,负责执行、调度和连接。

说到底,这已经不是“要不要拥抱AI”的问题了。更现实的问题是,软件公司愿不愿意把自己重新拆开一遍。把原来长在GUI里的能力抽出来,把原来只对人开放的流程重新定义,把原来靠人工兜底的风险变成系统级约束。谁先完成这一步,谁就更有机会在下一轮入口变化里占住位置。

因为,AI入口一旦真正长成,软件竞争拼的,就不只是好不好用,也是谁更像一套能被调用、能被连接、能被纳入工作流的能力系统。

本文来自微信公众号“嗅态”,作者:石灿,36氪经授权发布。