智联网:移动互联网的下一站——当AI Agent重写数字世界的游戏规则
一个新物种正在闯入
2025年3月,Manus以全球首个通用AI Agent的名号引爆了科技圈。仅仅一年之后,开源龙虾( Open Claw)席卷全球,百虾争鸣的生态还没看清楚,Hermes又带着自进化能力杀了进来。节奏快到什么程度?上一个爆款还没过完蜜月期,下一个就已经在敲门了。
这不是一波普通的产品迭代。过去,我们习惯了一年一款新手机、半年一次大版本更新的节奏,但AI Agent的涌现速度,更像是一个新物种的寒武纪大爆发。
过去十几年,移动互联网改变了我们获取信息、消费娱乐和交易支付的方式。但有一件事始终没变,就是所有操作最终都得人亲自来做。App再好用,也需要我们打开它、学会它,一步一步地点。而这些Agent的出现,正在改写过去的基本假设。未来我们可能不再需要操作任何东西,只需要说一句话,告诉它要什么。
正在形成的这种新网络形态就是智联网(Agentic Internet),它以AI Agent为核心节点、以自然语言为交互方式、以任务完成为价值度量的新一代数字基础设施。它不是移动互联网的升级版,不是更好用的搜索,也不是更智能的App。它是底层逻辑的重写,交易链路变了,核心资产变了,计费方式变了,甚至用户这个概念本身都在被重新定义。
第一幕:临界点——为什么是现在?
每一次技术浪潮的爆发,都不是某个单一技术的突破,而是多项能力同时跨过临界点后的共振。移动互联网的爆发,不只是因为有了iPhone,而是3G/4G网络、电容触摸屏、ARM芯片、App Store商业模式等在同一个时间窗口同时就绪。
智联网也一样,2025年到2026年之间,我们看到至少三项关键能力几乎同时成熟,共同引爆了AI Agent的涌现。
一、大模型的三级火箭
如果把大模型能力的演进比作火箭发射,那么过去3年,我们经历了清晰的三级推进。
第一级:语言理解与生成。 2022年底ChatGPT的发布,让全世界第一次体验到机器可以像人一样说话。这一级火箭解决的是AI与人之间的沟通问题,机器终于能听懂我们在说什么,也能用流畅的自然语言回应。但在这个阶段,AI本质上还是一个嘴上功夫型选手,能说,但不能做。
第二级:编程与工具使用。 2023年到2024年间,大模型学会了两件关键的事,写代码和调用外部工具。Claude 3.5和GPT-4展示了惊人的编程能力,Function Calling机制让模型能够调用API、操作数据库、读写文件。这意味着AI不再只是一个对话伙伴,而是开始具备动手能力。它可以帮我们写一段Python脚本处理数据,可以调用天气API查询未来一周的气温,还可以操作浏览器帮我们填写表单。
第三级:深度推理与自主规划。 2024年底到2025年,OpenAI的o1/o3系列、DeepSeek-R1等推理模型的出现,补上了最后一块拼图。这些模型不再只是简单的对话,而是能够进行长链条的逻辑推理、分解复杂任务、制定执行计划并逐步验证,即完成长程任务。这是从能动手到能独立干活的质变,就像一个实习生,以前只能按照指令一步步执行,现在给他一个目标,他能自己想办法完成。
三级能力叠加在一起,才真正诞生了我们今天看到的AI Agent。能听懂说什么 (语言理解) ,能调动工具去做事 (编程与工具使用) ,能自己想明白怎么做 (深度推理) 。这就解释了为什么AI聊天机器人早在2022年就火了,但真正能干活的Agent到2025年才开始涌现。因为前两级火箭虽然惊艳,但只有第三级点火之后,AI才真正具备了自主完成复杂任务的能力。
二、3个Agent,3个已被验证的命题
技术临界点到达之后,2025年到2026年间密集涌现的Agent产品不再只是实验品。其中三个最具代表性的案例,分别回答了一个关键问题。
Manus和Genspark等Agent回答的问题是:Agent能不能赚钱? Manus 于2025年3月上线,8个月后ARR突破1亿美元。Genspark成立45 天,实现了ARR 3600 万美元,成立9个月后ARR突破1亿美元。Agent的全新赛道正式开启,更多的创业公司涌入其中,成为智联网的开拓者。
龙虾 (OpenClaw) 回答的问题是:Agent属于谁?这款MIT协议开源的AI Agent,核心主张是每个人都应该有一只自己的虾。截至2026年4月,GitHub星标突破36万,但这个数字不是重点。真正值得玩味的是它引发的百虾争鸣:腾讯、智谱、MiniMax、Kimi、字节等在短时间内纷纷推出各种龙虾版本。这意味着,龙虾已经有机会承载下一代交互的入口。
Hermes回答的问题是:Agent能不能自己变强? 前两个Agent本质上还是工具,给它指令,它执行完就结束了。Hermes正在试图突破这个边界,它不仅像龙虾一样,拥有有持久记忆,记得用户的偏好、习惯和上下文,还可以自动创建技能,每解决一个新问题就生成可复用的技能文档,下次遇到类似问题时调用,甚至能生成子Agent进行并行处理。这听起来像是技术特性的堆砌,但背后的含义却很深刻,Hermes不只是在执行任务,它在通过执行任务来进化自己。 这是Agent从工具向数字员工跃迁的关键一步。因为一个真正的员工不只是完成老板交代的事,他还会在过程中自主学习,积累经验,并变得越来越擅长。
三个产品,三条已被验证的命题,Agent能赚钱 (Manus和Genspark) ,Agent属于每个人 (龙虾) ,Agent能自我进化 (Hermes) ,当这三个能力同时具备的时候,我们讨论的就不再是一项新技术的可能性,而是一个新时代的必然性。
三、Agent找到了自己的"母语"
仅有聪明的大脑和能干的双手还不够,Agent要真正融入数字世界,还需要一个关键条件,就是找到与这个世界交互的正确方式。
那就是近期十分火爆的CLI (命令行交互) ,CLI之于Agent,相当于HTTP之于网页。
在互联网诞生之初,用户看到的是花花绿绿的界面,但真正驱动一切的是那些看不见的协议和请求。HTTP协议在底层默默运转,它不是给人看的,但它让整个网页世界得以运转。
Agent的世界也正在经历类似的演变。过去几十年,我们已经习惯了图形用户界面 (GUI) 的交互方式,图标、按钮、滑动、点击,等等,这些设计是为人类的眼睛和手指优化的。但Agent不需要看一个漂亮的界面,它需要的是高效地做事情。命令行,这个在普通用户看来古老而晦涩的交互方式,恰恰是Agent与系统对话的最高效语言。
这一点在开发者世界已经得到验证。2025年到2026年间,Claude Code、Codex CLI、Gemini CLI等终端原生的AI编程工具异军突起,与传统的图形化IDE形成了鲜明对照。开发者发现,当AI能够直接在命令行中读写文件、运行脚本、操作版本控制时,其效率远超在图形界面中点来点去。GUI是为人的眼睛设计的,CLI是为Agent的能力设计的。
在命令行之上,MCP、A2A等协议还可以打通Agent与外部服务之间的连接,让Agent不仅能在本地操作系统中自如行动,还能跨系统、跨平台调用各种能力。由此,Agent操作世界的“高速公路“已经修通了。
三级火箭的推力、标志性产品的涌现、交互协议的就绪,这三个条件在2025到2026年间几乎同时到位,技术不再是瓶颈。
可以说,AI Agent正处于从技术demo到基础设施的转折点。 类似2010年前后的移动互联网,彼时3G/4G网络已经铺好,iPhone已经证明了路线,但真正的应用爆发 (微信、滴滴、美团、抖音) 还需要两到三年才会出现。今天的Agent产品虽然已经令人惊艳,但大概率还不是终极形态。真正的杀手级Agent,那个会让所有人说“原来是这么回事“的产品,也许还在路上。
另一个值得深入探讨的问题是,当Agent能干活之后,整个数字世界的运转逻辑将会怎样改变?
第二幕:范式转换——五个维度看智联网
如果说第一幕讲的是技术准备好了,那么第二幕要讨论的是更深层的问题。当AI Agent成为数字世界的核心参与者,哪些我们习以为常的规则将被重写?
在展开之前,先看一张全景对比。这张表格浓缩了移动互联网和智联网之间最核心的结构性差异。这不是简单的技术参数的对比,而是经济逻辑的迁移。
移动互联网的一切都是围绕注意力构建的,智联网的一切将围绕能力重建。 这不是渐进的优化,而是底层计价单位的更换。就像从金本位切换到信用货币,上层的所有经济关系都会跟着变。我们从五个维度来展开。
一、从GUI到CLI:交互范式的代际跃迁
先讲一个违反直觉的趋势。
在大多数人的印象里,技术的进步意味着界面越来越美观、操作越来越简单。从DOS命令行到Windows桌面,从桌面到触屏,每一代交互都在降低用户的使用门槛。按照这个逻辑,下一代交互应该是更炫酷的AR/VR、更自然的手势识别,或者更智能的语音助手。
但实际发生的事情出人意料:命令行正在回归。
这不是倒退,而是一次根本性的视角转换。因为这一次,交互的主体变了。在智联网时代,大量操作将由Agent来完成。Agent不需要看到一个红色的立即购买按钮才知道该下单。它只需要一个清晰的API接口或命令行指令。Agent不需要在一个精心设计的酒店列表页面上下滑动比较,它只需要结构化的数据和明确的筛选条件。
换句话说,GUI是为人看、人操作设计的交互范式,而CLI和API是为机器看、自动执行设计的交互范式。 当操作的主体从人变成Agent,交互范式的底层逻辑必然发生迁移。
而对于普通用户来说,这种变化表现为另一种形态:用户不再需要学会操作复杂的软件界面,只需要说清楚要什么结果。
用户不需要打开携程App、输入出发地、选择目的地、筛选时间、比较价格、选座位、填写乘客信息、支付,只用说一句“帮我订明天去上海最便宜的高铁票”,然后收到一条确认消息。也不需要在五一假期前夕一个个勾选12306的候选车次和座位,只需要说一句“帮我抢一张4月30日晚上或5月1日上午”的火车票就好。
不需要在Excel里敲公式、做透视表、调图表格式,只需要说“把上季度的销售数据按区域做个对比分析”,然后收到一份图文并茂的报告。
这就是我们所说的结果式交互,用户关心的是结果,不是实现过程。而Agent在背后使用的,恰恰是命令行和API这种高效、但可能“不好看”的交互方式。
这意味着,未来数字产品的设计将出现一种有趣的分化:面向用户的前台可能变得极度简洁 (也许就是一个对话框) ,而面向Agent的后台将变得极度丰富 (大量的API接口、命令行工具、结构化数据) 。就像一家好餐厅,顾客看到的是优雅的用餐环境,但真正决定出品质量的是后厨的效率。而后厨的效率,不取决于厨房布置得好不好看,而取决于它的动线是否合理、设备是否称手。
过去十年,互联网公司在前端UX上投入了海量资源,包括大量的交互设计师、视觉设计师、用户研究员等,来优化人的操作体验。在智联网时代,同等量级的投入将转向"Agent体验"的建设,包括API文档的清晰度、接口响应的速度、数据结构的规范性等。 换句话说,产品经理的KPI将可能从用户留存率变成Agent调用成功率。这不是一个修辞上的变化,而是一个资源配置的根本性转向。
当操作者从人变成Agent,整个商业世界的计价方式也必然随之改变。
二、从注意力变现到效果变现:商业模式的重构
移动互联网的商业本质,注意力是核心。
十几年来,这个行业发展出了一套精密的变现体系。流量从搜索、电商、信息流中涌入,用户的每一次点击、每一秒停留都被精确计量,然后以CPM (千次曝光成本) 、CPC (每次点击成本) 、CPA (每次行动成本) 的形式出售给广告主。整个商业链条可以简化为:流量→点击→页面/功能→转化。 核心资产是注意力、入口和用户时长。
这套体系运转了十几年,催生了万亿美元的数字广告市场。但它有一个隐含的前提是,用户本人必须在场。 必须有一双眼睛看到广告,有一根手指点击链接,有一个人在页面上做出购买决定。
而在智联网时代,这个前提正在被打破。
当用户把“帮我订一家明天晚上适合商务宴请的餐厅”这个任务交给Agent时,整个交易链路变成了:意图→授权→规划→执行→交付→验收。 用户不用打开大众点评比较评分,没有浏览餐厅照片,没有看到任何广告。Agent会直接根据用户的偏好、预算、地理位置和场合要求,筛选、比较、预订,最后把确认信息推送给用户。
在这个新链路中,核心资产不再是注意力和时长,而是用户意图、任务完成率和交付质量。 计费基础也从曝光、点击、订阅,转向了任务、结果、成功率和履约。
这个变化,正在催生各种全新的商业模式。
值得注意的是,这五种模式不是互斥的,而是叠加的。一个Agent完全可以同时采用AaaS+佣金+记忆飞轮三种模式。就像今天的美团,既有广告收入、又有交易佣金、还有会员订阅一样。未来最成功的Agent平台,大概率是能把多种模式组合运转的那个。
第一种:按结果付费 + 共建评测集。 在移动互联网时代,很多知识服务的定价逻辑是一个账号多少钱,或一份报告多少钱。当我们买了一个研报订阅,不管里面的内容是否真正解决了问题,都得付全款。这种定价方式对消费者不公平,但在人工交付的时代缺乏更好的替代方案。
Agent改变了这个等式。当AI能够以极低的边际成本交付研究报告、法律意见、财务分析时,按结果付费变得可行了。关键的挑战在于如何定义什么算好的结果,这催生了一种全新的甲乙方协作模式:共建评测集。 甲方定义验收标准 (什么维度、什么深度、什么格式等算合格) ,乙方的Agent按照标准执行并交付。评测集就是新时代的合同条款,它既是质量标准,也是定价基础。
第二种:GEO是Agent时代的广告。 Gartner预测到2026年,传统搜索引擎的流量将下降25%,被AI聊天机器人和其他虚拟助手所取代。这个预测正在成为现实。
当越来越多的信息获取和购买决策由Agent代为完成时,GEO这个新的营销概念应运而生。 如果说SEO (搜索引擎优化) 是优化内容以获得Google等搜索排名,那么GEO就是优化内容以获得AI生成式回答中的推荐位。
当Agent在帮我们选择一家餐厅、推荐一款软件、或者比较几个旅游目的地时,它依据的信息来源和排序逻辑,就是GEO试图影响的对象。2026年,中国的GEO行业已经从概念走向产业化,出现了专门的服务商和评估体系。当然,在产业初期,也出现了一定程度的乱象,包括各种虚假广告、给大模型投毒等问题,未来会在行业治理中进一步规范。
从某种意义上说,这是广告行业的一次进化。过去的广告是给人看的,未来的广告可能是给Agent看的。 这听起来虽然有些荒诞,但想想看,如果用户越来越多地依赖Agent做决策,那么影响Agent的信息输入,就等于影响了用户的最终选择。当然,这也引发了全新的伦理问题:Agent的推荐应该是中立的吗?谁来监管给Agent看的广告?这些问题还远没有答案,但问题本身的出现,就说明时代真的变了。
第三种:Agent-as-a-Service (AaaS) 的能力订阅。 在SaaS时代,企业购买的是软件的使用权。在AaaS时代,企业购买的是Agent的能力。一家律所不需要购买一套法律研究软件,它可以直接调用一个法律Agent的能力,按任务复杂度计费,按使用量结算。这与云计算从卖服务器到卖算力的转变逻辑一致。我们不再为工具付费,而是为能力付费。
第四种:Agent佣金与交易分润。 当Agent替用户完成实际交易,如订酒店、买保险、采购办公用品等,它就可以从交易金额中抽取佣金。这看起来像是智能导购的升级版,但底层逻辑已经变了。传统导购模式是我给你导流量,你给我佣金,本质上是信息不对称的生意;而Agent模式是帮用户完成最优决策并执行交易,佣金的正当性来自于交易本身的完成和优化,而非信息垄断。
第五种:用户记忆飞轮带来的数据即壁垒。 这或许是最深远的商业模式变化。Agent越用越了解用户,包括用户的口味偏好、预算区间、出行习惯、工作风格等,这些记忆构成了强大的迁移成本。当用户的Agent已经记住了过去三年的所有偏好,就很难轻易切换到另一个从零开始的Agent。这种记忆锁定比传统的推荐算法更深、更私密、也更难复制,它将成为Agent平台最核心的竞争壁垒之一。
五种新模式,一个共同的底层逻辑:移动互联网卖的是眼球,智联网卖的是结果。
三、从流量经济到能力经济:生态逻辑的重构
商业模式的变化,必然带来生态格局的重塑。
移动互联网的生态演进,走过了三个清晰的阶段。先是App Store让百万应用竞相绽放,然后超级App把用户时间吸入自己的引力场,最后信息流算法成为分发的终极裁判。贯穿始终的核心逻辑只有一个:入口、时长和DAU。 谁占据了用户的注意力,谁就占据了商业价值链的顶端。
智联网时代的生态逻辑正在发生根本性的转变。这种转变大概率也将经历三个阶段,但驱动力从注意力变成了能力。
每个服务商都面临三个阶段的演进,先让自己的能力能被调用 (阶段一) ,再让自己在场景中不可或缺 (阶段二) ,最终在新生态中找到自己的位置 (阶段三) 。
阶段一:API化与能力模块化。 这个阶段已经开始了。越来越多的服务商意识到,在Agent时代,拥有一个漂亮的App界面不再是核心竞争力,让自己的能力能被Agent高效调用才是。于是它们开始把自己的服务拆解成标准化的API和Skill模块:支付能力、票务能力、餐饮预订能力、物流查询能力……每一项服务都变成了Agent可以调度的积木。
这就像餐饮行业从堂食转向外卖的过程,当顾客不再走进店门,门面装修就不再重要,重要的是后厨的出品速度和菜品质量。在Agent时代, App界面不再重要,重要的是服务商的能力有多快、多稳、多好用。
阶段二:高频场景的端到端委托。 当足够多的能力模块就位之后,Agent开始接管整个场景。不是帮用户查一个航班信息,而是完成从规划行程,到预订机票酒店,到安排接送的整个差旅流程。不是给用户搜一个菜谱,而是完成从确定菜单,到下单食材,到安排配送的整个晚餐准备。用户只需要表达意图,Agent完成全链路。
阶段三:新分发与商业化框架。 当Agent生态成熟到一定程度,新的分发机制和商业化框架将随之建立。Agent Store和Skill市场将取代App Store,成为能力发现和交易的核心场所。而计费方式也将从按下载量、按月订阅,转向按结果计费。服务商的Agent能力被调用了多少次,完成了多少任务,用户满意度如何,这些将决定收入。
在这个新生态中,服务商将面临三种命运的分化。
第一种:成为品牌型Agent。 有些服务商有足够强的品牌认知和用户关系,可以自己成为Agent,就像今天的美团、携程,未来可能直接以Agent形态面对用户,保持品牌和入口的控制权。
第二种:成为能力型服务商。 更多的服务商将成为被Agent调用的能力。服务商可能不再有自己的App入口,但在某个垂直领域的能力是不可替代的。就像今天很多SaaS工具没有消费者品牌,但在B端市场有稳固的地位。
第三种:被淘汰。 那些既没有品牌力成为Agent,也没有独特能力被Agent需要的服务商,将面临被淘汰的风险。就像移动互联网时代那些既没有做好App、也没有接入超级App的应用和商家。
四、信任基础设施:Agent的身份与责任
生态在重构,但任何生态的健康运转都需要一样东西:信任。
当Agent只是帮用户搜索信息、整理文档时,信任问题还不突出。但当Agent开始帮用户下单消费、签约服务、甚至管理投资组合时,一系列尖锐的问题浮出水面。Agent下的订单,算谁的?Agent做的决策,谁来担责?Agent造成的损失,谁来赔偿?
这些不是哲学问题,而是必须解决的基础设施问题。
移动互联网的爆发,靠的并不是NFC芯片或者3G、4G网络,真正的推手是一整套信任基础设施的建立:实名认证让用户知道对面是谁,担保交易让我们敢于和陌生人做生意,风控系统让平台能在毫秒间识别欺诈行为。没有这些,移动支付不会普及,电商和小程序也不会繁荣。
智联网同样需要自己的信任基础设施,至少包括三个层面。
第一层:Agent身份认证。 就像今天的企业微信有企业认证一样,未来的Agent也需要一套身份体系。这个Agent是谁开发的?它代表谁的利益行事?它的能力边界是什么?一个经过认证的Agent和一个匿名Agent,在获得用户授权时应该有完全不同的权限级别。
第二层:授权分级。 我们可能愿意让Agent订一杯咖啡,但不愿意让它去自动买一套房。授权分级机制让用户可以精细地控制Agent的行为边界:这个Agent最多能花多少钱?能访问哪些个人数据?能代表我们做出哪些类型的决策?这类似于今天银行卡的交易限额机制,但需要更加灵活和语义化。
第三层:行为审计与追溯。 Agent做了什么、为什么这么做、依据了哪些信息,这些都需要被记录和追溯。而且,Agent去访问其他的APP和互联网服务时,也要表明自己的身份,使用A2A,MCP、API、CLI等协议和方式进行交互。当出现纠纷时,行为日志就是证据链。这不仅仅是技术问题,也是法律和监管体系需要适应的新议题。
信任基础设施的建设不会一蹴而就,但它的重要性怎么强调都不过分。没有信任基础设施,智联网的商业闭环就无法真正打通。 一个没有信任的Agent生态,就像一个没有法院的市场。没有信任,交易可能发生,但没人敢做大额生意。
五、从用户画像到用户记忆:数据范式的跃迁
移动互联网时代的核心数据资产是用户画像,包括是谁、多大年纪、在哪个城市、喜欢什么品类、最近搜索了什么关键词。这些标签化的信息构成了整个精准广告和个性化推荐体系的基础。
但在智联网时代,数据的核心形态正在发生变化。Agent要真正好用,仅仅知道用户“是男性、30岁、喜欢科技产品”是远远不够的。它需要知道的是:习惯坐靠窗的位子还是靠过道的,出差喜欢住商务酒店还是设计酒店,写报告喜欢先列大纲还是先写引言,阅读文章更关注数据还是案例,跟客户开会喜欢提前15分钟到还是准时……
这些不是画像标签,而是用户的上下文记忆 (User Context) ,是对用户行为模式、偏好习惯和决策逻辑的深度理解。最近流行的Hermes Agent的持久记忆系统就是这种数据范式的一个早期实现。
从商业竞争的角度看,谁拥有用户的上下文记忆,谁就拥有用户关系。 这是比用户画像更深层、更私密、也更有价值的数据资产。一个已经积累了用户3年工作记忆的Agent,和一个刚刚初始化的新Agent,在使用体验上会有天壤之别,这就是所谓的上下文记录权。
上下文记忆将成为平台竞争的新制高点。移动互联网时代,平台争夺的是谁有最多的用户数据;智联网时代,争夺可能将升级为谁替用户记得更多、记得更好。
这也引发了一个关于用户权利的重要议题:用户的上下文记忆,到底应该归平台所有还是归用户所有?如果用户想从A平台的Agent切换到B平台,能不能把自己的记忆带走?这将是智联网时代最重要的数据权利问题之一。
第三幕:新大陆——智联网的未来图景
一、一张全景图:智联网的基础设施栈
每一代网络都有自己的基础设施栈。PC互联网的栈是CPU→操作系统→浏览器→网站→搜索引擎。移动互联网的栈是芯片→移动OS→App Store→App→支付/账号体系。
智联网正在构建属于自己的栈,对照来看,基础设施栈有着清晰的映射关系:
治理层是目前最薄弱的环节。 底层引擎在激烈竞争,应用层在加速创新,但治理层,包括谁来给Agent发身份证?谁来定Agent的行为边界?谁来审Agent的决策记录等,几乎还是一片空白。历史经验表明,每一代互联网的真正爆发,都不是在技术最强的时候,而是在治理框架基本就绪的时候。这需要监管机构、大模型厂商、应用提供方、用户等各方的协同努力。
二、谁会成为智联网的操作系统?
每一代网络形态都会产生自己的操作系统,它不一定是技术意义上的OS,而是占据核心枢纽位置、控制关键资源分配的平台。PC时代是Windows,移动时代是iOS和Android。
智联网的操作系统将花落谁家?目前看,有三种大概率的路径:
智联网时代未必会出现一个统一的操作系统。 移动互联网的iOS和Android之所以能统一市场,是因为手机是一个封闭硬件,我们只能装一个OS。但Agent是纯软件形态,一个用户完全可以同时使用OpenAI的Agent做研究、微信的Agent点外卖、Hermes的Agent管日程。智联网的竞争终局,更可能不是谁赢了,而是谁在哪一层赢了。 底层模型、协议标准、能力生态、用户入口等,每一层可能由不同的玩家主导,形成一个远比移动互联网更复杂的竞争格局。
大概率,这三条路径会长期共存和博弈,就像移动互联网时代手机厂商、操作系统、超级App三方角力了十多年一样。而开放与封闭的经典之争,也将在智联网时代重新上演。只不过这次争夺的不再是应用商店的控制权,而是Agent调度权、以及对用户上下文的记忆。
三、人机协作:不是替代,是新分工
每当一项颠覆性技术出现,替代论总是最先占据头条。但历史反复证明,更常见的结局不是机器取代人,而是人机之间形成新的分工。
在智联网时代,知识工作者的角色将从执行者转变为决策者+审核者。Agent处理80%的重复性、标准化工作,如资料搜集、数据整理、初稿撰写、日程协调、合同比对等。人类则聚焦于那20%需要创造性判断、价值观权衡和人际关系处理的工作。
这不是降级,而是升级。就像电子表格的发明并没有让财务人员失业,而是让他们从手工算账中解放出来,把更多时间花在财务分析和战略建议上。
但这里有一个不那么温暖的真相,或许并不是所有知识工作者都能完成这次升级。 能够胜任决策者+审核者角色的人,需要具备对Agent输出的判断力,得知道Agent的分析哪里对、哪里错,这要求对专业领域有比Agent更深的理解。换句话说,Agent不会替代专家,但它会替代那些看起来像专家,实际上只会做搜索和整理的人。未来的知识工作门槛不是更低了,而是更高了。门槛的形状变了,从能不能找到信息,变成了能不能判断信息。
与此同时,一批全新的职业正在萌芽:Agent训练师 (教Agent理解特定行业的知识和规则) 、评测集设计师 (定义Agent的质量标准和验收条件) 、Agent运营 (管理和优化Agent的表现) 。这些职位在两年前还不存在,但在智联网时代可能将成为每个组织的标配。
四、审慎的乐观:三个需要警惕的风险
描绘了这么多令人兴奋的图景,有必要在结尾前踩一脚刹车。任何新范式在带来巨大机遇的同时,也伴随着不容忽视的风险。
风险一:中心化风险。 如果Agent的调度权最终集中在少数几个主体手中,它们对整个数字经济的控制力将远超今天的超级App。因为Agent不只是分发流量,它还在替用户做决策。一个控制了大多数Agent的平台,实质上控制了大多数用户的消费选择、信息获取甚至生活方式。因此,如何既能有中心化的AI助手调用能力,又有去中心化的服务获取选择,对于用户和生态来说,都非常重要。那些一心想占据入口的平台,反而可能会伤害整个的生态健康可持续。
风险二:黑箱风险。 Agent做了一个决策,如推荐了餐厅A而不是餐厅B,选择了航班X而不是航班Y的时候,用户可能并不详细了解背后的选择机制是什么。当决策过程不透明时,偏见、利益冲突和操纵就有了藏身之处。Agent时代需要比推荐算法时代更高水平的透明度和可解释性。
风险三:数字鸿沟。 移动互联网早期曾造成了一定程度的数字鸿沟,那些不会用智能手机的老年人被排除在很多服务之外,后来各种适老化的改造,才让更多老年人可以方便进入到移动时代。智联网初期同样可能产生这种鸿沟,如果不会使用Agent,或者无法获得高质量的Agent服务,在效率和信息上的劣势将更加明显。
这些风险都不是凭空的想象,但机遇远大于风险。关键在于生态协作和治理框架能否跟上技术发展的步伐。建立透明的Agent决策标准、防止过度中心化、确保普惠性的Agent服务覆盖所有人群。技术解决效率问题,治理解决公平问题,二者缺一不可。
唯有此,才能建立共生、互惠的可持续Agent生态,真正实现“让人放心、把人放大“的AI愿景。
结语:重写,而非延伸
回顾人类数字文明的演进,每一次网络形态的跃迁,都不是上一代的优化版。
PC互联网出现时,人们以为它是电子化的报纸和邮局,但它重新定义了信息的分发方式。移动互联网出现时,人们以为它是手机上的网站,但它重新定义了人与服务的连接方式。
智联网也一样,它不是更好用的搜索引擎,不是更聪明的App,也不是加了AI的移动互联网。它是对整个数字世界运转逻辑的一次重写:
• 交互的主体从人变成了Agent;
• 商业的度量从注意力变成了结果;
• 生态的逻辑从流量变成了能力;
• 数据的核心从画像变成了记忆;
• 信任的基础从实名认证延伸到了Agent认证。
这些变化中的每一条单独拿出来都足够深远,而它们正在同时发生。
如果非要用一句话概括这轮变革的本质,那就是移动互联网解决了信息如何到达人的问题,智联网要解决的是“任务如何不经过人就被完成“的问题。 前者改变了信息的分发效率,后者将改变整个社会的任务执行效率。这两个问题的量级不在一个层面上,后者的影响范围将远远超出互联网行业本身,渗透到金融、医疗、法律、教育、制造等一切需要知识劳动的领域。
2007年乔布斯在Macworld大会上掏出第一代iPhone时,台下观众看到的是一个能上网的iPod。没有人预见到,十年后它会催生出外卖、短视频、移动支付等,彻底重塑数十亿人的日常生活。2010年微信刚上线时,大多数人以为它只是又一个短信替代品,而它重新定义了中国人的社交、支付和生活服务方式。
我们现在所处的位置,大概相当于智联网的iPhone时刻。基础技术刚刚就绪,第一批标志性产品已经出现,但真正的杀手级应用和商业形态还在孕育之中。今天争相安装龙虾、调试Hermes的人们,就像2007年排队买iPhone的那批人,他们可能还说不清楚这个东西最终会变成什么,但他们已经感受到了一些根本性的东西正在改变。
移动互联网连接了人与信息,智联网将连接意图与结果。
这不是下一个风口,这是下一个时代。
王强 腾讯研究院前沿科技研究中心主任
本文来自微信公众号 “腾讯研究院”(ID:cyberlawrc),作者:王强,36氪经授权发布。