OpenClaw爆火60天:中国产业AI落地的“又一次集体进化”
OpenClaw未必是终局形态,小龙虾也未必一直鲜红。但其在复杂、封闭、充满博弈的现实环境中,找到一条能够先执行、再优化、再重构的路径。当Agent开始在旧秩序中工作,而不是在理想环境中演示,企业的智能化进程,也将真正进入了深水区。
建立13000万个社区,发布27000条帖子;自主购买电话卡给开发者打电话;自主联系热门餐厅,说服接线员挤出了空位;失控将Meta安全总监的200多封邮件删除;谷歌带头封杀,Anthropic紧随其后……
这一连串离谱又充满戏剧性的事件,都指向同一个主角。
2026开年,一个名为OpenClaw的开源项目以闪电般速度席卷GitHub,一天斩获9000颗星。两周后,星标突破17万,一时间,标志性的小龙虾图案登上各大社交平台头版。
这一路径的出现,也让产业链参与者迅速嗅到机会。
OpenAI直接挖走OpenClaw创始人。创业领域,美团联合创始人王慧文发出“英雄帖”,广招对OpenClaw相关领域感兴趣的创业者和技术人才。国内一众模型厂商等“卖铲人”则各显身手,智谱、Kimi、MiniMax、阿里云等国纷纷推出CodingPlan的API套餐,试图深度绑定这只炙手可热的“龙虾”。
事实上,OpenClaw的特殊之处在于,任何人都能基于其打造专属Agent助手,通过聊天界面让Agent跨平台、跨系统完成任务,这与过去“只说不做”“集成式”的AI助手截然不同,意味着Agent真正长出手脚,开始进入真实世界。
那么,OpenClaw的价值究竟是什么?真的无所不能吗?它为AI产业化落地带来了什么?真的能推动我们走向通用AGI吗?以及,在如今中国企业Agent落地正进入系统繁多却彼此割裂的深水区,OpenClaw这一路径,是否能够改变现状?
不论OpenClaw后续如何,但这些疑问背后,一个不可否认的事实是,火爆2个月的OpenClaw,已然给中国的AI落地产业链,带来一个新的方向和进化,那就是从智能体单点的技术、协议走向真正的智能体跨体系协同时代。
困在API里的Agent,开启“外挂”
一直以来,Agent被视为让AI成为真正生产力的关键纽带。大模型像一个极其聪明的大脑,却并不会真正去“做”:它不会自己打开网页、填写表格、整理文件或跨平台操作。
Agent的意义,是为这个大脑装上“手脚”,让其不仅能思考,还能调用工具、访问系统、操作软件,完成一连串具体步骤。比如,把“帮我做一份行业报告”拆解为自动搜索资料、筛选信息、整理数据、生成图表、排版成文档并发送邮件,形成完整闭环。
但这个闭环始终存在裂痕。
数据显示,在WebArena这类真实网页多步任务测试中,GPT-4级模型在3—5步任务上的成功率约为40%—60%,一旦超过10步,往往降至15%—25%;超过15步时,成功率跌破10%。公开案例也显示,6—8步以上流程中,人工介入率高达40%—60%。
以电商行业为例,一家小型电商公司老板每天要登录多个后台,查看库存、对比竞品价格、调整定价,再检查广告消耗和ROI,最后导出报表生成日报。他希望用Agent自动化实现每天早上8点自动完成所有流程,团队只做策略判断。
但理想很丰满,现实很残酷。
上线第一天,Agent从ERP拉取库存数据,发现某款空气炸锅低于安全阈值,准备同步到平台避免超卖,却发现平台API只支持读取库存,不支持修改前台展示,仍需人工操作。
接着是比价。Agent即便抓取到竞品价格,但需要执行“批量改价”时,发现平台对改价API的权限做了分级,只有特定类目和大商家才能调用,而且频次有限。所谓“自动调价”,变成了“自动算价+人工执行”。
有企业尝试用RPA录制脚本,但电商后台频繁改版,维护成本极高,往往变成脚本工程师的长期劳动。
可以看到,企业落地Agent的前提非常苛刻,往往走的是对接API、梳理数据结构、重构权限体系、定制流程引擎这种“重集成”路线。这是一条典型的IT项目路径,周期长、投入重、改造深,一旦某个系统升级,接口就要重做。
OpenClaw这种开源框架,恰恰提供了另一种思路。
其基于视觉识别屏幕内容,定位按钮、文本和输入框。通过鼠标点击、键盘输入、滑动、滚动等通用控制完成操作,并在目标驱动下进行决策循环。
相比“重集成”路线,OpenClaw不再依赖平台开放接口,也不强求企业重构系统,而是在屏幕层直接接管操作逻辑,实现更强的执行力,深入企业生产环境。
例如在一项基于 CL-bench的公开测试显示,在 HR 培训类标准化任务集中,OpenClaw+MiniMax-free Agent 组合的任务解决率达 20%,而对应 MiniMax-M2.1、DeepSeek-chat 裸模型的任务解决率为 0%。
这种执行范式的转变,使得企业用户们跃跃欲试。
Agent迎来新一轮爆发。
新一轮Agent爆发的“助攻者”们
2026年初,AI领域再次出现明显躁动,资本、企业与开发者情绪同步升温。
美团联合创始人王慧文发布“英雄帖”,招募OpenClaw创业团队并提供融资支持;开发者论坛被红色小龙虾刷屏;上下游厂商纷纷宣布接入……这种气氛,与2025年同期DeepSeek掀起的“接入潮”如出一辙。
在中国这个特殊的市场,从不缺乏将新范式迅速商业化的力气和手段。
1月底,第一波“卖铲人”,迅速就位。
互联网巨头共识很清晰,那就是不能把核心入口交给开源框架,而要以OpenClaw为参照,结合自身生态形成闭环,从算力、模型到场景全部打通。
阿里云是动作最典型的一家。
2月28日,其推出CoPaw个人智能体工作台,对标OpenClaw,主打“三条命令极简部署”,针对原框架部署复杂的问题做优化。同时原生适配钉钉、飞书、QQ等主流IM,支持本地与云端双模部署,并深度融合通义千问模型能力,解决海外开源框架在国内生态“水土不服”的问题。
在云侧,其上线OpenClaw一键安装与预装镜像,15分钟即可完成部署。其逻辑非常直接,那就是用OpenClaw吸引开发者和企业上云。
总的来说,阿里云的思路是以云基础设施为底座,以通义千问为模型中枢,以钉钉为高频办公场景,通过开源策略吸纳开发者,最终形成闭环。
腾讯云的策略更偏向流量入口。
其通过轻量服务器预置OpenClaw模板,打通企业微信、QQ、飞书、钉钉,并提供可视化切换面板,降低部署门槛。同时,腾讯内部启动自研Agent平台,目标是深度绑定微信、小程序与企业办公生态,减少对外部框架的依赖。
要知道,腾讯最大的优势是社交与IM的垄断级流量入口。无论是C端用户还是中小B端企业用户,触达能力都是行业最强。一旦Agent能力嵌入社交与办公体系,扩散速度会非常快。
百度智能云的打发则围绕搜索入口。
其将核心产品深度内嵌,在百度app实现一键调用OpenClaw智能体,企业在百度智能云完成部署后,可以直接通过搜索框或消息中心调用。后续还将覆盖百科、学术、文库、电商等全生态产品。在能力层面,百度千帆把搜索、百科、学术检索等能力封装为Skill,上架OpenClaw生态,补足中文信息能力。同时推出免部署云端版本,降低使用门槛。
总的来看,百度依托搜索入口和内容生态,把Agent嵌入高频搜索场景,而不是做一个孤立工具。
火山引擎的打法则更偏向流量分发与场景缝合。提供OpenClaw的完整部署方案,并通过豆包大模型、飞书、抖音API打通场景。开发者可以快速构建带货客服、企业数字员工等应用,字节承担流量分发角色。
基于抖音流量池、飞书企业场景和火山引擎的MaaS能力。其目标,是覆盖开发、部署到变现的全流程。
相比巨头强调闭环,模型创业公司更聚焦于成为“最合适的大脑”。
月之暗面率先推出KimiClaw,主打云端托管、无需本地安装,解决部署门槛问题。Kimi的优势在于长上下文能力与工具调用能力领先,同时在C端用户中认知度高。对其而言这一方案可以精准命中普通用户的使用痛点。
数据显示,KimiK2.5在OpenRouter平台调用量持续领先,并在OpenClaw模型调用榜中位居第一。
MiniMax则强调其多模态能力均衡以及底层训推架构的解耦能力,推出MaxClaw模式,一键打通OpenClaw生态,无需自行配置API。
数据显示,在一项“本地文件检索-全网资讯补充-稿件撰写-邮件发送”长链路办公任务闭环执行实测中,接入 MiniMax-M2.5的 OpenClaw,可 100% 完成全流程闭环执行,无中途中断、无关键环节失败。
智谱强调的是国产化与合规优势,推动GLM-5旗舰模型无缝兼容OpenClaw。强化了编程与长流程能力;科大讯飞则以语音能力和教育办公场景切入,提供低成本调用方案。
除了巨头和模型厂商,产业链玩家也迅速跟进。网易有道发布LobsterAI,定位“中国版OpenClaw”。
国产芯片与硬件厂商也加速适配,龙芯完成基于3B6000M芯片的本地部署;中科创达实现魔方派与AIBOX适配;清昴智能完成对昇腾等国产芯片的兼容。
最焦虑的RPA厂商和最怕被架空的SaaS厂商,也开启了自我革命。飞书发布了Agent友好型UI协议;金山办公2月20日也正式开放WPSAI行动套件;弘玑Cyclone、来也科技等,作为传统RPA代表,也迅速推出了“OpenClaw企业级管理后台”。也有一些安全厂商如奇安信,针对OpenClaw的安全性问题,发布了Agent行为防火墙。
无论是AI模型服务商押注OpenClaw最合适的大脑,还是互联网巨头打造从算力到场景形成闭环,亦或是产业链在补能力、SaaS巨头主动示好的“扶手计划”,本质上是基于自身优势构建差异化护城河,更是在为一个原本“笨拙、昂贵、有风险”的新生儿,合力打造一个可落地的温室。
OpenClaw在中国的火爆,早已超出了一个开源项目的范畴,转而演变成一场全产业链的“集体进化”。
性能、成本与安全:商业化落地前的“成人礼”
可以确定的是,OpenClaw正在抬高企业对Agent的预期。
过去,Agent更多被当作问答助手或分析助手;如今,企业开始把其视为能够执行流程的数字劳动力。在流程重复、环境相对可控、缺乏API接口或人工成本高昂的场景中,其确实具备先发优势,这也是资本和产业链迅速跟进的原因。
但问题在于,OpenClaw真的无所不能吗?
答案是否定的。
要知道,OpenClaw与集成式Agent存在本质差异。集成式Agent基于结构化接口,通过API直接调用系统能力,一次请求通常在1至3秒内完成,多个动作还可以并行执行。
而OpenClaw采用是“截图—模型推理—坐标计算—动作模拟”的视觉闭环。每一次操作都要经过完整的感知与决策流程,单步耗时往往在15至30秒之间。例如一个“登录系统并导出报表”的简单任务,集成式Agent可能5秒完成,OpenClaw却需要3至5分钟的反复尝试。效率差距由此拉开。
更关键的是稳定性。集成式Agent依赖协议交互,输入输出结构清晰,可控性强;OpenClaw则高度依赖模型对像素界面的理解。一旦出现动态弹窗、页面刷新或UI微调,就可能产生“视觉幻觉”,导致点击偏移甚至陷入循环错误。
因此,OpenClaw不仅响应慢,而且在复杂环境中不够稳定。
效率之外,是成本问题。
集成式Agent主要消耗文本Token,单次任务成本可以低至0.01美元甚至更低。OpenClaw却需要持续传输高分辨率截图,每次推理可能消耗1000至1500个视觉Token;若任务链条较长,单次成本可能达到1至2美元。对于高频企业调用场景,这意味着成本可能是集成式方案的数十倍甚至百倍。
模型厂商的反应,也从侧面印证了这一点。
Anthropic就曾更新服务条款,禁止在OpenClaw等第三方工具中使用ClaudeFree、Pro或Max账户的OAuth,将这种行为定性为“token套利”和安全风险。随后,谷歌称检测到自家AI编程工具Antigravity后端出现“大规模恶意使用行为”,严重降低了正常用户的服务质量,连夜封禁OpenClaw。
这些动作传递出同一个信号,那就是基于订阅制的定价体系,难以承受OpenClaw这种高频、高消耗的调用方式。
如果说性能与成本尚属效率问题,那么稳定与安全则更为棘手。
集成式Agent可通过APIKey实现细粒度的权限控制,例如只读权限或仅限操作特定数据库范围。但OpenClaw本质上模拟的是“人类操作界面”,拥有更接近全局控制的能力。权限边界因此变得模糊。
近期,Gartner与Password等机构均发出警告,指出其容易受到“UI提示词注入攻击”。此外,已有数家韩国科技巨头和金融机构在内部网络中禁用OpenClaw,以防机密泄露。
在性能、成本与安全三重约束下,OpenClaw若要真正进入大规模生产环境,仍面临不小的现实挑战。
即便如此,OpenClaw的价值不仅在于其技术能力本身,更在于其提供了一种思路,那就是当理想的接口整合难以推进时,Agent或许不必等到系统重构完成,才有资格走进生产环境。
而这,恰恰触及了中国企业数智化转型中最现实的一道门槛。
再看中国企业落地Agent的“现实路径”
根据《2024中国企业数字化转型报告》数据显示,中国大型企业平均拥有超过150个独立IT系统,其中约60%属于缺乏维护、无API文档或接口封闭的老旧系统。
一直以来,中国企业数智化转型都较为沉重。中国许多企业的数字化,大多不是自上而下一次性重构,而是在十几年时间里不断叠加。系统之间彼此割裂,但却又互相依赖。
因此,动一个系统,牵一发动全身。打通一次接口,意味着漫长的权限审批、数据安全评估、供应商协调。于是需求侧形成了一个悖论,他们希望AI能够真正进入生产环境带来生产力,但又无法承受结构性改造的代价。
在这种背景下,要求企业为了AI去大规模重构底层系统,可谓难上加难。
Anthropic与研究机构Material在2025年末对美国500多位技术领导者做了一次调研,近一半(46%)的组织认为与现有系统的整合是主要障碍。
软件供给侧同样高度碎片化。SaaS厂商希望构建自己的封闭生态,平台企业希望把数据锁在自己的护城河里,传统SI靠复杂集成吃饭,RPA厂商依赖脚本维护盈利。商业博弈下,使得接口难以开放,导致企业Agent落地的成本居高不下,因为每一个对接动作,背后都是利益再分配。
在这种背景下,OpenClaw的路径不单纯的技术创新,更是一种对既有权力结构的规避。企业不用去申请接口,而是直接在“界面层”操作。这种方式,本质上绕过了供给侧的封闭逻辑。
但问题也随之而来。
当Agent绕过API、绕过权限分层,直接模拟人手操作时,其在某种意义上削弱了平台对流量与数据的控制力。长远来看,供给侧会主动为Agent降低摩擦,还是会加强封锁?
一种可能是,Agent成为旧系统的“补丁”。不触动底层结构,只在其上叠加一层行动智能,让僵化的系统继续运转,这是一条温和演进路径。
另一种可能是,随着Agent成为主流执行主体,系统设计逻辑会反向重塑。未来的软件不再围绕人类交互,而是为Agent交互而生。界面更加结构化、可机器识别,权限将围绕“数字员工”重新划分,审计与合规将嵌于Agent行为链条之中。如果这一趋势成立,那么Agent并不是“外挂”,而是下一代操作系统的雏形。
这是一个值得持续观察的博弈,难有定论。
站在当下,回看开篇那些略显荒诞的瞬间,无论是自动打电话、强行订位,还是误删邮件,更像是Agent第一次真正触碰现实世界时不可避免的摩擦。
OpenClaw未必是终局形态,小龙虾也未必一直鲜红。但其在复杂、封闭、充满博弈的现实环境中,找到一条能够先执行、再优化、再重构的路径。当Agent开始在旧秩序中工作,而不是在理想环境中演示,企业的智能化进程,也将真正进入了深水区。
本文来自微信公众号 “产业家”(ID:chanyejiawang),作者:斗斗,36氪经授权发布。