OpenClaw爆火之后:「模仿者们」八仙过海,但滥竽充数者居多
最近这段时间,关注AI的朋友肯定都被朋友圈和聊天群里的OpenClaw刷屏过。作为一款展现出惊人潜力的智能体产品,它确实如同一条鲶鱼,让整个行业都热闹了起来。
大家突然发现,智能体开发并非大企业的“专属”,普通开发者也能在AI的帮助下实现智能体开发,于是,就与科技圈以前发生过多次的剧本那样,闻风而动的跟风者迅速蜂拥而至。各种令人眼花缭乱的智能体开始陆续登场,仿佛一夜间所有厂商都掌握了智能体的核心科技。
网上就有人统计了五个最近非常热门的开源AI智能体:OpenClaw、ZeroClaw、PicoClaw、NanoClaw和MemU Bot。而网友对于不同智能体的讨论也是没有停过,那么问题来了,这堆智能体都有什么不同?以及智能体的未来到底会走向何方?
AI智能体,八仙过海
说实话,OpenClaw确实做得很不错,从功能设计到应用生态,都是目前开源智能体中做得最好的。虽然在安全性等方面有着不少问题(原因是开发者原本只想着用于本地而非云端),不过开源社区的开发者们已经着手解决,在最新上线的版本中就新增了多个安全机制。
其他开源智能体想要竞争,就只能从其他赛道入手,做出差异化,关键其实无非就是以下三点:运行效率、运行环境和安全性。
ZeroClaw:极致轻量化,但隐私是问题
图源:ZeroClaw
先说ZeroClaw,这个智能体由开源社区ZeroClaw Labs开发,采用Rust语言构建,仅需5MB的内存即可正常运行,使其能够适配极低功耗的单片机和老旧嵌入式设备。因为极致的轻量化,其冷启动速度被压缩到了惊人的10ms以内,同时还支持用户引入AI人格,让其表现更契合你的需求。
小雷觉得,ZeroClaw的优势主要在智能IoT领域。比如你可以将其引入到烟雾传感器之类的设备中,让设备在检测到异味时结合其他设备的数据来决定启动哪些应对方案。不过,ZeroClaw的运行非常依赖云端算力,会带来很多额外的算力成本,而且在网络不稳定时使用体验会大打折扣。
如果想在不同场景都稳定使用,最好是在家里部署一个算力终端来辅助运行。另外ZeroClaw的应用生态也远不如OpenClaw,所以很多功能都需要用户自己解决,需要有一定的编程能力。说实话,当所有运算都依赖云端,用户的隐私安全就成了一个巨大的黑盒,是否愿意用隐私换便利,全看大家的选择了。
PicoClaw:为了隐私,牺牲功能
图源:PicoClaw
再来看看PicoClaw,这是由Sipeed开发的智能体,他们打出的口号是轻量化与端侧运行,并宣称能够完美保护本地隐私,且在没有网络连接的极端环境下依然能够流畅运行。
但PicoClaw为此也牺牲了很多功能,它并不支持屏幕视觉识别和复杂GUI自动化操作,并且缺乏大型数据管理能力,也就不用指望它能够处理好超长文档解析等工作了。
PicoClaw在处理单步骤的简单文本指令时确实反应迅速,但是一旦面临需要跨应用多步规划的任务,比如从邮件提取数据并填入表格,这个模型就有概率直接卡死,所以主要还是适用于老旧和小型设备的Agent需求。
这个智能体最有意思的地方在于,它几乎完全由AI“代工”编写和优化,所以也被开源社区视作“自进化”的标准案例,因此也获得了不错的关注度。
NanoClaw:极度精简,“毛胚房”版智能体
图源:NanoClaw
风头正劲的NanoClaw则是把轻量化做到了极致,核心代码仅4000行(精简版仅500行),甚至可以在高性能路由器里运行。为此NanoClaw还舍弃了GUI自动化功能,交互完全依赖于文本指令和结构化的API调用。
另外,极致精简的代价就是几乎所有功能都要让AI“现编”,加上调试等开发需求,普通用户基本可以无视它,只有技术大牛才能玩得转。而且就算你想找一下“前人的智慧”,也很困难,因为NanoClaw的“毛坯”特性,用户首先需要给智能体植入对应的功能,然后才能兼容作者发布的应用。
不过NanoClaw还有个优势,那就是安全性比其他智能体都更高,因为其强制在沙盒环境下运行,而且只需要最基础的运行权限,不管怎么折腾都不会影响到本地的计算机系统。
MemU Bot:强化版OpenClaw,安全性存疑
图源:MemU Bot
至于MemU Bot则是在OpenClaw的基础上强化了长期记忆与用户画像构建,同时还集成了MCP协议,拥有不亚于OpenClaw的应用生态,甚至连部署都变得更加简单。
而且,MemU Bot更加主动,会根据用户目前的工作内容主动提供建议。那么MemU Bot就没有缺点?显然不可能,它的问题在于对本地设备性能和云端算力都有很高的要求。
因为其长期记忆数据全部保存在端侧,随着用户的使用时长增加,扫描和检测上下文的时长会降低它的运行效率,甚至会拖慢设备运行。而且其对云端算力的用量是OpenClaw的两到三倍,算力成本非常高。
另外就是超过OpenClaw的权限需求,让用户在它面前几乎没有隐私可言,如果被入侵可能会导致大量隐私泄露。同时,MemU Bot的核心代码并非完全开源,这也加剧了外界对其安全性和隐私性的担忧。
哪个智能体更适合你?
说实话,看完这堆智能体后,小雷认为核心无非是使用成本与实际业务场景的匹配度。如果你只是一个普通用户,单纯需要一个在手机后台自动回复消息、整理日常琐碎日程的轻度个人助手,那么类似PicoClaw这种端侧产品勉强够用。
它无需你支付昂贵的API费用,仅靠本地算力就能跑,极限一点的情况下,就连手机的NPU都能够满足推理需求。但是,在这种情况下跑出来的效果也就足以应付那些容错率极高的日常伪需求罢了。
而在高要求的专业场景下,本地小模型的体验绝对会让你想砸电脑。所以,如果是企业级用户,或者说你想用智能体来提供涉及重要决策的数据和辅助,那么最好还是使用类似于ZeroClaw或OpenClaw这种云端算力驱动的智能体。
虽然算力成本很高,但是作为生产力工具而言倒也不算贵。倒不如说现在有些用户想着低成本或零成本启动智能体,本身就有点不切实际。除非对智能体的工作质量要求非常低或者没要求,不然接入云端算力依然是低成本高质量的选择。
对于一般的用户,小雷还是建议首选OpenClaw,因为生态最完善、使用起来也更方便,遇到问题也不会找半天都没个同僚过来解惑。至于喜欢折腾或有特别需求的极客朋友们,可以尝试着挑战以上几个智能体,估计也能收获不一样的体验。
智能体大战,滥竽充数者居多?
自OpenClaw爆火之后,智能体领域也终于进入到发展的快车道,这让小雷想到此前的“百模大战”。但是智能体与AI模型的不同之处在于,“百模大战”是在卷测试分数、卷参数量,而智能体大战,则是卷怎么帮用户更好的“干活”,这是有本质上区别的。
一些媒体将智能体的发展简单描述为AI模型的版本升级,这个说法显然不对。从传统的AI大模型跨越到真正的Agent,背后的算力调用和模型参数其实都没有发生明显变化,但是底层调度和人机交互逻辑发生了根本性的改变。
以前的AI大模型,无论它在跑分榜单上的纸面数据多么逆天,本质上都只是个“缸中大脑”,只能被动接受信息并做出反馈,无法干涉物理世界。而智能体的最大不同就在于给“大脑”装上了四肢和眼睛,让AI能够理解用户的模糊意图,甚至自主调用、自主进化、自主讨论任务解决方案。
图源:雷科技
如果你给它开放更多授权,直接操作机械臂进行工作也并非不可能。不过,也有人说现在的智能体并非真正的“智能体”,多数产品本质上还是套用一个新的底层逻辑并提供API接口的工具。这个观点倒也没错,因为智能体的真正三要素是:自主任务规划、长期状态记忆归纳总结和自我深度反思机制。
其中,前两者我们已经在OpenClaw和MemU Bot上看到,但最关键的其实是第三个。因为我们想完全不管理智能体,让它具备完全自主的运行能力,那么它就必须具备处理未知错误的能力,并从中归纳出解决或规避错误的方法,而非等着用户来给它解围。
小雷记得,前段时间最出圈的一段话是OpenClaw开发者Peter Steinberger说的:“我都没教它怎么做,它自己判断需求然后就自己学会了”,以至于让人有些误解。其实,真实情况是Peter Steinberger的电脑里安装了对应的API工具,所以OpenClaw根据需求自主编写了调用命令,然后进行回复。
所以,OpenClaw其实也没有做到真正的“无中生有”,本质上还是在通过一定的逻辑进行计划和执行,区别在于用户下放了更多的权限,让其可以自主决策更多事情,无需等用户过来点击“下一步”才开始。
智能体的终局是操作系统
即使如此,这也足以成为全球生产力工具彻底重塑的前奏。智能体的大规模涌现,意味着绵延数十年的传统人机交互正在迎来一次彻底的变革。试想一下,过去我们需要投入巨大的精力去学习各种软件的复杂操作,而现在,这一切都可以交给智能体。它可以直接代替我们要去完成那些繁琐、重复且枯燥的工作。
事实上,类似的言论在AI大模型刚出现时也非常火,但是最终大家发现还是要自己上传数据或文本、然后一步步教AI怎么做,耗时比自己上手还慢,久而久之也就放弃了。而智能体解决的就是这个问题,现在我们只需要提出问题,然后等待答案即可,或者说只需要“教”它一次,后续就不用再自己动手了。
图源:雷科技
有意思的是,小雷在翻看智能体相关新闻的时候,看到不少同行说智能体将颠覆应用生态,让“应用不再存在”。说实话这种论调有点不切实际,你不可能让智能体每次执行任务时都现编一个应用,不仅耗费大量算力,而且效果肯定不如已经稳定运行多年的老应用,智能体其实只是省去人工操作的过程罢了。
与其想着让智能体取代所有应用,倒不如考虑下智能体兼容所有应用,取代操作系统,后者的可能性反而更大。而在小雷看来,随着智能体的进一步发展,必然会有更多的企业入场,并推动智能体向操作系统发展,因为本质上就是用户让渡高级权限,换取更多的自主性。
在这个前提下,将智能体直接做成系统就是最简单的,它本身就拥有最高权限,同时又可以从底层设计开始解决各种安全问题。我想这也是为什么Peter Steinberger最终选择加入OpenAI而非其他企业的原因,OpenAI此前就宣布正在推动AI操作系统的研发,两者的想法或许刚好不谋而合了。
当智能体变成操作系统,我们或许将真正的“解放双手”,只需要简单的指令就可以得到想要的结果。不过,我们真的要让AI完全掌管我们的一切吗?这个问题,或许更值得深思。
本文来自“雷科技”,36氪经授权发布。