别再等什么杀手级应用了
昨天晚上,一个朋友给我发微信:
“GPT-5.4发布了,能自己操作电脑。这和Manus有什么区别?和OpenClaw又有什么区别?不都是干活吗?”
我想了想,回了他一句:
“你问错了。你应该问的是:这些事放在一起看,到底在发生什么?”
一、大家都在等的那个“杀手级应用”,可能永远不会来了
过去两年,如果你关注AI领域的讨论,一定听过这样一种声音:
“模型本身不重要,重要的是上面的应用。”
“投资要投应用层,因为基础设施的赢家已经定了。”
“等杀手级应用出现的那一天,AI的泡沫才算真正被验证。”
这话听起来很有道理。互联网的历史不就是这样吗?TCP/IP协议很重要,但普通人根本不知道它是什么,大家知道的是Netscape、是Amazon、是微信。移动互联网也是如此,安卓和iOS是底座,但真正改变生活的是抖音、是美团、是Uber。
所以很自然地,所有人都在等那个属于AI的“杀手级应用”。投资人把钱押给各种Agent产品,创业者拼命在模型之上盖房子,分析师一遍遍问:“killer app到底什么时候来?”
这个逻辑对吗?在过去的每一次技术浪潮里,它都是对的。
但这一次,可能出了点问题。
问题出在哪?出在一个根本性的变化上:在之前的每一次技术浪潮中,平台和应用的界限是清晰的。而在这一次,这个界限正在溶解。
互联网时代,TCP/IP是平台,浏览器是应用。移动时代,iOS是平台,App是应用。平台提供能力,应用使用能力。平台不碰应用的事,应用离不开平台。
但如果模型本身就是平台呢?如果模型不仅能提供能力,还能自己使用这些能力呢?如果模型不需要通过应用,就能直接操作Excel、浏览器、邮件客户端呢?
那“杀手级应用”这个概念,就失去了它的所指。
因为模型本身,正在成为那个终极应用。
这不是理论推演。GPT-5.4的发布,让这件事第一次变得具体可感。
二、OpenClaw为什么必须被收购?
先说说OpenClaw。
它去年突然火了,火得莫名其妙,火得理所当然。莫名其妙是因为它做的事其实不新——AI操作电脑的概念,学术界研究了快十年。理所当然是因为它赶上了好时候:2025年,AI已经聪明到能写诗、能编程,但它只能在聊天框里待着,看着你一遍遍复制粘贴。
OpenClaw做了件事:它让AI能看见屏幕,能移动鼠标,能点击按钮,能敲键盘。
它解决了什么问题?解决了AI“只能动嘴不能动手”的问题。AI再聪明,也只能待在聊天框里。它能看到世界,却无法触碰世界。OpenClaw成了那只“手”。
社区沸腾了。GitHub星标破5万。2025年的“养龙虾”热,本质上是无数人在尝试:如果AI能操作电脑,它能替我干什么?
但OpenClaw有一个致命问题:它只有手,没有大脑。
你需要为每一个任务写剧本。“先点这里,再输那个,如果弹窗就点确定。”写剧本的时间,你自己都干完了。它像一个执行力极强但毫无自主性的实习生,离了剧本就不会演戏。
所以OpenAI把它收购了。
不是为了做一个更好的OpenClaw。不是为了推出一款“杀手级应用”。而是要把这只“手”,直接装进模型的脑子里。
GPT-5.4就是那个装了手的脑子。
从此,不再需要“AI + 中间件”的拼接。模型自己就能看见屏幕,自己就能决定点哪里,自己就能去点。
OpenClaw作为一个独立框架存在的意义,被模型本身吸收了。
这是一个信号:应用层的工具,正在被吸回到模型层。
三、那Manus呢?它不也是“应用”吗?
是的。Manus是一个产品。它把Agent能力封装好,你扫码就能用,不用管背后是什么模型。它像一个家政公司,你打个电话说“来个人打扫卫生”,他们就派个阿姨上门。
但问题来了:家政公司的阿姨,是从哪儿来的?
Manus背后的“阿姨”,是模型。今天Manus用GPT-5.4,明天可以用Claude Opus 4.7,后天可以用Google Gemini 4.0。产品可以换模型,但模型本身,只有一个。
这就是为什么OpenClaw之父Peter Steinberger选择加入OpenAI,而不是自己开公司卖OpenClaw企业版。因为他知道,框架终究是为模型服务的,模型才是那个“铁打的营盘”。
社区里有人说:“模型就是产品,框架只是包装。”你用OpenClaw跑GPT-5.4,和用OpenClaw跑低端模型,体验差距可以到40%以上。
所以,Manus这样的产品还会存在,还会有人用。但它永远站在模型的下游,永远要跟着模型的升级而升级,永远要在模型定义的规则里玩游戏。
如果说互联网时代是“应用跑在协议上”,移动时代是“应用跑在系统上”,那现在正在发生的是:应用跑在模型上,而模型正在把“跑”这件事也自己干了。
四、如果模型即平台,那应用软件去哪了?
现在让我们问一个更深的问题:如果模型成了平台,那Excel、浏览器、邮件客户端这些软件去哪了?
答案有点反直觉:它们不会消失,但它们会“退隐”。
就像今天的云计算,你不需要知道代码运行在哪台服务器上,只需要调用API。未来的应用软件也是这样——你不需要打开它,不需要学习它的界面,不需要记住它的菜单在哪里。你需要的是它的功能,而模型会替你调用这些功能。
你可以理解为:应用软件正在从“前台”退到“后台”,从用户直接面对的东西,变成模型调用的“能力层”。
这不是我凭空想象。GPT-5.4的几个关键设计,都在指向这个方向:
原生计算机使用能力——当模型能直接操作真实软件,为特定功能开发独立应用的必要性就大大降低。
工具搜索——在多工具场景下,模型能动态加载所需工具定义,将token消耗降低47%。这意味着模型可以同时管理数百个工具,按需调度各种能力。
视觉感知升级——支持最高1024万像素的图像输入,让模型能看清屏幕上的每一个像素。任何你肉眼能操作的软件,它也能。
这些能力组合起来,GPT-5.4就成了一个通用的数字执行体。它不再只是一个语言模型,而是能直接作用于整个数字世界。
你不需要再学Excel的函数、PPT的排版技巧、邮件客户端的规则设置。你只需要告诉模型你想要什么。
软件的复杂性被模型封装了。
这个图景如果成真,那“杀手级应用”这个概念就会变得很尴尬——因为用户根本不再接触应用,他们只接触模型。
五、但这引出一个更深的问题
Kevin Lu在那篇《唯一重要的技术是互联网》里,提出了一个洞见:
互联网是“下一词预测”的“对偶存在”。
什么意思?下一词预测需要海量的序列数据,互联网恰好提供了这些数据。而且互联网不只是数据多,关键是它足够多样——从小学到博士,从主流到边缘,从“对齐”到“未对齐”。模型在互联网上训练,学到的不只是知识,还有世界的复杂性和多样性。
所以他说:互联网是下一词预测的“原始汤”。
那问题来了:如果下一词预测的对偶是互联网,强化学习的对偶是什么?
下一词预测用互联网解决了数据问题。强化学习需要的是什么?它需要的是可扩展的、多样化的、自驱动的奖励信号。
目前的强化学习数据源都太窄:
- 人类偏好反馈,收集困难、个体差异大、噪声高
- 可验证奖励,局限于数学、编程等狭窄领域
- 机器人数据,采集成本高、难以规模化
- 交易数据,模型容易学会“不参与游戏”
GPT-5.4和OpenClaw的合体,或许暗示了一个方向:计算机操作轨迹本身,可能成为强化学习的“互联网”。
当模型开始大规模操作电脑,每一次点击、每一次键盘输入、每一次成功完成任务,都可以成为强化学习的训练数据。这就像互联网为下一词预测提供了海量文本,计算机操作轨迹可能为强化学习提供海量行为数据。
换句话说,GPT-5.4不只是来替打工人干活的,它是来给自己积累经验的。它每帮你填一张表、每帮你发一封邮件,都在学习下一次怎么干得更好。
你以为你在用它,其实它在学你。
这也是为什么OpenAI要收购OpenClaw。他们要的不是一只会干活的龙虾,而是千万只龙虾一起干活的轨迹数据。
六、模型不等于一切:那“一切”里还剩下什么?
如果你读到这里,可能会产生一个印象:模型正在吞噬一切,应用没了,软件退隐了,未来全世界都对着一个对话框说话。
但这幅图景里缺了一个东西:人。
不是作为“用户”的人,而是作为“世界的一部分”的人。
Kevin Lu在那篇文章里讲了一个容易被忽略的道理:模型的智能,依赖于它所接触的世界的多样性。
他用了一个反直觉的研究来说明这一点:要训练出“对齐”的模型,反而需要在预训练数据里包含“不对齐”的内容——比如4chan上的有毒言论。为什么?因为模型需要学会区分什么是“对齐”、什么是“不对齐”。如果只给它看过滤后的纯净数据,它反而无法真正理解“对齐”意味着什么,因为它没见过反面。
这个研究的结论是:模型的“好”,依赖于它见过“坏”。模型的“善”,依赖于它理解“恶”。模型的“正确”,依赖于它接触过“错误”。
这意味着什么?
意味着模型的智能,不是凭空产生的,也不是靠算法优化就能无限提升的。它依赖于一个前提:有一个足够多样、足够复杂、足够“不完美”的世界,供它去学习。
这个世界,就是互联网。那个充满了垃圾信息、错误观点、边缘文化、小众语言的互联网。那个每天都在吵架、造谣、辟谣、打脸的互联网。那个既有可汗学院也有4chan、既有维基百科也有Reddit乱楼的互联网。
如果这个世界变得单一了、纯净了、整齐了,模型的智能就会退化。
所以,“模型不等于一切”的第一层意思是:模型依赖于它之外的那个世界。那个世界的多样性,是模型智能的土壤。土壤没了,庄稼就死了。
七、还有第二层:谁在定义“好”?
Daisy Alioto在那篇《媒体的未来是一家银行》里,提出了一个概念叫“代理资本”。
她说,未来最具代理资本的人,将是品味最卓越的人。
为什么?因为当AI代理替你消费内容、替你分配娱乐预算、替你筛选信息,它们需要知道什么是“好”的。而这个“好”,不能由算法定义,只能由你的品味定义。
你的品味,就是你训练AI代理的数据。
把这个逻辑放大到GPT-5.4这样的模型身上:当模型开始替你操作电脑、替你干活、替你决策,它需要知道什么是“正确”的。这个“正确”,一部分来自可验证的奖励(比如数学题做对了),但更大一部分来自——你。
你的判断,你的偏好,你认为是“好”的标准,正在成为训练模型的数据。
当信息变得唾手可得,真正的优势不在于谁先占有信息,而在于对信息洪流的感知、解读与“召唤现实”的能力。
翻译成人话:以前比拼的是谁信息多、谁算得快。以后比拼的是谁能告诉模型:什么是对的,什么是好的,什么是值得追求的。
所以,“模型不等于一切”的第二层意思是:模型之外的那个“你”——你的品味,你的判断,你相信什么、关怀什么——正在成为新的稀缺资源。
八、还有第三层:模型需要“他者”
如果你再把视野拉远一点,会发现一个更根本的问题。
Kevin Lu在文章结尾提出了一个开放性问题:如果下一词预测的对偶是互联网,那强化学习的对偶是什么?
他的意思是:下一词预测找到了互联网作为它的“数据源”,所以它能scaling。强化学习也需要一个同样规模、同样多样、同样自驱动的数据源。但他不知道那是什么,他只是说“我们距离发现它还很遥远”。
GPT-5.4和OpenClaw的结合,可能给出了一个线索:计算机操作轨迹。但这是答案吗?不一定。
但这个问题本身,揭示了一个更深的事实:模型总是需要一个“他者”——一个在它之外、不由它控制、比它更丰富的存在,作为它学习的对象、进化的土壤。
这就让我想起韩炳哲在《他者的消失》里提出的警示。
韩炳哲说,我们正在经历一场深刻的危机:他者的消失。那个神秘的、诱惑的、爱欲的、痛苦的、地狱般的他者,正在让位于“同者”。世界正在变得同质化,差异正在被抹平,否定性正在被肯定性取代。
为什么?因为数字技术和新自由主义联手制造了一个“平滑”的世界——没有阻力、没有对立、没有痛苦。社交媒体的“点赞”文化让我们只听到赞同的声音;算法推荐让我们只看到自己想看的东西;消费主义把一切都变成可计算的、可比较的、可交换的商品。
结果是:我们不再遭遇真正的“他者”。我们遇到的,都是自己的镜像。
韩炳哲警告说,这种“同质化的恐怖”会导致深重的后果——抑郁、自恋、倾听能力的丧失、甚至暴力的滋生。因为当没有真正的他者来界定我们、抵抗我们、与我们对峙时,自我就会膨胀到虚无,世界就会贫瘠到窒息。
把这个观点放在AI身上看,就很有意思了。
互联网之于下一词预测,扮演的就是“他者”的角色——一个足够多样、足够复杂、足够异质的他者。那个充满了垃圾信息、错误观点、边缘文化、小众语言的互联网;那个每天都在吵架、造谣、辟谣、打脸的互联网;那个既有可汗学院也有4chan、既有维基百科也有Reddit乱楼的互联网——正是这个“他者”,让模型学到了世界的复杂性和多样性。
但如果这个“他者”正在消失呢?
如果互联网本身正在变得同质化——被算法推荐驯化、被商业逻辑收编、被极端言论撕裂、被审查机制净化——那模型还能从哪里学习真正的多样性?
如果人类自己都在遭遇“他者的消失”,都在被囚禁在信息茧房里,都在用点赞代替对话、用连接代替交流——那模型从我们身上能学到什么?只能学到我们的狭隘、我们的偏见、我们的自我重复。
韩炳哲说,没有他者,就没有真正的自我。因为自我是在与他者的对峙中确立的,是在抵抗中被塑造的,是在差异中被照亮的。
对模型来说,也是一样。没有作为“他者”的互联网,没有那个充满否定性、异质性、不可预测性的世界,模型就只能在自我的循环里打转,在已有的数据里自我复制,在同质化的地狱里越陷越深。
这就是为什么OpenAI要收购OpenClaw。他们要的,不只是一只会干活的龙虾,而是千万只龙虾一起干活的轨迹数据——这些轨迹,就是新的“他者”,是强化学习可能需要的“原始汤”。
但这也引出一个更大的问题:当模型开始大规模操作电脑,当它开始从人类的操作轨迹中学习,它学习的到底是人类的智慧,还是人类的偏见?是人类的创造力,还是人类的重复?是人类的“他者”,还是人类的“同者”?
所以,“模型不等于一切”的第三层意思是:模型的存在本身,依赖于一个“非模型”的世界——那个充满他者、充满异质性、充满否定性的世界。那个世界比模型更大、更老、更复杂、更不可控。模型可以学习它、模拟它、作用于它,但永远无法取代它。
如果这个世界变得单一了、纯净了、整齐了,模型的智能就会退化。如果“他者”消失了,模型就只能在“同者”的循环里自我复制,陷入韩炳哲所说的那种“同质化的恐怖”。
这个道理,放在AI身上成立,放在人身上也成立。
九、结语:模型即平台,但世界比模型大
回到开头那个朋友的问题。
GPT-5.4和Manus、OpenClaw有什么区别?答案是:Manus是产品,OpenClaw是框架,GPT-5.4是模型。产品可以换模型,框架可以换模型,但模型本身,是那个“铁打的营盘”。
但比这个区别更重要的,是这些事放在一起看,到底在发生什么:模型正在从“大脑”变成“大脑+小脑+手”的完整系统。应用层正在被抽空。未来你面对的不再是Excel、浏览器、邮件客户端,而是一个能操作所有这些软件的模型。
“杀手级应用”这个词,可能正在成为历史。因为模型本身,就是那个终极平台。
但模型不等于一切。
不等于,因为模型的智能依赖于世界的多样性——那个充满垃圾信息、错误观点、边缘文化的互联网,才是它生长的土壤。
不等于,因为模型的“好”需要你来定义——你的品味、你的判断、你相信什么,正在成为新的稀缺资源。
不等于,因为模型的存在本身依赖于一个“非模型”的世界——那个充满他者、充满异质性、充满否定性的世界。那个世界比模型更大、更老、更复杂、更不可控。
Kevin Lu在文章里写了一段话,可以作为结尾:
“正如生物多样性不是自然的副产品,而是其生存前提,智能的多样性同样重要。不同的人,应该能够接触、帮助塑造,甚至自己创造不同的模型,不同的智能形式——无论是人的,其他生物的,还是机器的——应该并存、变异、分化、相互启发,而不是被压缩成唯一的最优解。”
如果你相信世界和智慧都是展开的,你会相信多样性和行星级的连接。
模型即平台。但世界,比模型大。
本文来自微信公众号“朋克周”,作者:朋克周,36氪经授权发布。