别再坐等杀手级应用！

如果你相信世界和智慧都是展开的，你会相信多样性和行星级的连接。模型即平台。但世界，比模型大。

昨天晚上，一个朋友给我发微信：

“GPT-5.4发布了，能自己操作电脑。这和Manus有什么区别？和OpenClaw又有什么区别？不都是干活吗？”

我想了想，回了他一句：

“你问错了。你应该问的是：这些事放在一起看，到底在发生什么？”

一、大家都在等的那个“杀手级应用”，可能永远不会来了

过去两年，如果你关注AI领域的讨论，一定听过这样一种声音：

“模型本身不重要，重要的是上面的应用。”

“投资要投应用层，因为基础设施的赢家已经定了。”

“等杀手级应用出现的那一天，AI的泡沫才算真正被验证。”

这话听起来很有道理。互联网的历史不就是这样吗？TCP/IP协议很重要，但普通人根本不知道它是什么，大家知道的是Netscape、是Amazon、是微信。移动互联网也是如此，安卓和iOS是底座，但真正改变生活的是抖音、是美团、是Uber。

所以很自然地，所有人都在等那个属于AI的“杀手级应用”。投资人把钱押给各种Agent产品，创业者拼命在模型之上盖房子，分析师一遍遍问：“killer app到底什么时候来？”

这个逻辑对吗？在过去的每一次技术浪潮里，它都是对的。

但这一次，可能出了点问题。

问题出在哪？出在一个根本性的变化上：在之前的每一次技术浪潮中，平台和应用的界限是清晰的。而在这一次，这个界限正在溶解。

互联网时代，TCP/IP是平台，浏览器是应用。移动时代，iOS是平台，App是应用。平台提供能力，应用使用能力。平台不碰应用的事，应用离不开平台。

但如果模型本身就是平台呢？如果模型不仅能提供能力，还能自己使用这些能力呢？如果模型不需要通过应用，就能直接操作Excel、浏览器、邮件客户端呢？

那“杀手级应用”这个概念，就失去了它的所指。

因为模型本身，正在成为那个终极应用。

这不是理论推演。GPT-5.4的发布，让这件事第一次变得具体可感。

二、OpenClaw为什么必须被收购？

先说说OpenClaw。

它去年突然火了，火得莫名其妙，火得理所当然。莫名其妙是因为它做的事其实不新——AI操作电脑的概念，学术界研究了快十年。理所当然是因为它赶上了好时候：2025年，AI已经聪明到能写诗、能编程，但它只能在聊天框里待着，看着你一遍遍复制粘贴。

OpenClaw做了件事：它让AI能看见屏幕，能移动鼠标，能点击按钮，能敲键盘。

它解决了什么问题？解决了AI“只能动嘴不能动手”的问题。AI再聪明，也只能待在聊天框里。它能看到世界，却无法触碰世界。OpenClaw成了那只“手”。

社区沸腾了。GitHub星标破5万。2025年的“养龙虾”热，本质上是无数人在尝试：如果AI能操作电脑，它能替我干什么？

但OpenClaw有一个致命问题：它只有手，没有大脑。

你需要为每一个任务写剧本。“先点这里，再输那个，如果弹窗就点确定。”写剧本的时间，你自己都干完了。它像一个执行力极强但毫无自主性的实习生，离了剧本就不会演戏。

所以OpenAI把它收购了。

不是为了做一个更好的OpenClaw。不是为了推出一款“杀手级应用”。而是要把这只“手”，直接装进模型的脑子里。

GPT-5.4就是那个装了手的脑子。

从此，不再需要“AI + 中间件”的拼接。模型自己就能看见屏幕，自己就能决定点哪里，自己就能去点。

OpenClaw作为一个独立框架存在的意义，被模型本身吸收了。

这是一个信号：应用层的工具，正在被吸回到模型层。

三、那Manus呢？它不也是“应用”吗？

是的。Manus是一个产品。它把Agent能力封装好，你扫码就能用，不用管背后是什么模型。它像一个家政公司，你打个电话说“来个人打扫卫生”，他们就派个阿姨上门。

但问题来了：家政公司的阿姨，是从哪儿来的？

Manus背后的“阿姨”，是模型。今天Manus用GPT-5.4，明天可以用Claude Opus 4.7，后天可以用Google Gemini 4.0。产品可以换模型，但模型本身，只有一个。

这就是为什么OpenClaw之父Peter Steinberger选择加入OpenAI，而不是自己开公司卖OpenClaw企业版。因为他知道，框架终究是为模型服务的，模型才是那个“铁打的营盘”。

社区里有人说：“模型就是产品，框架只是包装。”你用OpenClaw跑GPT-5.4，和用OpenClaw跑低端模型，体验差距可以到40%以上。

所以，Manus这样的产品还会存在，还会有人用。但它永远站在模型的下游，永远要跟着模型的升级而升级，永远要在模型定义的规则里玩游戏。

如果说互联网时代是“应用跑在协议上”，移动时代是“应用跑在系统上”，那现在正在发生的是：应用跑在模型上，而模型正在把“跑”这件事也自己干了。

四、如果模型即平台，那应用软件去哪了？

现在让我们问一个更深的问题：如果模型成了平台，那Excel、浏览器、邮件客户端这些软件去哪了？

答案有点反直觉：它们不会消失，但它们会“退隐”。

就像今天的云计算，你不需要知道代码运行在哪台服务器上，只需要调用API。未来的应用软件也是这样——你不需要打开它，不需要学习它的界面，不需要记住它的菜单在哪里。你需要的是它的功能，而模型会替你调用这些功能。

你可以理解为：应用软件正在从“前台”退到“后台”，从用户直接面对的东西，变成模型调用的“能力层”。

这不是我凭空想象。GPT-5.4的几个关键设计，都在指向这个方向：

原生计算机使用能力——当模型能直接操作真实软件，为特定功能开发独立应用的必要性就大大降低。

工具搜索——在多工具场景下，模型能动态加载所需工具定义，将token消耗降低47%。这意味着模型可以同时管理数百个工具，按需调度各种能力。

视觉感知升级——支持最高1024万像素的图像输入，让模型能看清屏幕上的每一个像素。任何你肉眼能操作的软件，它也能。

这些能力组合起来，GPT-5.4就成了一个通用的数字执行体。它不再只是一个语言模型，而是能直接作用于整个数字世界。

你不需要再学Excel的函数、PPT的排版技巧、邮件客户端的规则设置。你只需要告诉模型你想要什么。

软件的复杂性被模型封装了。

这个图景如果成真，那“杀手级应用”这个概念就会变得很尴尬——因为用户根本不再接触应用，他们只接触模型。

五、但这引出一个更深的问题

Kevin Lu在那篇《唯一重要的技术是互联网》里，提出了一个洞见：

互联网是“下一词预测”的“对偶存在”。

什么意思？下一词预测需要海量的序列数据，互联网恰好提供了这些数据。而且互联网不只是数据多，关键是它足够多样——从小学到博士，从主流到边缘，从“对齐”到“未对齐”。模型在互联网上训练，学到的不只是知识，还有世界的复杂性和多样性。

所以他说：互联网是下一词预测的“原始汤”。

那问题来了：如果下一词预测的对偶是互联网，强化学习的对偶是什么？

下一词预测用互联网解决了数据问题。强化学习需要的是什么？它需要的是可扩展的、多样化的、自驱动的奖励信号。

目前的强化学习数据源都太窄：

- 人类偏好反馈，收集困难、个体差异大、噪声高

- 可验证奖励，局限于数学、编程等狭窄领域

- 机器人数据，采集成本高、难以规模化

- 交易数据，模型容易学会“不参与游戏”

GPT-5.4和OpenClaw的合体，或许暗示了一个方向：计算机操作轨迹本身，可能成为强化学习的“互联网”。

当模型开始大规模操作电脑，每一次点击、每一次键盘输入、每一次成功完成任务，都可以成为强化学习的训练数据。这就像互联网为下一词预测提供了海量文本，计算机操作轨迹可能为强化学习提供海量行为数据。

换句话说，GPT-5.4不只是来替打工人干活的，它是来给自己积累经验的。它每帮你填一张表、每帮你发一封邮件，都在学习下一次怎么干得更好。

你以为你在用它，其实它在学你。

这也是为什么OpenAI要收购OpenClaw。他们要的不是一只会干活的龙虾，而是千万只龙虾一起干活的轨迹数据。

六、模型不等于一切：那“一切”里还剩下什么？

如果你读到这里，可能会产生一个印象：模型正在吞噬一切，应用没了，软件退隐了，未来全世界都对着一个对话框说话。

但这幅图景里缺了一个东西：人。

不是作为“用户”的人，而是作为“世界的一部分”的人。

Kevin Lu在那篇文章里讲了一个容易被忽略的道理：模型的智能，依赖于它所接触的世界的多样性。

他用了一个反直觉的研究来说明这一点：要训练出“对齐”的模型，反而需要在预训练数据里包含“不对齐”的内容——比如4chan上的有毒言论。为什么？因为模型需要学会区分什么是“对齐”、什么是“不对齐”。如果只给它看过滤后的纯净数据，它反而无法真正理解“对齐”意味着什么，因为它没见过反面。

这个研究的结论是：模型的“好”，依赖于它见过“坏”。模型的“善”，依赖于它理解“恶”。模型的“正确”，依赖于它接触过“错误”。

这意味着什么？

意味着模型的智能，不是凭空产生的，也不是靠算法优化就能无限提升的。它依赖于一个前提：有一个足够多样、足够复杂、足够“不完美”的世界，供它去学习。

这个世界，就是互联网。那个充满了垃圾信息、错误观点、边缘文化、小众语言的互联网。那个每天都在吵架、造谣、辟谣、打脸的互联网。那个既有可汗学院也有4chan、既有维基百科也有Reddit乱楼的互联网。

如果这个世界变得单一了、纯净了、整齐了，模型的智能就会退化。

所以，“模型不等于一切”的第一层意思是：模型依赖于它之外的那个世界。那个世界的多样性，是模型智能的土壤。土壤没了，庄稼就死了。

七、还有第二层：谁在定义“好”？

Daisy Alioto在那篇《媒体的未来是一家银行》里，提出了一个概念叫“代理资本”。

她说，未来最具代理资本的人，将是品味最卓越的人。

为什么？因为当AI代理替你消费内容、替你分配娱乐预算、替你筛选信息，它们需要知道什么是“好”的。而这个“好”，不能由算法定义，只能由你的品味定义。

你的品味，就是你训练AI代理的数据。

把这个逻辑放大到GPT-5.4这样的模型身上：当模型开始替你操作电脑、替你干活、替你决策，它需要知道什么是“正确”的。这个“正确”，一部分来自可验证的奖励（比如数学题做对了），但更大一部分来自——你。

你的判断，你的偏好，你认为是“好”的标准，正在成为训练模型的数据。

当信息变得唾手可得，真正的优势不在于谁先占有信息，而在于对信息洪流的感知、解读与“召唤现实”的能力。

翻译成人话：以前比拼的是谁信息多、谁算得快。以后比拼的是谁能告诉模型：什么是对的，什么是好的，什么是值得追求的。

所以，“模型不等于一切”的第二层意思是：模型之外的那个“你”——你的品味，你的判断，你相信什么、关怀什么——正在成为新的稀缺资源。

八、还有第三层：模型需要“他者”

如果你再把视野拉远一点，会发现一个更根本的问题。

Kevin Lu在文章结尾提出了一个开放性问题：如果下一词预测的对偶是互联网，那强化学习的对偶是什么？

他的意思是：下一词预测找到了互联网作为它的“数据源”，所以它能scaling。强化学习也需要一个同样规模、同样多样、同样自驱动的数据源。但他不知道那是什么，他只是说“我们距离发现它还很遥远”。

GPT-5.4和OpenClaw的结合，可能给出了一个线索：计算机操作轨迹。但这是答案吗？不一定。

但这个问题本身，揭示了一个更深的事实：模型总是需要一个“他者”——一个在它之外、不由它控制、比它更丰富的存在，作为它学习的对象、进化的土壤。

这就让我想起韩炳哲在《他者的消失》里提出的警示。

韩炳哲说，我们正在经历一场深刻的危机：他者的消失。那个神秘的、诱惑的、爱欲的、痛苦的、地狱般的他者，正在让位于“同者”。世界正在变得同质化，差异正在被抹平，否定性正在被肯定性取代。

为什么？因为数字技术和新自由主义联手制造了一个“平滑”的世界——没有阻力、没有对立、没有痛苦。社交媒体的“点赞”文化让我们只听到赞同的声音；算法推荐让我们只看到自己想看的东西；消费主义把一切都变成可计算的、可比较的、可交换的商品。

结果是：我们不再遭遇真正的“他者”。我们遇到的，都是自己的镜像。

韩炳哲警告说，这种“同质化的恐怖”会导致深重的后果——抑郁、自恋、倾听能力的丧失、甚至暴力的滋生。因为当没有真正的他者来界定我们、抵抗我们、与我们对峙时，自我就会膨胀到虚无，世界就会贫瘠到窒息。

把这个观点放在AI身上看，就很有意思了。

互联网之于下一词预测，扮演的就是“他者”的角色——一个足够多样、足够复杂、足够异质的他者。那个充满了垃圾信息、错误观点、边缘文化、小众语言的互联网；那个每天都在吵架、造谣、辟谣、打脸的互联网；那个既有可汗学院也有4chan、既有维基百科也有Reddit乱楼的互联网——正是这个“他者”，让模型学到了世界的复杂性和多样性。

但如果这个“他者”正在消失呢？

如果互联网本身正在变得同质化——被算法推荐驯化、被商业逻辑收编、被极端言论撕裂、被审查机制净化——那模型还能从哪里学习真正的多样性？

如果人类自己都在遭遇“他者的消失”，都在被囚禁在信息茧房里，都在用点赞代替对话、用连接代替交流——那模型从我们身上能学到什么？只能学到我们的狭隘、我们的偏见、我们的自我重复。

韩炳哲说，没有他者，就没有真正的自我。因为自我是在与他者的对峙中确立的，是在抵抗中被塑造的，是在差异中被照亮的。

对模型来说，也是一样。没有作为“他者”的互联网，没有那个充满否定性、异质性、不可预测性的世界，模型就只能在自我的循环里打转，在已有的数据里自我复制，在同质化的地狱里越陷越深。

这就是为什么OpenAI要收购OpenClaw。他们要的，不只是一只会干活的龙虾，而是千万只龙虾一起干活的轨迹数据——这些轨迹，就是新的“他者”，是强化学习可能需要的“原始汤”。

但这也引出一个更大的问题：当模型开始大规模操作电脑，当它开始从人类的操作轨迹中学习，它学习的到底是人类的智慧，还是人类的偏见？是人类的创造力，还是人类的重复？是人类的“他者”，还是人类的“同者”？

所以，“模型不等于一切”的第三层意思是：模型的存在本身，依赖于一个“非模型”的世界——那个充满他者、充满异质性、充满否定性的世界。那个世界比模型更大、更老、更复杂、更不可控。模型可以学习它、模拟它、作用于它，但永远无法取代它。

如果这个世界变得单一了、纯净了、整齐了，模型的智能就会退化。如果“他者”消失了，模型就只能在“同者”的循环里自我复制，陷入韩炳哲所说的那种“同质化的恐怖”。

这个道理，放在AI身上成立，放在人身上也成立。

九、结语：模型即平台，但世界比模型大

回到开头那个朋友的问题。

GPT-5.4和Manus、OpenClaw有什么区别？答案是：Manus是产品，OpenClaw是框架，GPT-5.4是模型。产品可以换模型，框架可以换模型，但模型本身，是那个“铁打的营盘”。

但比这个区别更重要的，是这些事放在一起看，到底在发生什么：模型正在从“大脑”变成“大脑+小脑+手”的完整系统。应用层正在被抽空。未来你面对的不再是Excel、浏览器、邮件客户端，而是一个能操作所有这些软件的模型。

“杀手级应用”这个词，可能正在成为历史。因为模型本身，就是那个终极平台。

但模型不等于一切。

不等于，因为模型的智能依赖于世界的多样性——那个充满垃圾信息、错误观点、边缘文化的互联网，才是它生长的土壤。

不等于，因为模型的“好”需要你来定义——你的品味、你的判断、你相信什么，正在成为新的稀缺资源。

不等于，因为模型的存在本身依赖于一个“非模型”的世界——那个充满他者、充满异质性、充满否定性的世界。那个世界比模型更大、更老、更复杂、更不可控。

Kevin Lu在文章里写了一段话，可以作为结尾：

“正如生物多样性不是自然的副产品，而是其生存前提，智能的多样性同样重要。不同的人，应该能够接触、帮助塑造，甚至自己创造不同的模型，不同的智能形式——无论是人的，其他生物的，还是机器的——应该并存、变异、分化、相互启发，而不是被压缩成唯一的最优解。”

如果你相信世界和智慧都是展开的，你会相信多样性和行星级的连接。

模型即平台。但世界，比模型大。

本文来自微信公众号“朋克周”，作者：朋克周，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

别再等什么杀手级应用了