大厂疯抢世界模型原因揭秘：四大商业场景与三大社会影响

讲讲世界模型可能有什么用

之前IT 桔子对国内做世界模型的创业公司、大企业分别做了梳理和盘点。有不少人对这个新的概念、新的事物感兴趣。

这篇我们聊下世界模型——它有什么用？

为什么国内外大厂都在投入研发、为什么资本对世界模型创业公司投入重金？

世界模型不是又一款聊天机器人，也不是又一个生成图片的工具。它想让 AI 从“见过类似的”进化到“理解世界怎么运转”，从而在汽车、机器人、内容、工业仿真等领域引发连锁反应。

更深远的影响在于，它可能让 AI 从“只会说的工具”变成“能行动的行动者”，改写劳动力市场、数据产业，甚至人类对真实与虚拟的认知边界。

一、一句话定位：它想让 AI 从“见过”变成“懂了”

过去几年，AI 最擅长的事情是模式匹配。

给它看一万张猫的照片，它就能识别猫；给它读一万亿个词，它就能写诗、写代码、写报告。但你要是问它“玻璃杯从桌上掉下去会怎样”，它大概率会犹豫。

因为它见过很多掉杯子的画面，却没有真正理解重力、惯性和玻璃易碎之间的物理关系。

世界模型要解决的，就是这个“似懂非懂”的问题。

它的目标是让机器拥有一个内部的“脑内沙盘”，在不真正行动的情况下，预测行动的后果。

自动驾驶可以在这个沙盘里预演暴雨天的紧急避让；机器人可以在里面摔上十万次再出门；科学家可以在里面做上千次虚拟实验，再挑出最有希望的方向去真实世界验证。

这个能力看起来只是认知层面的升级，但它会沿着商业链条一路传导，最终影响人类社会的运行方式。

二、商业层面：四条赛道正在被改写

1 自动驾驶：从“路上跑一亿公里”到“脑子里开几亿公里”

自动驾驶行业最大的瓶颈，从来不是算法写得不够好，而是数据太贵、太稀、太慢。

你可以让测试车队在真实道路上跑一亿公里，但大部分里程都是无趣的高速巡航。

真正值钱的是极端特殊瞬间：暴雨中突然窜出的行人、前车爆胎飞来的碎片、施工路段混乱的标线、夜间对面车道的远光灯。

这些场景你等一年可能都碰不到几次。

世界模型的价值，就是可以在虚拟世界里无限生成这些极端场景。

小鹏宣称其世界模型支撑的仿真测试每天等效跑 3000 万公里，地平线能让模型在 30 秒内生成一条可控的驾驶视频。这意味着自动驾驶的研发方式正在从“遇到什么问题再修什么 Bug”，变成“想要什么场景就生成什么场景”。

商业影响很直接：谁的世界模型更好，谁的自动驾驶迭代就更快，谁就更先拿到量产订单和监管信任。

未来车企之间的竞争，会从谁的激光雷达更多变成谁的世界模型更会“做梦”。

2 机器人：从“每个动作都要人教”到“自己摔够了再出门”

今天的工业机器人看起来很酷，但每一个动作背后往往都有一群工程师在反复调参数。

人形机器人要走进工厂、仓库、家庭，不可能每换一个场景就重新写一遍程序。

它需要一个“脑内训练场”，在仿真里试错千万次，学会抓取、行走、避障、协作，再到现实中微调。

世界模型就是那个训练场。

宝马已经用 NVIDIA Omniverse 在虚拟工厂里训练装配机器人，把误差控制在毫米级。国内宇树、智元等人形机器人公司也在跟进。数据显示，工业机器人使用世界模型辅助训练的比例已经超过 60%。

商业上这意味着机器人的部署成本可能断崖式下降。

今天一条工业机器人产线的调试周期可能是 3 到 6 个月，世界模型成熟后可能缩短到几周。服务机器人走进家庭的时间表，也可能因此提前 5 到 10 年。

3 内容产业：从“拍一部电影花两亿”到“打字生成一个世界”

这一条离普通人最近。

Sora、Genie 3 已经展示了雏形：输入一段文字，就能生成可探索的 3D 世界。

今天还很粗糙，但如果世界模型持续进步，未来的影视制作、游戏开发、虚拟社交、文旅体验都会被改写。

想象一下，你打开一个 App，输入“一个赛博朋克风格的雨夜城市，我是一名私家侦探”，世界模型就为你生成一座可交互的城市。你可以走进去，与 NPC 对话，触发剧情，改变天气，甚至影响城市运转。

这比现在的开放世界游戏更自由，因为世界是实时生成的，不是设计师预设的。短剧、虚拟陪伴、文旅元宇宙，都是同一个技术能力的不同切面。

这个赛道的商业天花板极高。游戏和影视加起来是全球万亿美元级的娱乐市场。

世界模型如果能把内容生产成本降低一个数量级，它会催生新的巨头，也会让现有的内容公司重新洗牌。

4 科学与工业仿真：从“建一个风洞花几个亿”到“在电脑里跑物理实验”

世界模型的底层能力是模拟物理世界的演化。

这个能力不只服务自动驾驶和机器人，它还可以用于科学研究和工业仿真。气候预测、材料设计、药物分子动力学、建筑设计、航空航天——所有需要“在安全环境里反复试错”的领域，都是世界模型的潜在应用。

英伟达 Omniverse 已经在建筑、工程、施工领域落地，让设计团队在虚拟环境里协作和验证。

医疗领域也在探索用世界模型模拟人体生理系统的动态变化，辅助诊断和治疗方案优化。

这个方向现在还很早期，但想象空间巨大。

三、人类社会层面：三个更深远的影响

1 AI 从“工具”变成“行动者”

语言模型让 AI 能说会道，但它只能输出文字和图片，不能直接改变物理世界。世界模型是让 AI 从“会说”到“会做”的桥梁。

当 AI 脑中有了一个世界的模型，它可以预测行动后果，然后真正去行动——控制汽车、操控机器人、管理工厂产线。

这意味着 AI 在人类社会的角色会从“助手”变成“行动者”。你不再只是问 ChatGPT“帮我写个方案”，而是告诉机器人“帮我把这个零件装好”，它自己规划动作、预判风险、执行任务。

这个转变会深刻改变劳动力市场的结构。

重复性体力劳动被自动化替代的速度，可能比我们预想的快得多。

2 “数据”的定义被重写：仿真数据可能比真实数据更值钱

今天 AI 行业的核心资源是真实世界的数据——网页文本、图片、视频、驾驶日志、传感器记录。世界模型成熟后，仿真数据会变成一种新的“矿产”。

你不需要等真实世界发生事故，世界模型可以生成无数个事故场景；不需要真的摔坏一百台机器人，世界模型可以模拟摔一万次。

这会改变数据产业的权力格局。

拥有世界模型的公司，等于拥有了一台“数据印钞机”。谁的世界模型物理一致性最好、生成质量最高，谁就能以最低成本生产训练数据，形成数据飞轮。

这可能是下一轮 AI 军备竞赛的核心战场。

3 “现实”本身的边界开始模糊

当世界模型可以生成足够逼真的 3D 环境，当 AI 可以在虚拟世界里训练出足够强的能力，人类在虚拟世界和真实世界之间花的时间，可能会重新分配。

今天我们已经在手机上花掉了大量时间，未来 VR/AR 加上世界模型，可能让沉浸式虚拟体验成为日常。

这带来两个方向。

往好的方向想，教育、医疗、娱乐的可及性会大幅提升——偏远地区的孩子可以“走进”古罗马，恐惧症患者可以在安全环境里做暴露疗法。

往担忧的方向想，当 AI 可以生成无限逼真的世界，“真实”和“虚假”的界限会更难分辨，深伪、信息操纵、虚拟成瘾等问题会变得更棘手。

社会需要新的治理框架来应对。

四、它现在处在什么阶段

世界模型现在大致相当于 2012 年的深度学习。AlexNet 那一年证明了深度学习能赢 ImageNet，但没人预见到 ChatGPT。今天 Genie 3 和 Cosmos 证明了世界模型能生成可交互的世界，但没人知道 2030 年的“世界模型版 ChatGPT”会长什么样。

可以比较确定的是：语言模型让 AI 进入了信息世界，世界模型会让 AI 进入物理世界。

前者的商业价值已经被验证，后者的商业天花板可能更高。全球 GDP 的绝大部分仍然来自制造、交通、建筑、能源、医疗这些需要“动手”的领域。

所以研究世界模型有什么用？

往近了说，它能让自动驾驶更快落地、让机器人更便宜、让内容生产成本更低。

往远了说，它是 AI 从“屏幕里”走进“现实中”的关键一步。

这一步走完，AI 的影响范围会从互联网行业扩展到几乎所有实体经济领域。

本文来自微信公众号 “IT桔子”（ID：itjuzi521），作者：Judy，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

为什么大厂都在抢世界模型：四个商业场景和三个社会影响

一、一句话定位：它想让 AI 从“见过”变成“懂了”

二、商业层面：四条赛道正在被改写

三、人类社会层面：三个更深远的影响

四、它现在处在什么阶段