Physical AI元年：“世界怎么运转”背后的万亿美元豪赌

如果说 2024 年是大语言模型的扩张期，2025 年是 Agent 的落地探索期，那么 2026 年，硅谷的核心叙事正在转向一个更底层的问题：AI 能否真正理解“世界如何运转”，并在现实中完成任务？

2026 年 3 月，由图灵奖得主、曾任 Meta 首席 AI 科学家的 Yann LeCun 牵头创立的 AMI Labs 宣布完成 10.3 亿美元种子轮融资。

几乎在同一时间：

Fei-Fei Li 创立的 World Labs 完成新一轮约 10 亿美元融资
Google DeepMind 发布 Genie 3 世界模型
Tesla 持续推进 Optimus 人形机器人在工厂中的部署

这些事件并非孤立发生，而是共同指向一个更加清晰的趋势：AI 正在从“理解数字世界”走向“理解并作用于物理世界”。

这并不只是一个技术方向的变化，更意味着产业价值链正在被重新改写。过去两年，AI 竞争的主战场主要集中在模型、算力与数据中心等少数几个高门槛环节；而当 AI 开始真正进入物理世界，竞争就不再只发生在模型层，而是同步扩展到硬件本体、系统集成、数据采集、仿真环境、供应链协同与真实场景落地。换句话说，Physical AI 带来的不是单点突破，而是一整套基础设施体系的重构。

也正因为如此，这一轮变化对中文世界，尤其是华人创业者、工程师与投资人而言，可能不仅是一波新的技术热潮，更是一个少见的结构性机会窗口。与上一轮主要由大模型训练资源和超级资本主导的竞赛不同，Physical AI 天然更依赖复合能力：既要理解算法，也要懂工程；既要能做系统协同，也要能进入制造、供应链和产业场景深处。那些兼具技术深度、硬件协同能力与中美产业视野的团队，反而更有机会在这场新周期中占据关键位置。

换句话说，Physical AI 不只是硅谷在讲的新故事，它也可能是华人在下一轮全球技术基础设施变局中，最值得重视的一张入场券。

01 两条路线的世纪之争：LLM 派 vs. 世界模型派

过去三年，大语言模型（LLM）几乎主导了 AI 的发展路径，其核心范式是基于海量文本数据进行 next-token prediction（下一个词预测）。但这一范式的边界也在逐渐显现：它可以“描述”物理世界，却不具备可执行的理解；缺乏对因果关系与物理约束的建模能力；在连续决策和长期任务中也表现有限。

因此，以 Yann LeCun 为代表的一派开始推动另一条路径：World Model（世界模型）——预测“状态”，而非“文本”。两者的核心差异在于，LLM 以文本为学习对象、以语言为输出形式，本质停留在“认知与表达”；而世界模型则以物理世界状态为建模对象，直接指向“感知—决策—执行”的能力闭环。

这并非 LeCun 一个人的判断。2026 年 Q1，世界模型方向几乎在同一时间迎来几项关键进展：AMI Labs 以 JEPA 为核心架构，明确押注“先研究、后产品”的长期路线；World Labs 从“空间智能”切入，试图让 AI 真正理解三维世界中的关系、遮挡与物理约束；Google DeepMind 则通过 Genie 3 推动可实时交互的动态环境生成，并将其用于智能体训练。

三家公司路径不同，但指向的是同一个趋势：AI 的下一次跃迁，不只是生成更好的文本，而是更准确地建模世界，并在其中完成行动。

02 硬件战争：谁在造“身体”？

世界模型解决的是“大脑”问题——AI 如何理解物理世界。但 Physical AI 的另一半战场同样激烈：谁来造“身体”？

2026 年的人形机器人赛道，已经从“实验室 demo”全面进入“工厂量产”阶段。几个关键数字：

Tesla Optimus Gen 3：超过 1000 台已部署在 Gigafactory Texas 和 Fremont 工厂，执行零件处理和装配任务。这是人类历史上规模最大的人形机器人工厂部署。Tesla 正在 Giga Texas 建设年产能 1000 万台的专用工厂，目标单台成本压至 2 万美元——两年前行业均价还在 5-25 万美元。

Boston Dynamics Atlas：CES 2026 上的产品版 Atlas，身高 6.2 英尺，56 个自由度，可举起 110 磅重物。更值得关注的是它的“灵魂”——Boston Dynamics 宣布与 Google DeepMind 合作，将前沿基础模型集成到 Atlas 中。2026 年全年产能已被 Hyundai 和 Google DeepMind 预定，30000 台/年的工厂正在规划中。

Figure 03：Figure AI 以 390 亿美元估值融了 10 亿美元，其 Figure 02 在 BMW Spartanburg 工厂的 11 个月试运行中，参与了超过 30000 辆 BMW X3 的生产，移动了 9 万多个零件，累计运行 1250 小时。Figure 03 在此基础上全面升级，配备 48+ 自由度和专有 Helix AI 平台。

Mind Robotics：3 月刚宣布 5 亿美元融资，专注工业规模的 AI 机器人部署。

但在这场硬件竞赛中，一个被低估的环节正在浮出水面：灵巧手（Dexterous Hand）。

人形机器人的腿解决了移动问题，躯干解决了承载问题，但真正决定机器人能否在复杂环境中干活的，是手。以 Tesla Optimus 为例，手部成本占整机的 17%，约 9500 美元——是最昂贵的单一组件。

灵巧手之所以难，在于一个根本性矛盾：手指空间太小，放不下大电机；小电机力矩不够，就需要高减速比齿轮箱来放大力量；而高减速比齿轮箱会带来惯性失真、力反馈丧失和机械磨损——这三个问题会从物理层面“毒化”AI 的学习过程。

一批新公司正在尝试突破这个瓶颈。有的采用轴向磁通电机架构将减速比从 288:1 压缩至 15:1，实现完全可反向驱动的灵巧手；有的通过同步设计数据采集手套，让人类操作数据可以零损耗迁移到机器人硬件上。这些看似小的硬件创新，可能是整个 Physical AI 生态中最关键的基础设施之一。

03 NVIDIA：Physical AI 时代的“卖铲人”

每一次技术浪潮，都会出现一个“卖铲人”。

在大模型时代，NVIDIA 凭借 GPU 与 CUDA 生态成为最大受益者；而在 Physical AI 时代，其角色正在进一步升级——不只是提供算力，而是试图构建一整套机器人时代的基础设施。

在 2026 年 3 月的 GTC 大会上，NVIDIA 发布了一整套围绕 Physical AI 的平台能力：包括面向人形机器人的视觉-语言-动作模型 Isaac GR00T、用于生成大规模合成数据的 Cosmos 系列，以及覆盖训练、评估与部署的工具链（如 Isaac Lab 与 OSMO）。这些能力并非单点工具，而是逐步形成一套完整的开发与运行体系。

包括 Boston Dynamics、Caterpillar、Franka Robotics、LG、NEURA Robotics 等在内的多家机器人公司，已经在 NVIDIA 平台上构建下一代系统。

其策略也非常清晰：

不直接参与终端产品，而是成为整个行业的底层标准。

如果说 Physical AI 是一座正在建造的城市，那么 NVIDIA 正在同时提供水泥、钢筋与电网。

04 数据：Physical AI 最稀缺的“石油”

在大语言模型的世界里，互联网提供了几乎无限的文本数据。但在 Physical AI 中，一个更根本的问题浮现出来：

真实世界的操控数据极其稀缺。

这使得数据，成为整个产业链中最关键、也是最稀缺的资源之一。

目前，行业主要探索三条路径。

真实数据路线。以 Physical Intelligence 为代表，其 π0 模型基于超过 1 万小时的真实机器人操作数据训练，覆盖多种机器人形态与任务类型，能够完成复杂操作（如叠衣服、组装纸箱等）。其开源行为，本质上为行业提供了一套“操控预训练基座”。

合成数据路线。Google DeepMind 的 Genie 3 与 NVIDIA 的 Cosmos，尝试通过世界模型生成大量模拟环境，在虚拟世界中完成训练，再迁移到真实世界。这一路径的核心挑战在于 sim-to-real gap，但随着模拟精度的提升，这一差距正在逐步缩小。

人类遥操作路线。通过数据采集手套等设备，将人类操作直接映射到机器人系统中。这种方式数据质量最高，但在成本与规模化能力上仍存在限制。

Tesla 则在尝试一条混合路径：通过工厂视频持续采集人类操作行为，并用于训练 Optimus 的动作能力。

长期来看，Physical AI 的竞争格局，很可能不取决于谁的模型最优，而取决于谁拥有最多、最高质量的物理世界交互数据。一旦数据飞轮开始运转，其壁垒将呈指数级增强。

05┃ 钱在说什么：一张 2026 Q1 Physical AI 融资全景图

数字不会骗人。以下是 2026 年第一季度 Physical AI 领域的关键融资事件：

【世界模型层】

· AMI Labs（LeCun）— $10.3 亿种子轮，估值 $35 亿

· World Labs（李飞飞）— $10 亿新一轮，Autodesk 投 $2 亿

【基础模型层】

· Physical Intelligence — 正在谈判 $10 亿新一轮，估值将超 $110 亿

· RLWRLD — $4100 万种子轮扩展

【人形机器人整机】

· Figure AI — 此前以 $390 亿估值融 $10 亿（2025）

· Mind Robotics — $5 亿，工业规模部署

· Galaxea — $4.34 亿，Series B 独角兽

· Humanoid — $2.9 亿种子轮，直接独角兽

· Generative Bionics — €7000 万种子轮

【基础设施与工具】

· NVIDIA — 持续投入 Isaac GR00T / Cosmos 平台

· RoboForce — $5200 万，Physical AI 劳动力平台

仅上述公开数据，Q1 已超过 64 亿美元。而这还不包括 Tesla、Hyundai/Boston Dynamics、Google DeepMind 等大厂的内部投入。

资本的流向说明一件事：Physical AI 已经越过了“概念验证”的阶段，进入了“基础设施建设”的阶段。投资人不再问“机器人能不能用”，而是在问“谁的基础设施能让机器人最快规模化”。

06 冷思考：泡沫还是拐点？

当然，硅谷从不缺泡沫。面对 Physical AI 的狂热，几个冷静的问题值得思考：

Demo ≠ 部署。正如业内人士在达沃斯 2026 上的共识：一个精彩的 demo 和一个能连续运行 10000 次不出错的系统之间的鸿沟，比宣传暗示的要大得多。Figure 02 在 BMW 工厂确实参与了 30000 辆车的生产，但它执行的是相对标准化的零件搬运，而非灵巧装配。

Sim-to-real 依然是硬骨头。世界模型的保真度在提升，但物理世界的长尾复杂性——光照变化、材料差异、非预期碰撞——仍然是合成数据路线的最大挑战。

商业模式尚未跑通。LeCun 自己说 AMI Labs 第一年只做研究。World Labs 在尝试免费+付费模式。Physical Intelligence 开源了核心模型。目前这些公司的收入几乎为零，资本赌的是 3-5 年后的范式垄断。

安全与监管的灰犀牛。当成千上万台具备自主决策能力的机器人进入工厂甚至家庭，谁为事故负责？目前全球对 Physical AI 的监管框架几乎一片空白。

但恰恰这些问题正说明，我们正处于技术拐点的早期，而非泡沫的顶部。每一项真正的范式转换——互联网、智能手机、云计算——在早期都伴随着“Demo 远好于产品”的阶段。关键的区别在于：底层技术是否在真正进步，而不只是 PPT 在进步。

从 LeCun 的 JEPA 架构、到 Genie 3 的实时世界生成、到 π0 的 68 任务泛化能力、到 Optimus 1000 台级别的工厂部署——2026 年 Q1 的进展是实打实的工程突破，不是空中楼阁。

07 Physical AI 不是一个独立赛道，它是 AI 的最终形态。

Physical AI 不是一个新赛道，它更像是 AI 的终局形态之一。

当 AI 从“理解世界”走向“进入世界”，真正被重写的不只是模型能力边界，也是产业分工与价值分配方式。未来的竞争，不会只发生在模型参数和算力集群里，也会发生在机器人本体、灵巧手、数据采集、仿真系统、产业场景和供应链组织能力上。

这也是为什么，这一轮对华人尤其重要。

因为华人在过去二十年里，最深的积累之一，从来不是单一维度的技术标签，而是把前沿技术、工程执行、硬件制造和跨区域产业协同真正串起来的能力。无论是创业者、工程师，还是投资人与产业资源组织者，只要能够抓住这一轮从数字智能走向物理智能的迁移，就有机会不只是参与趋势，而是在某些关键层上，成为趋势本身的一部分。

2026 年，Physical AI 也许还远未成熟；但正因为它还在早期，窗口才刚刚打开。对华人来说，这可能不是又一轮“跟随式参与”的周期，而是一轮更有机会向基础设施层、平台层和关键组件层深度切入的新起点。

本文来自微信公众号 “硅兔君”（ID：gh_1faae33d0655），作者：硅兔君，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。