Physical AI 元年:一场关于“世界怎么运转”的万亿美元豪赌
2026 年 3 月,由图灵奖得主、曾任 Meta 首席 AI 科学家的 Yann LeCun 牵头创立的 AMI Labs 宣布完成 10.3 亿美元种子轮融资。
几乎在同一时间:
- Fei-Fei Li 创立的 World Labs 完成新一轮约 10 亿美元融资
- Google DeepMind 发布 Genie 3 世界模型
- Tesla 持续推进 Optimus 人形机器人在工厂中的部署
这些事件并非孤立发生,而是共同指向一个更加清晰的趋势:AI 正在从“理解数字世界”走向“理解并作用于物理世界”。
如果说 2024 年是大语言模型的扩张期,2025 年是 Agent 的落地探索期,那么 2026 年,硅谷的核心叙事正在转向一个更底层的问题:AI 能否真正理解“世界如何运转”,并在现实中完成任务?
这并不只是一个技术方向的变化,更意味着产业价值链正在被重新改写。过去两年,AI 竞争的主战场主要集中在模型、算力与数据中心等少数几个高门槛环节;而当 AI 开始真正进入物理世界,竞争就不再只发生在模型层,而是同步扩展到硬件本体、系统集成、数据采集、仿真环境、供应链协同与真实场景落地。换句话说,Physical AI 带来的不是单点突破,而是一整套基础设施体系的重构。
也正因为如此,这一轮变化对中文世界,尤其是华人创业者、工程师与投资人而言,可能不仅是一波新的技术热潮,更是一个少见的结构性机会窗口。与上一轮主要由大模型训练资源和超级资本主导的竞赛不同,Physical AI 天然更依赖复合能力:既要理解算法,也要懂工程;既要能做系统协同,也要能进入制造、供应链和产业场景深处。那些兼具技术深度、硬件协同能力与中美产业视野的团队,反而更有机会在这场新周期中占据关键位置。
换句话说,Physical AI 不只是硅谷在讲的新故事,它也可能是华人在下一轮全球技术基础设施变局中,最值得重视的一张入场券。
01 两条路线的世纪之争:LLM 派 vs. 世界模型派
过去三年,大语言模型(LLM)几乎主导了 AI 的发展路径,其核心范式是基于海量文本数据进行 next-token prediction(下一个词预测)。但这一范式的边界也在逐渐显现:它可以“描述”物理世界,却不具备可执行的理解;缺乏对因果关系与物理约束的建模能力;在连续决策和长期任务中也表现有限。
因此,以 Yann LeCun 为代表的一派开始推动另一条路径:World Model(世界模型)——预测“状态”,而非“文本”。两者的核心差异在于,LLM 以文本为学习对象、以语言为输出形式,本质停留在“认知与表达”;而世界模型则以物理世界状态为建模对象,直接指向“感知—决策—执行”的能力闭环。
这并非 LeCun 一个人的判断。2026 年 Q1,世界模型方向几乎在同一时间迎来几项关键进展:AMI Labs 以 JEPA 为核心架构,明确押注“先研究、后产品”的长期路线;World Labs 从“空间智能”切入,试图让 AI 真正理解三维世界中的关系、遮挡与物理约束;Google DeepMind 则通过 Genie 3 推动可实时交互的动态环境生成,并将其用于智能体训练。
三家公司路径不同,但指向的是同一个趋势:AI 的下一次跃迁,不只是生成更好的文本,而是更准确地建模世界,并在其中完成行动。
02 硬件战争:谁在造“身体”?
世界模型解决的是“大脑”问题——AI 如何理解物理世界。但 Physical AI 的另一半战场同样激烈:谁来造“身体”?
2026 年的人形机器人赛道,已经从“实验室 demo”全面进入“工厂量产”阶段。几个关键数字:
Tesla Optimus Gen 3:超过 1000 台已部署在 Gigafactory Texas 和 Fremont 工厂,执行零件处理和装配任务。这是人类历史上规模最大的人形机器人工厂部署。Tesla 正在 Giga Texas 建设年产能 1000 万台的专用工厂,目标单台成本压至 2 万美元——两年前行业均价还在 5-25 万美元。
Boston Dynamics Atlas:CES 2026 上的产品版 Atlas,身高 6.2 英尺,56 个自由度,可举起 110 磅重物。更值得关注的是它的“灵魂”——Boston Dynamics 宣布与 Google DeepMind 合作,将前沿基础模型集成到 Atlas 中。2026 年全年产能已被 Hyundai 和 Google DeepMind 预定,30000 台/年的工厂正在规划中。
Figure 03:Figure AI 以 390 亿美元估值融了 10 亿美元,其 Figure 02 在 BMW Spartanburg 工厂的 11 个月试运行中,参与了超过 30000 辆 BMW X3 的生产,移动了 9 万多个零件,累计运行 1250 小时。Figure 03 在此基础上全面升级,配备 48+ 自由度和专有 Helix AI 平台。
Mind Robotics:3 月刚宣布 5 亿美元融资,专注工业规模的 AI 机器人部署。
但在这场硬件竞赛中,一个被低估的环节正在浮出水面:灵巧手(Dexterous Hand)。
人形机器人的腿解决了移动问题,躯干解决了承载问题,但真正决定机器人能否在复杂环境中干活的,是手。以 Tesla Optimus 为例,手部成本占整机的 17%,约 9500 美元——是最昂贵的单一组件。
灵巧手之所以难,在于一个根本性矛盾:手指空间太小,放不下大电机;小电机力矩不够,就需要高减速比齿轮箱来放大力量;而高减速比齿轮箱会带来惯性失真、力反馈丧失和机械磨损——这三个问题会从物理层面“毒化”AI 的学习过程。
一批新公司正在尝试突破这个瓶颈。有的采用轴向磁通电机架构将减速比从 288:1 压缩至 15:1,实现完全可反向驱动的灵巧手;有的通过同步设计数据采集手套,让人类操作数据可以零损耗迁移到机器人硬件上。这些看似小的硬件创新,可能是整个 Physical AI 生态中最关键的基础设施之一。
03 NVIDIA:Physical AI 时代的“卖铲人”
每一次技术浪潮,都会出现一个“卖铲人”。
在大模型时代,NVIDIA 凭借 GPU 与 CUDA 生态成为最大受益者;而在 Physical AI 时代,其角色正在进一步升级——不只是提供算力,而是试图构建一整套机器人时代的基础设施。
在 2026 年 3 月的 GTC 大会上,NVIDIA 发布了一整套围绕 Physical AI 的平台能力:包括面向人形机器人的视觉-语言-动作模型 Isaac GR00T、用于生成大规模合成数据的 Cosmos 系列,以及覆盖训练、评估与部署的工具链(如 Isaac Lab 与 OSMO)。这些能力并非单点工具,而是逐步形成一套完整的开发与运行体系。
包括 Boston Dynamics、Caterpillar、Franka Robotics、LG、NEURA Robotics 等在内的多家机器人公司,已经在 NVIDIA 平台上构建下一代系统。
其策略也非常清晰:
不直接参与终端产品,而是成为整个行业的底层标准。
如果说 Physical AI 是一座正在建造的城市,那么 NVIDIA 正在同时提供水泥、钢筋与电网。
04 数据:Physical AI 最稀缺的“石油”
在大语言模型的世界里,互联网提供了几乎无限的文本数据。但在 Physical AI 中,一个更根本的问题浮现出来:
真实世界的操控数据极其稀缺。
这使得数据,成为整个产业链中最关键、也是最稀缺的资源之一。
目前,行业主要探索三条路径。
真实数据路线。以 Physical Intelligence 为代表,其 π0 模型基于超过 1 万小时的真实机器人操作数据训练,覆盖多种机器人形态与任务类型,能够完成复杂操作(如叠衣服、组装纸箱等)。其开源行为,本质上为行业提供了一套“操控预训练基座”。
合成数据路线。Google DeepMind 的 Genie 3 与 NVIDIA 的 Cosmos,尝试通过世界模型生成大量模拟环境,在虚拟世界中完成训练,再迁移到真实世界。这一路径的核心挑战在于 sim-to-real gap,但随着模拟精度的提升,这一差距正在逐步缩小。
人类遥操作路线。通过数据采集手套等设备,将人类操作直接映射到机器人系统中。这种方式数据质量最高,但在成本与规模化能力上仍存在限制。
Tesla 则在尝试一条混合路径:通过工厂视频持续采集人类操作行为,并用于训练 Optimus 的动作能力。
长期来看,Physical AI 的竞争格局,很可能不取决于谁的模型最优,而取决于谁拥有最多、最高质量的物理世界交互数据。一旦数据飞轮开始运转,其壁垒将呈指数级增强。
05┃ 钱在说什么:一张 2026 Q1 Physical AI 融资全景图
数字不会骗人。以下是 2026 年第一季度 Physical AI 领域的关键融资事件:
【世界模型层】
· AMI Labs(LeCun)— $10.3 亿种子轮,估值 $35 亿
· World Labs(李飞飞)— $10 亿新一轮,Autodesk 投 $2 亿
【基础模型层】
· Physical Intelligence — 正在谈判 $10 亿新一轮,估值将超 $110 亿
· RLWRLD — $4100 万种子轮扩展
【人形机器人整机】
· Figure AI — 此前以 $390 亿估值融 $10 亿(2025)
· Mind Robotics — $5 亿,工业规模部署
· Galaxea — $4.34 亿,Series B 独角兽
· Humanoid — $2.9 亿种子轮,直接独角兽
· Generative Bionics — €7000 万种子轮
【基础设施与工具】
· NVIDIA — 持续投入 Isaac GR00T / Cosmos 平台
· RoboForce — $5200 万,Physical AI 劳动力平台
仅上述公开数据,Q1 已超过 64 亿美元。而这还不包括 Tesla、Hyundai/Boston Dynamics、Google DeepMind 等大厂的内部投入。
资本的流向说明一件事:Physical AI 已经越过了“概念验证”的阶段,进入了“基础设施建设”的阶段。投资人不再问“机器人能不能用”,而是在问“谁的基础设施能让机器人最快规模化”。
06 冷思考:泡沫还是拐点?
当然,硅谷从不缺泡沫。面对 Physical AI 的狂热,几个冷静的问题值得思考:
Demo ≠ 部署。正如业内人士在达沃斯 2026 上的共识:一个精彩的 demo 和一个能连续运行 10000 次不出错的系统之间的鸿沟,比宣传暗示的要大得多。Figure 02 在 BMW 工厂确实参与了 30000 辆车的生产,但它执行的是相对标准化的零件搬运,而非灵巧装配。
Sim-to-real 依然是硬骨头。世界模型的保真度在提升,但物理世界的长尾复杂性——光照变化、材料差异、非预期碰撞——仍然是合成数据路线的最大挑战。
商业模式尚未跑通。LeCun 自己说 AMI Labs 第一年只做研究。World Labs 在尝试免费+付费模式。Physical Intelligence 开源了核心模型。目前这些公司的收入几乎为零,资本赌的是 3-5 年后的范式垄断。
安全与监管的灰犀牛。当成千上万台具备自主决策能力的机器人进入工厂甚至家庭,谁为事故负责?目前全球对 Physical AI 的监管框架几乎一片空白。
但恰恰这些问题正说明,我们正处于技术拐点的早期,而非泡沫的顶部。每一项真正的范式转换——互联网、智能手机、云计算——在早期都伴随着“Demo 远好于产品”的阶段。关键的区别在于:底层技术是否在真正进步,而不只是 PPT 在进步。
从 LeCun 的 JEPA 架构、到 Genie 3 的实时世界生成、到 π0 的 68 任务泛化能力、到 Optimus 1000 台级别的工厂部署——2026 年 Q1 的进展是实打实的工程突破,不是空中楼阁。
07 Physical AI 不是一个独立赛道,它是 AI 的最终形态。
Physical AI 不是一个新赛道,它更像是 AI 的终局形态之一。
当 AI 从“理解世界”走向“进入世界”,真正被重写的不只是模型能力边界,也是产业分工与价值分配方式。未来的竞争,不会只发生在模型参数和算力集群里,也会发生在机器人本体、灵巧手、数据采集、仿真系统、产业场景和供应链组织能力上。
这也是为什么,这一轮对华人尤其重要。
因为华人在过去二十年里,最深的积累之一,从来不是单一维度的技术标签,而是把前沿技术、工程执行、硬件制造和跨区域产业协同真正串起来的能力。无论是创业者、工程师,还是投资人与产业资源组织者,只要能够抓住这一轮从数字智能走向物理智能的迁移,就有机会不只是参与趋势,而是在某些关键层上,成为趋势本身的一部分。
2026 年,Physical AI 也许还远未成熟;但正因为它还在早期,窗口才刚刚打开。对华人来说,这可能不是又一轮“跟随式参与”的周期,而是一轮更有机会向基础设施层、平台层和关键组件层深度切入的新起点。
本文来自微信公众号 “硅兔君”(ID:gh_1faae33d0655),作者:硅兔君,36氪经授权发布。