首页文章详情

杨立昆再联手谢赛宁,英伟达参投,新公司押注「LLM 之后」

爱范儿2026-03-10 13:15
投资方高度多元化,AMI 建立中美之后的欧洲新「第三极」。

3 月 10 日,APPSO 中文独家获悉,世界模型研究所/创业公司 AMI 已完成 10.3 亿美元融资,投前估值 35 亿美元。该公司由图灵奖得主、前 Meta 首席 AI 科学家杨立昆 (Yann LeCun) 创办。

AMI全称 Advanced Machine Intelligence「先进机器智能」,以世界模型 (world models) 为主要研发方向,力求开发出能够从真实世界中学习抽象表征的世界模型。

值得一提的是:谢赛宁,AI 基础研究方面的顶级专家,也是杨立昆的老朋友、学校同事,已经正式加入了 AMI 担任首席科学官。

谢赛宁是视觉表征学习方面的绝对权威,diffusion transformers (DiT) 的共同作者之一。DiT 架构的推出让视觉模型能够和大语言模型一样受益于 Scaling Law。通过用 Transformer 主干结构替代此前沿用十年的 U-Net,谢赛宁等人的工作让复杂、高保真图像/视频模拟得以实现,为 Sora、SeeDance 等顶级视觉生成模型和工具的推出打下基础。

根据 APPSO 获得的一份融资纪要,AMI 本轮融资将用于支持长期科研、全球范围招聘工作,以及世界模型方向上的可靠产品。

AMI 公司官网

杨立昆曾表达过将欧洲树立为中国、美国之外的全球人工智能「第三极」的希望。AMI 公司总部位于巴黎,并将设立纽约、蒙特利尔、新加坡办公室。

AMI 六位核心创始人,四位直接来自 Meta FAIR(基础人工智能研究)团队,另外两位也有深厚的 Meta 渊源。杨立昆担任公司董事长,CEO 另有其人。

AMI,在法语里是「朋友」的意思,杨立昆本人提示「要用法语发音」。

今年年初,杨立昆在巴黎公寓接受了《麻省理工科技评论》专访。当时他刚离开 Meta 不久,被问到如何看待 Meta 的 AI 路线,他的回答是:「我可能并不认同他(扎克伯格)所有的决定。但人们做决策是有理由的,没有什么好生气的。」

他当时说,「Meta 可能会成为我们的第一个客户。」

LLM 的「反对者」,得到了 10 亿美元

APPSO 获悉,AMI 本轮融资得到了多个极为重要的投资方支持。

本轮融资凯辉创新、Greycroft、Hiro Capital、HV Capital、贝索斯远征共同领投;战略投资人当中包括英伟达、丰田创投、淡马锡、软银、马克·库班、穆里耶家族等;跟投方包括埃里克·施密特、阳狮集团、三星、蒂姆·博纳斯·李等。

凯辉创新由中法经济界知名人物蔡明泼创立,他曾投资拼多多、元气森林、京东物流等多家公司

贝索斯远征是亚马逊创始人杰夫·贝索斯的家族办公室

领投方多为立足欧洲的顶级基金

马克·库班是业内知名投资人、NBA 球队前老板

穆里耶是法国顶级商业家族,旗下掌握迪卡侬、欧尚等品牌

埃里克·施密特是前 Google/Alphabet CEO、董事长

蒂姆·博纳斯·李是万维网 (www) 发明者

2023年,ChatGPT 爆发之后,大语言模型 (LLM) 几乎成了「AI」的代名词。杨立昆是少数从那时候开始持续公开唱反调的顶级研究者之一。

他的批评基于路线判断。LLM 的本质是文字的统计规律,它能够很好地操控语言,但理解不了物理世界,无法真正地做「推理和规划」(在当时)。

在《麻省理工科技评论》专访中,杨立昆表示:「为什么我们没有一个像家猫一样敏捷的家用机器人」——这句话背后是「莫拉维克悖论」:感知、运动协调、物理直觉,这些对人类来说不需要思考的能力,对 AI 来说恰恰是最难的部分,而 LLM 完全绕开了这些。

简单比喻是婴儿学习重力:没有人告诉婴儿重力方程,但婴儿知道松手东西就会掉,这是从观察中提炼的规律,不是对物理细节的穷举。JEPA 就是让 AI 做同样的事。

在 APPSO 获得的资料中,杨立昆表示:

AI 在过去十年内取得了显著的进展,预测和生成系统在全球范围改变了我们分析、提取知识、创建内容的方式。现在,当 AI 超越了屏幕的限制,智能不能止步于简单地生成结果。它必须理解情境、保存上下文、预测结果,并且随着时间做出更可靠的行为。

为了实现这一目标,AMI 将打造全新一代的 AI 系统,去理解世界,具备长期维持的记忆,能够进行真正的推理和计划,并且在端到端安全可控。

杨立昆、杰夫·辛顿、约书亚·本吉奥共同获得图灵奖

杨立昆的解法是 JEPA 架构:Joint Embedding Predictive Architecture,在 Meta 时期提出的学习框架。

核心思路是让模型学习世界的「抽象表征」,在那个抽象空间里做预测,而不是试图还原所有细节。

V-JEPA 系列是这个思路目前最成熟的工程实现,而它的负责人,世界模型专家 Michael Rabbat,现在在 AMI 担任世界模型副总裁。

谢赛宁近段时间在纽约大学推进的也是相关方向。他的团队发表的「Solaris」,就是用 Minecraft 构建的多人视频世界模型,用以测试 AI 在动态环境下的预测与规划能力。

「我们会有达到人类级别智慧的 AI 系统,」杨立昆表示,「但它们不会建立在 LLM 之上。这不会发生在明年或后年,需要时间,需要重大的概念性突破。而这正是我一直在研究的,也是 AMI 的方向。」

他还给学界留了一句话:

「别做 LLM。没有意义,你们赶不上业界。去发明新技术,去解决当前系统之外的问题。突破不会来自把 LLM 继续做大。」

从卷积神经网络 CNN,到 JEPA,再到在原 Facebook 时代创立的 FAIR,杨立昆一直在做困难的、看起来需要很长时间才能验证的事情。这一次,他得到了 10 亿美元、一支旧将和老朋友组成的团队——以及更重要的,自主权。

谢赛宁

谢赛宁在加州大学圣地亚哥分校取得计算机科学博士学位,随后在 Meta FAIR(硅谷总部)工作四年,再到 Google DeepMind 担任 GenAI/nano 团队研究科学家,同期担任 NYU 库朗数学研究所助理教授。他的谷歌学术引用量超过 9.6 万次。

谢赛宁最广为人知的工作,正如前面提到是 2022 年和学生 William Peebles 合作发表的「Scalable Diffusion Models with Transformers」,也就是 DiT。

这篇论文把扩散模型的骨干网络从 U-Net 切换到 Transformer 架构,在此之前,图像生成领域的扩散模型普遍沿用 U-Net,这是一个已经用了近十年的视觉分割架构。DiT 发布后,质量和可扩展性同步提升,成为生成模型新架构的标准参照。后来的 Sora、Stable Diffusion 新版本,以及今天风靡全球的 SeeDance 视觉模型,底层都在这个框架的延伸路线上。

值得一提的是,写出 DiT 的 Peebles,如今是 OpenAI Sora 团队的核心负责人之一。另一位他的学生郭文景 (Demi Guo),是知名 AI 视频创业公司 Pika 创始人。

谢赛宁的优秀学生还包括:Eric Mintun(OpenAI Sora)、Zihan Zheng(OpenAI Technical Staff)、刘壮(普林斯顿大学教授)、尤佳轩(UIUC 教授)等。

谢赛宁本人的更多注意力放在了世界模型上。根据 APPSO 获得的 AMI 联合创始人名录,谢赛文的部分只写了一句介绍:

Training world models over word models. 训练世界模型而非语言模型。

谢赛宁更早期的代表作包括:

ConvNeXt:2022年,与 Meta FAIR 同事合作,把卷积网络重新拉回到与 Vision Transformer 正面竞争的水平,证明架构创新可以挽回被认为已经「过时」的路线。

MAE:Masked Autoencoders,与何恺明合作,CVPR 2022 Oral,把 BERT 式的自监督学习方法迁移到视觉领域,影响了之后大批视觉预训练方法

MoCo:Momentum Contrast,同样与何恺明合作,是自监督视觉表征学习的奠基工作之一。

在他加入 AMI 消息曝光之前,他的个人网站上有一行字:「2026年春夏学期将休假」。

杨立昆在此前的《麻省理工科技评论》专访中被问到谢赛宁是否会加入时,没有直接确认,说的是:「我已经雇了他两次了。我在 FAIR 雇了他,后来也说服了 NYU 的同事把他招进来。我对他有很高的评价。」

两人有大量公开的合写论文,覆盖多模态 LLM 的视觉局限性研究到空间推理。

这场合作,早在 AMI 成立之前就在运转了。

FAIR 老兵,集结

Meta 旗下的 FAIR,在上一个 AI 周期的鼎盛时期,是全球最受尊重的工业界 AI 研究机构之一。它的研究风格更偏学术:发论文、做开源、鼓励长期研究,和 OpenAI、Anthropic 那种以产品商业化为核心的模式有根本的不同。迄今为止最重要的 AI 训练框架 PyTorch,以及最早一批的开放权重大模型 Llama,都来自于 FAIR

杨立昆在专访里提到,FAIR 的机器人研究团队后来被裁撤,他认为这是一个战略失误。这可能是他选择离开的原因之一,尽管他没有直说。

而他领导的 AMI 团队,在某种意义上,是 FAIR 蒙特利尔和巴黎团队的「精华重组」。六位核心创始人,四位直接来自 FAIR,另外两位也有深厚的 Facebook/Meta 渊源。

首席科学官谢赛宁刚才已经提到了。

负责世界模型研究的迈克尔·拉巴特 (Michael Rabbat)。他将在 AMI 负责蒙特利尔办公室。拉巴特是原 FAIR 蒙特利尔实验室的创始成员之一,在麦吉尔大学任教十余年后全职加入 Meta,在那里主持研发了 I-JEPA、V-JEPA、V-JEPA 2 三个世界模型系列。

V-JEPA 2 是其中影响最大的:通过视频自监督训练,只需不到62小时的机器人操作数据,就可以在完全陌生的实验室环境里零样本控制机械臂完成抓取任务。这套方法的核心逻辑,和 AMI 整个公司的技术路线直接相连。

公司的 CRIO(首席研究与创新官)是知名中国计算机科学家冯雁 (Pascale Fung),AAAI、IEEE、ACL 等顶级学术机构会士,香港科技大学讲席教授。

她出生于上海,曾经在京都大学、法国国家科学研究中心、哥伦比亚大学进修。在 Meta FAIR 的后期工作是具身 AI 和视觉语言世界模型,主要应用场景是智能眼镜。冯雁目前担任香港科技大学电子及计算机工程系

冯雁(右二)与杨立昆(中间)

COO 劳伦·索利 (Laurent Solly) 是这支团队里背景最特殊的一位:曾任法国前总统萨科齐的办公室主任,后来在 Meta 担任欧洲业务 VP,主导了 FAIR 巴黎实验室的选址和落地。索利拥有ENA 和 Sciences Po 双学位,是这家科研背景公司通往欧洲政商渠道的关键接口。

索利与萨科齐

AMI 的CEO 由亚历山大·勒布恩 (Alexandre LeBrun) 担任。他是法国人,毕业于巴黎综合理工学院,是一位知名连续创业者,创办的公司都聚焦于拉近「基础科研-真实世界」之间的距离。

勒布恩的第一家最早的公司 VirtuOz 做的是企业对话机器人,2002 年前后创立,当时「AI」还远未变成一个流行词,公司后来被 Nuance 收购(Nuance 此后并入微软)。然后是 Wit.ai,一家自然语言理解公司,拿到 Y Combinator 的投资,2015 年被 Facebook 收购。

随后,勒布恩进入 Meta 主导 FAIR 巴黎的工程工作。离开后创立的 Nabla 做 AI 医疗助手,在欧洲拿下了相当规模的医院客户。

杨立昆深刻认识到自己的优劣势。他坦率地表示:「我可以做管理,但我不喜欢。这不是我的人生使命。我更像是一个有远见的科学家。」

勒布恩与杨立昆

资方高度多元化,要建立 AI 第三极

APPSO 认为 AMI 的投资方非常有特色,内含深意。

正如前面提到,投资方包括贝索斯远征、英伟达、淡马锡、软银、马克·库班、穆里耶家族、埃里克·施密特、Mistral、阳狮集团、三星、蒂姆·博纳斯·李等——

有全球 AI 的霸主、新加坡/法国的主权基金和国投部门、欧洲最大的开源大模型公司、谷歌前 CEO、顶级科技大佬家办——新钱老钱齐聚。

这种高度多元化的组合,在一轮投资表上一起出现极为罕见,呈现出明显的全球地理分布但高度聚焦欧洲本土,利益关系遍布 AI 学术研究、基础设施、工业、终端应用科技等多个层面的特色。

这笔融资的多元化属性,背后的逻辑其实很有前瞻性:杨立昆曾解释过,很多国家存在主权问题,它们希望对 AI 有一定的控制权。如果未来人们所有的信息都只能经由美国闭源公司的模型,或者中国开源模型来中介,这不是一个令人愉快的未来。

杨立昆的判断是,AI 会成为一个平台,而大多数平台最终都会走向开源。

AMI 要做的,是一个既不依附于美国,也不依附于中国的前沿 AI 公司,根据地在欧洲,路线是开源——打造一个 AI 的新「第三极」。

参考来源:

https://www.technologyreview.com/2026/01/22/1131661/yann-lecuns-new-venture-ami-labs/

本文来自微信公众号“APPSO”,作者:杜晨,36氪经授权发布。