张亚勤院士:基础大模型最终不超过10个,十年后机器人比人多
从ChatGPT到DeepSeek,AI正沿着“智能+”的路径进入新一轮浪潮。
正值大模型从“算力堆叠”走向“推理优先”的关键节点,清华大学智能产业研究院(AIR)创始院长、中国工程院外籍院士张亚勤提出:
新一轮人工智能,是信息智能、物理智能和生物智能的融合,本质上也是原子、分子和比特的融合。
也就是说,在规模定律持续发挥作用的前提下,当参数规模、数据体量与算力资源跨过某个阈值,智能就不再只停留在模式识别,而是开始“涌现”——
先是从鉴别式AI走向生成式AI,再从生成式AI走向以智能体为代表的新范式。
在本次量子位MEET2026智能未来大会上,他也将ChatGPT和DeepSeek,视作这一轮演进中的两个重要里程碑:
前者通过统一表征与token化,把文本、语音、图像乃至蛋白质、点云等数据纳入同一空间;
后者则以高效率、高性能、低价格和开源路径,把大模型从“预训练时代”推向以推理为核心的“DeepSeek时刻”。
至于未来5~10年的主战场,在他看来,将走向“智能体互联网”时代——
基础大模型像操作系统一样在全球范围内收敛到不超过10个;而智能体会取代今天的大部分SaaS和App,成为企业和个人与世界交互的默认形态,同时这也是通往AGI的必经之路。
为了完整体现张亚勤的思考,在不改变原意的基础上,量子位对演讲内容进行了编辑整理,希望能给你带来更多启发。
MEET2026智能未来大会是由量子位主办的行业峰会,近30位产业代表与会讨论。线下参会观众近1500人,线上直播观众350万+,获得了主流媒体的广泛关注与报道。
核心观点梳理
新一轮人工智能是信息智能、物理智能和生物智能在统一token表征与规模定律驱动下的融合演进。
以ChatGPT与DeepSeek为代表,AI正从鉴别式走向生成式与推理式,在高效率、低成本和开源生态中加速落地。
生成式AI正快速演化为智能体,任务长度与能力同步提升、风险同步放大。
基础大模型相当于AI时代的操作系统,全球玩家不会超过十家,将重构为“基础模型+垂直/边缘模型+智能体网络”的新产业格局。
智能体互联网是未来5–10年最大方向,也是通往AGI的必经之路,预计在15–20年内完成从信息智能到物理智能、再到生物智能的跨越。
……
以下为张亚勤演讲全文:
从ChatGPT到DeepSeek:新一轮人工智能范式与“智能涌现”
今天我谈的是人工智能+的趋势,这个题目我也思考了有将近十年的时间,我出了一本书叫《智能涌现》,也总结了人工智能这十年的发展,这里面也包括我当时在10年前写的“智能+”和“人工智能+”的文章。
首先就是新一轮的人工智能,它是信息智能、物理智能和生物智能的融合,我们的信息世界、物理世界和生物世界都走向了数字化,所以它也是原子、分子和比特的融合。
人工智能已经有70年的历史了,过去的五年和十年发展尤其快,一个重要的里程碑就是2022年的ChatGPT,距离现在正好三年。
特别重要的就是ChatGPT所带来的从鉴别式的AI走向了生成式的AI,过去更多的是模式识别,现在我们可以创造新的内容,这里面有三个特别重要的概念:
首先它是一个统一的表征,即tokenization,不管是文字、语音,图片、视频,或者是蛋白质、DNA、细胞,或者是三维的激光雷达的点云信号,都可以把它变成一个统一的token。
token越多,数据越多,算力越强、算法越好,这个时候就越准确。
规模定律(Scaling Law)到了一定的规模的话,就会出现智能涌现,这也是我这本书的题目。 另外一个重要时刻就是咱们中国的DeepSeek时刻,DeepSeek出来之后,首先就让整个模型从预训练走向推理。
另外一点当然很重要,它有很多的算法创新、架构创新、系统创新,可以说是高效率、高性能和低价格。
同时它又是个新的商业模式,它是开源的,用的MIT的license,这个本身是限制最少的开源架构,所以DeepSeek出来之后,在国内和全球范围内大幅度地加速了它的落地和应用,所以我把它叫做DeepSeek Moment,也是中国的一个路径。
AI发展的五大趋势
AI发展有五个趋势,首先就是生成式的AI正走向智能体的AI。
智能体是这两年AI方面一个新的发展,是最重要的一个创新。
过去七个月,Agent的任务长度就增长了两倍,准确度大于50%,其实也已经和人类对齐了。
第二个趋势很重要,就是规模定律在预训练阶段已经放缓了,尽管这个智能还在往前走,更多的智能放到后训练、推理、智能体阶段。
这里面很有意思的现象就是,推理的单位成本在过去一年下降了10倍,但是智能体本身的算力要求一年也是增长了10倍,所以一个乘10、一个除10正好平衡。
第三点就是,我们从信息智能走向物理智能和生物智能,大语言模型走向视觉语言动作模型(VLA,Vision-Language-Action)。
这里面有两个很重要的节点,一个是无人驾驶,无人驾驶今年就已经到达ChatGPT时刻,2030年就是DeepSeek时刻——即10%左右的新车拥有L4级无人驾驶的能力。
另外机器人一定是未来最大的赛道,尽管人形机器人还需要很多年,但是我认为在未来10年左右,我们机器人会比人的数目还要多。
一个不好的消息是,AI的风险正在快速上升,智能体出来之后我们的风险至少double(翻倍)。
未来5-10年最大发展方向:智能体互联网
如果看一下新产业格局的话,我们有基础大模型,像操作系统一样,上面有垂直模型,还有边缘模型。
基础大模型,全球可能最后不会超过10个,一半中国的,一半美国的,可能说不定还有一两个是别的国家的,中美两个国家有不同的路径,但是是引领全球。
这里面还包括开源和闭源,去年我记得我们还在争论到底以开源为主、还是闭源为主。现在我觉得比较清楚了——开源会成为更多的、更大的平台和生态,可能80%是开源, 20%的是闭源。
这个图就特别清楚,规模定律可以看到的Pre-train还在往上走,但是走的速率已经在平缓,Post-train在increase,智能体还是直线地往上走。
还有一点,智能体本身不仅仅是技术,它其实在形成网络,也形成新的经济形态。
所以我们以后如果看企业的架构都会有完全不同的一种概念,以后企业需要GPU、大模型、数据,然后包括我们的人力资源,有些可能是人,有些可能是智能体,所以这对于未来管理企业、开发产品都有很大的影响。
这张图是未来的技术架构,左边这张图是ChatGPT刚出来不久的时候我画的,如果看这个黄线的话,在左边可以看到基础大模型它是一个平台,上面有各种不同的领域垂直模型,而上面有SaaS(软件作为一种服务),在边缘会蒸馏出一个相对比较小的模型,再上面有APP,这是当时我想的架构。
10月我把这个架构做了更新,最重要的一点就是我认为未来我们的SaaS和在设备端或边缘端的手机APP都会被Agent取代,也就是说智能体是未来的SaaS和APP。
我举个例子,所谓的智能体,你可以有各种各样的,有消费者的、各个不同行业的、机器人的、无人驾驶的。
刘洋教授在清华做了一个医疗智能体,也是全球第一个智能体无人医院——想用智能体网络、多智能体去模拟真正的三甲医院,这里面当然有病人、医生、护士、各种不同的科室。
在这个虚拟世界里面,多智能体会互相交互和学习,然后持续快速地进化,这样就是能在很短的时间,比如说两天它就可以完成一个三甲医院两到三年的这些病例,而且准确度还要高得很多。
但我们并不是说让智能体来替代未来的医生,它更多的是作为助理,我们相信未来每个医生都会有TA的一个智能体。
所以如果看一下产业机遇的话,我把基础大模型看作是我们人工智能时代的一个操作系统,它会彻底重写、重构和重塑我们产业的形态。
就像在PC时代我们有Windows,在移动时代有安卓和iOS,同样在人工智能时代操作系统就是一个基础大模型。有了这个操作系统之后,它下面的芯片架构、上面的应用生态都会完全被重构。
也就是为什么现在芯片是以GPU为主的,上面的生态是以垂直模型加上边缘模型和智能体为主的,整个规模会比PC时代、移动时代大一个、两个甚至三个数量级。
另外,我们从互联网发展的角度来看的话,我们最早是PC互联,后来到了移动互联,再之后我们到了物联网,现在我们正走向Internet of Agents,也就是智能体互联网,我认为它是未来5到10年最大的发展方向。
智能体也是我们实现AGI通用人工智能的必经之路,这里面需要新的算法体系,比如说新的记忆体系、世界模型。
我认为未来五年的话,现在的自回归架构、Transformer、Diffusion可能就会被颠覆,有了这些东西之后我们就可以实现通用人工智能。
到底需要多长时间呢?
我认为可能需要15~20年。先是信息智能,再是物理智能,最后达到生物智能。
本文来自微信公众号 “量子位”(ID:QbitAI),作者:编辑部 整理自 MEET2026,36氪经授权发布。