超越Agent、世界模型,Meta团队提出“神经计算机”
日前,来自 Meta AI 与 KAUST 的研究团队提出了一种新的机器形态:神经计算机。这一概念试图攻克当前 AI 系统在执行层面上的根本性局限:模型与计算环境的分离。
现有的 AI Agent 或世界模型,虽然具备强大的预测与规划能力,但核心的执行状态仍需依赖外部的操作系统、解释器或模拟器来承载,这导致模型的计算能力被外部环境所束缚。
神经计算机旨在突破这一局限,它不再将模型作为外部工具的调用层,而是通过将计算、内存和 I/O 统一在神经网络内部的单一运行时状态中,使模型本身直接成为一台可运行的计算机。
论文链接:https://arxiv.org/abs/2604.06425
为什么需要神经计算机?
在当前的计算机体系结构中,传统计算机依赖计算、内存与输入输出三项功能的物理分离,通过显式编写的程序指令来完成执行过程。AI Agent 则将习得模型置于外部软件环境之上,通过操作现有界面或调用接口来达成任务目标,但模型本身并不承载可执行状态,任务的进展与结果仍由操作系统或应用程序维护。世界模型虽然能够学习并预测环境动态的变化趋势,其关注点在于对环境未来状态的估计,而非将模型自身作为执行计算的载体。
这三类系统存在共同的局限,即可执行状态始终存在于模型之外。正是针对这一架构层面的空白,神经计算机的概念被提出,其目标是将计算、内存与输入输出统一在模型内部的单一运行时状态中,使模型自身承担起运行中的计算机这一角色。
迈向完全神经计算机
神经计算机的核心在于提出了一种全新的抽象概念:将计算、内存与输入输出(I/O)统一整合到一个习得的潜空间运行时状态中。这一主张的目标是从根本上改变架构,让模型本身成为那台正在运行的计算机。
当前,基于命令行界面和图形界面的的 NC 原型已经初步验证了这一路径的可行性,成功实现了 I/O 对齐、短时程控制以及可测量的界面保真度,但这距离真正的通用计算机仍存在显著差距,因为目前尚未掌握例程复用、通用执行能力以及行为一致性。
与传统计算机相比,二者的根本区别体现在架构与编程方式上。在架构层面,传统计算机实例化局部的、组合的符号语义,而神经计算机实现整体的、分布式的数值语义。在编程层面,传统计算机的语言语义由人类显式设计,而神经计算机的语义是从数据中习得的用户输入序列的含义。
作为这一概念的长期目标,完全神经计算机(CNC)是神经计算机的成熟形态,它必须满足图灵完备、通用可编程、行为一致性以及拥有机器原生语义这四个严苛条件。
图 | 四项完全神经计算机要求的操作解读。
为了明确 NC 在计算图谱中的独特位置,研究团队将其与其他系统对象进行对比:传统计算机执行显式程序,AI Agent 操作外部执行环境,世界模型仅负责预测环境动态,而神经计算机的独特之处在于它直接将运行时本身视为一台计算机。
图 | 在共同系统层级上对四个系统对象进行比较。
从当前的 NC 原型迈向 CNC,研究团队规划了一份关键的技术路线图,旨在通过实现无界的有效内存来突破上下文窗口限制。需要构建可组合与可复用的组合式神经程序,并在架构层面明确区分推理执行与参数更新以分离“运行”与“更新”,同时坚持以交互I/O轨迹为主要训练数据,让系统通过真实交互习得底层的计算逻辑。
图 | 人类与计算机的关系经历了从传统计算机、Agent 时代到神经计算机的演变历程。
传统计算机被直接使用;在当今的 Agent 架构中,Agent 负责协调现有计算机资源,而世界模型则作为并行预测层;神经计算机(NCs)致力于将这些分散功能整合到单一学习运行环境中。从这个意义上说,神经计算机的开发动机并非来自外部取代现有架构,而是通过将分散功能内化于单一学习机器中实现统一。完全神经计算机(CNC)正是这种机器形态的成熟通用化实现形式。
讨论与展望
尽管当前神经计算机原型已经展现出初步的运行时能力,但要走向实用化仍面临诸多挑战,其中最显著的局限在于模型在稳定复用性、符号可靠性及运行时治理机制方面的表现尚未成熟,这些能力的缺失限制了其从孤立的演示迈向真正的可用运行时系统。
为了实现完全神经计算机的愿景,研究团队绘制了涵盖效率、计算与推理、内存与存储、I/O与控制、工具桥接、条件驱动的泛化、可编程性和工件生成等维度的详细路线图。
神经计算机的发展进程不仅取决于更完善的理论模型,更关键在于复用性、一致性及治理机制能否实现持续验证。若这些技术壁垒持续突破,神经计算机将不再局限于孤立实验案例,而有望成为下一代计算机的理想候选形态。
本文来自微信公众号 “学术头条”(ID:SciTouTiao),作者:学术头条,36氪经授权发布。