微软Build大会一文看尽:9款自研模型、Windows版龙虾、“梦中情机”,黄仁勋猛夸
智东西6月3日报道,今天凌晨,在微软Build 2026开发者大会上,微软一口气发布了超20项重磅更新,包括9款自研模型、与英伟达合作的全新PC产品、Windows版“龙虾”,以及超10款智能体应用和开发工具。
英伟达创始人兼CEO黄仁勋从台北远程连线,深夜和微软董事长兼CEO萨蒂亚·纳德拉(Satya Nadella)纳德拉展开对谈。黄仁勋说,AI基础设施已经进入智能体时代,而微软与英伟达正在共同定义下一代AI计算平台。
“如果我们能把算力、内存都最大化,那会造出怎样一台开发者的「梦中情机」?”
纳德拉用一个问题引出微软重磅PC新品——搭载英伟达RTX Spark超级芯片的Surface RTX Spark Dev Box桌面工作站,AI算力达1PFLOPS,本地能跑120B参数的大模型。
Surface RTX Spark Dev Box
除了新型PC外,微软还展示了为多智能体世界而生的两款新型AI硬件:一款是能塞在胸前的AI可穿戴设备,另一款是AI桌面伴侣,主打以低成本、即插即用、随时响应的方式来使用智能体。
值得一提的是,在扶持OpenAI七年后,微软AI超级智能团队终于发力,连推7款自研大模型:首款旗舰推理模型MAI-Thinking-1性能追平Claude Opus 4.6,图像模型MAI-Image-2.5盲测分数超过歌的Nano Banana 2。
微软首款自动驾驶智能体Microsoft Scout也正式登场,基于OpenClaw构建,采用企业级安全架构,可直接操作电脑及日常使用软件。纳德拉将其称为企业级“龙虾”。
还有Windows版OpenClaw,现已推出预览版。微软与OpenClaw合作,将OpenClaw与微软MXC结合,帮IT管理员轻松做好智能体安全保护。
此外,微软发布新一代量子计算芯片Majorana 2,量子比特可靠度是上一代的1000倍,平均寿命为20秒,偶尔甚至超过1分钟。微软预计在2029年实现真正可规模化的量子计算机。
01.迷你工作站塞入128GB统一内存,自带“开发者特调版”Win11
微软与英伟达的合作是本次Build大会上的重点。微软本周早些时候推出的SurfaceLaptop Ultra首发了英伟达RTX Spark超级芯片,预计今年秋天上市。
面向开发者,微软打造了Surface RTX Spark Dev Box。这是一款桌面工作站产品,使用英伟达的RTX Spark超级芯片,拥有1 Petaflop的AI计算能力、20个CPU核心和128GB统一内存,同样将于今年秋天推出。
微软称,Surface RTX Spark Dev Box可以支持本地运行1200亿个参数、100万上下文的模型,或者对模型进行微调。
散热对这类高性能桌面设备尤为关键。Surface RTX Spark Dev Box采用铝制机壳,兼作散热器。
Surface RTX Spark Dev Box自带面向开发者优化的Windows 11,预配置了所有必备开发工具,比如Visual Studio Code、Windows终端内嵌的GitHub Copilot、WSL、PowerShell 7。
其设置也面向开发的需求进行了调整,没有新闻推送,没有弹出的小组件,没有通知,默认采用深色模式。这一设置可通过GitHub上的Windows Developer Config项目一键部署。
面向开发者优化的Windows 11
安全性方面,Surface RTX Spark Dev Box拥有安全核心PC架构、BitLocker加密和Microsoft Defender防护,并面向企业提供了Entra ID和Intune功能,可实现大规模管理。
02.联手高通、联发科推出参考设计,智能体硬件要直接杀入工作场景
微软全球副总裁、应用科学组负责人Steven Bathiche分享了微软在新型硬件方面的探索——Project Solara,并发布两款硬件参考设计。
Bathiche认为,下一代计算设备不一定是一台电脑、一部手机或一副眼镜,而是多个设备协同组成的系统。用户的智能体会根据场景需要,在最合适的时间和地点出现,并通过不同形态完成工作。
Project Solara是一个智能体优先的设备平台,建立在三大基础之上:首先是面向企业级部署的微软设备生态系统;其次是智能体驱动的全新交互模型;最后是扩展能力,允许企业接入自己的智能体。
在Build大会上,微软首次展示了两类参考设备。
第一类是固定式设备。
这是一款面向办公桌场景设计的智能体终端,采用联发科平台,支持Windows Hello企业身份认证。用户走近设备即可完成安全登录,直接访问自己的智能体服务。
设备会基于用户的工作上下文持续提供信息和建议。例如提醒当天最重要的待办事项、协助规划工作流程,甚至帮助用户直接将任务委托给智能体执行。
与此同时,这一设备还能够与Windows PC和Windows 365云电脑无缝协同,成为现有办公环境的补充。
相比固定设备,第二种形态更加灵活,是一款类似数字工牌的可穿戴设备原型。
这款设备采用高通骁龙平台打造,体积小于传统移动终端。现场演示中,Bathiche通过指纹完成身份验证后,直接调用个人智能体执行任务。他按下录制按钮,设备侧边摄像头开始采集现场画面,并向智能体下达指令:整理Build大会现场素材,生成内容并发送给团队审核。
随后整个流程由智能体自动完成,包括内容收集、整理、归档和分发。
Bathiche强调,这类设备的价值并不在于硬件本身,而在于能够将智能体能力直接带到工作发生的地方。
以医疗场景为例,护士佩戴设备后,可以通过语音与智能体实时交互,自动完成病历记录、语音转写、发言人识别以及护理记录整理。同样的能力也适用于零售、制造业、金融服务、法律服务等众多行业。
这些设备是一类参考设计。企业可以在相同的软件架构基础上调整外观形态、屏幕尺寸、传感器配置甚至输入方式,并加载各自的智能体系统,从而快速构建针对特定场景的专用设备。
微软透露,目前已经有多家企业开始参与相关探索,包括Best Buy、CVS Health、Levi's、Target等公司都在研究如何将智能体设备引入自身业务流程。
纳德拉总结道,Project Solara最重要的意义并不是推出一种新的平台,而是在重新定义了一套平台规则,让开发者和企业能够自由想象智能体应该存在于何处,以及它们将以什么样的形态出现。
03.MAI连发7款自研模型,旗舰推理模型比肩Claude Opus 4.6
本届Build大会上,微软的AI研究部门MAI集中发布了7款新模型,涵盖旗舰推理模型、编程模型、图像生成模型、语音识别模型和语音模型等多个类别。
微软首个推理模型MAI-Thinking-1采用混合专家(MoE)架构,拥有350亿激活参数、大约1万亿和256K上下文窗口。
微软AI CEO Mustafa Suleyman称,在与行业主流模型的对比测试中,MAI-Thinking-1获得了更高的人类评测偏好率。在多个推理基准测试中,其表现达到行业领先水平。
尤其是在软件工程基准SWE-bench Pro上,该模型取得53%的成绩,与Claude Opus 4.6处于同一梯队。
Mustafa特别强调:“MAI-Thinking-1完全从零开始训练,没有针对特定基准进行优化,也没有采用蒸馏技术。”这意味着模型拥有清晰、可追溯且具备商业授权的数据来源,更适合企业级生产环境部署。
图像模型方面,微软推出了MAI-Image-2.5及其轻量化版本MAI-Image-2.5-Flash。两款模型在图像质量和编辑能力方面实现了突破,MAI-Image-2.5在大模型竞技场图像编辑排行榜中排名第二,超过了多个主流竞争对手。
目前,两款模型已经集成至PowerPoint,并正在向OneDrive推广,同时已在Azure Foundry开放使用。
微软同时发布了新一代语音转录模型MAI-Transcribe-1.5。根据微软公布的数据,该模型支持43种语言,在转录准确率方面达到行业领先水平,并在多项测试中超过现有旗舰模型。
在语音生成领域,微软发布了MAI-Voice 2和MAI-Voice-2-Flash。
MAI-Voice 2支持15种语言,具备更加自然的语调、情感表达以及细粒度控制能力;而Flash版本则重点面向实时语音智能体场景,以更低延迟和更高效率满足企业需求。
微软还推出了专门针对编程任务优化的MAI-Code-1-Flash。
尽管仅拥有50亿参数,但该模型在SWE-bench Pro测试中取得51%的成绩,展现出较高的推理效率。该模型针对VS Code和GitHub Copilot CLI进行了深度优化,能够以更低成本提供接近大型模型的代码生成与推理能力。
除了Azure Foundry之外,微软宣布将把MAI系列模型同步提供给多个第三方AI生态平台,包括OpenRouter、Fireworks AI、Baseten等。开发者未来可以直接在这些平台上获取模型权重并进行个性化微调。
Mustafa还重点介绍了微软在模型与芯片协同设计方面的最新进展。
MAI-Thinking-1已针对微软自研的Maia 200 AI芯片进行了专项优化。MAI-Thinking-1+Maia 200的组合,每瓦性能是英伟达GB200的1.4倍。
微软计划将这些优化后的模型部署至即将推出的N1X设备平台,以进一步提升Windows端侧AI体验。
微软重点介绍了名为“Frontier Fine-Tuning(前沿微调)”的新能力。微软认为,未来企业竞争的关键不再是使用统一的大模型,而是拥有基于自身数据、工作流程和知识资产训练出来的专属模型。
通过强化学习环境(RLE)和定制训练平台,企业能够持续优化模型,使其更加贴合自身业务场景。微软披露,在内部测试中,经过前沿微调的MAI模型在部分任务上已达到与最新旗舰模型相当的效果,同时实现约10倍的成本效率提升。
04.Windows AI API支持范围拓展,两款自研小语言模型将登陆Windows
纳德拉称,边缘端的算力总量,其实是相当惊人的。如今已有许多AI功能依靠Windows设备的本地AI能力运行,比如Outlook的摘要、PowerPoint超分辨率功能、Adobe的AE、Premiere也都在Windows上利用NPU和GPU进行本地处理。
为了充分挖掘这些计算潜力,微软宣布扩大本地AI推理框架Windows ML和Windows AI API(无需自备模型即可使用的内置AI能力接口)的支持范围。这样一来,任何开发者都能利用设备上已安装的GPU,为本地AI构建应用,并在整个系统环境中流畅运行。
同时,微软还发布了两个将在Windows本地运行的小语言模型(SLM):一个是更高效的文本模型Aion 1.0 Instruct,支持日常文字处理工作,还集成到了Edge浏览器中。
另一个是规划模型Aion 1.0 Plan。这一模型拥有140亿个参数,可以作为本地智能体引擎,帮助开发者构建完全离线的智能体循环,实现意图识别、工具调用、文件管理和多智能体编排,无需云端参与即可完成任务执行。
在开发工具方面,微软推出了一系列更新:无干扰开发环境、内置GitHub Copilot的智能终端、70多个Linux实用工具。
此外,微软还发布了WSL容器,让开发者在本地构建和部署时不会被复杂的环境依赖等问题干扰。其中一个WSL配置文件能在Windows上支持Mac用户熟悉的Starship、Zsh和Homebrew等工具和命令行环境。未来几个月WSL容器将进行公开预览。
05.微软版“龙虾”来了!支持多智能体协作、权限控制
在企业智能体层面,微软发布了Microsoft Scout,这是一款能操作本地设备的智能体,基于OpenClaw框架,适用于Windows和macOS。
Microsoft Scout将本地和云功能整合到一个桌面应用中,拥有独立的身份与个性,可以创建、编辑和搜索文档,能直接加入Teams群组聊天或处理Outlook邮件,并以数字团队成员的身份与人类协作,帮助企业减少繁琐工作并提升效率。
这一智能体也可以启动专门的子智能体,用于并行研究、代码审查和复杂任务,或是按照用户的要求自主在后台运行。
Microsoft Scout内置了用于常见任务的Skill,比如Office操作、网页开发等。
安全性方面,用户可以通过详细的权限系统对Microsoft Scout进行控制,比如启用或禁用特定功能类别、标记敏感文件目录等等。
Microsoft Scout是微软企业级智能体Autopilots中的默认智能体,用户也可在Autopilots中自行创建更多类型的智能体。
06.为Windows版“龙虾”的安全保驾护航
与传统的应用不同,智能体正在采取越来越多自主性的行动。随着它们成为软件系统中的持续参与者,新的控制和信任风险问题也出现了。
为解决这一问题,微软推出了不少新功能和产品。
1、MXC SDK
为了在不限制生产力提升的前提下限制智能体的影响,微软推出了微软执行容器(MXC,Microsoft Execution Container)SDK的早期预览版,这是一个跨平台、策略驱动的Windows和WSL Agent执行层。
开发者定义了在应用和Agent中需要约束的内容,Windows通过MXC在运行时持续执行这些约束。MXC在隔离原语之间提供了抽象层,因此开发者无需管理底层隔离细节。
MXC目前能够在实现进程与会话隔离,前者适合编程Agent,后者适合长时间运行的自动化工作流。未来,MXC还计划加入对微虚拟机、Linux容器隔离的支持。
微软正与Hermes、Manus、英伟达、OpenAI、OpenClaw等伙伴合作,确保MXC的方案满足真实开发需求。
该技术现已在Windows平台上的OpenClaw中得到应用,使多步骤工作流能够在这些由操作系统强制实施的边界内执行。面向自主智能体的NVIDIA OpenShell安全运行环境,也是基于MXC构建的,并引入了策略管理、推理路由以及个人身份信息(PII)脱敏功能。
2、OpenClaw Windows套件
大会上的一个亮点是适用于OpenClaw的Windows套件。这套系统能长期自主运行,替用户管理邮件、跟踪包裹、处理GitHub任务,甚至管理个人健康数据或自动购买电影票。
微软与OpenClaw团队共同开发了OpenClaw Windows Companion App ,采用WinUI 3界面,可实现权限管理和企业级策略控制。现场演示中,OpenClaw拿到了删除桌面文件的命令,但因为MXC被设置为只读模式,所有操作全被阻止。
OpenClaw创始人Peter Steinberger感慨地说,如今,企业可以放心地使用OpenClaw了。看着OpenClaw试图删除文件却失败了,这让他非常高兴,因为6个月前,OpenClaw真的能把那些文件删掉。
3、Windows 365 for Agents
Windows 365 for Agents现已正式发布,它可以将隔离扩展到本地设备之外,让智能体在Intune管理的云PC中运行。
随着MXC集成未来的加入,Windows 365 for Agents将在单一的SDK和政策模型下,从轻量级本地隔离扩展到更多的硬件类型。
4、Agent 365
针对大规模部署智能体的管理需求,微软强调了可观测、可治理与可防护的重要性,并通过今年5月发布的Agent 365作为智能体的管理控制中心。
微软将现有的Entra(身份)、Defender(防御)与Purview(合规)等企业级服务扩展至智能体,确保每个智能体都能以特定身份运行并受到完整保护。
5、MDASH
MDASH是微软打造的多模型智能体安全系统,通过部署超过100个智能体,从数据流、业务逻辑和利用链进行推理,来发现可被利用的漏洞,并结合上下文提供修复建议。该系统直接呈现在Defender Portal中。
07.给智能体配齐全套软件基础设施:托管、上下文、评估全覆盖
在云端,微软也在打造完整的智能体软件基础设施。
1、Foundry智能体托管服务
在云端,微软正在把Foundry打造为完整的智能体应用平台,本月即将全面推出智能体托管服务,提供长期状态管理、自动会话隔离等功能。
他们还与Fireworks AI合作,将后者所有的开放权重模型引入Foundry。
2、Microsoft IQ
智能体时代最大的挑战已经不再是模型本身,而是如何为模型构建高质量上下文。纳德拉认为,未来软件系统的核心问题是让智能体在正确时间获得正确信息。
围绕这一趋势,微软发布了Microsoft IQ,这是一个统一的上下文层,在GitHub Copilot、Microsoft Foundry、Copilot中普遍可用,将智能体构建于世界知识和企业知识中。
Microsoft IQ由四大部分组成:
(1)Web IQ:一个与模型无关、MCP原生的网络搜索栈,可为AI模型和智能体提供即时、可验证的网络数据,包含新闻、图片、视频等等,返回相关段落的速度是次优选择的近2.5倍。Web IQ于今天正式发布。
(2)Work IQ:面向工作场景的智能层,捕捉工作在 Microsoft 365、组织系统和外部来源中实际发生的方式,涵盖人员、邮件、文档、会议,以及它们之间的关联。
(3)Fabric IQ:在结构化业务数据之上提供了共享的语义基础。
(4)Foundry IQ:将上述能力串联起来,实现对企业知识与实时互联网信息的统一检索与调度。
3、智能体评估框架
微软推出了一套开放的、端到端的信任技术栈,适用于任何框架下的AI智能体体系,并以两个开源项目为核心支撑:ASSERT(Adaptive Spec-driven Scoring for Evaluation and Regression Testing,自适应规范驱动的评估与回归测试评分),用于策略驱动型安全评估;以及智能体控制规范(Agent Control Specification),用于规范在智能体运行闭环中,应在何处、以及如何施加各类控制机制。
08.GitHub Copilot上新应用,提供多模型支持
在开发者工具方面,微软推出了全新的GitHub Copilot应用程序,支持“智能体编程会话”(Agentic coding sessions),开发者能同时启动多个会话来处理不同的问题,并利用技术建立隔离环境,实现多任务平行开发且互不干扰。
此外,它提供多模型支持,允许用户在OpenAI、Anthropic和谷歌等厂商的模型间切换。
为了超越传统聊天界面,微软引入了Canvas(画布)概念,让智能体能建构自定义UI与用户沟通。
针对后端整合,微软推出了Rayfin SDK,让智能体能轻松连接至“后端即服务”(BaaS)与Microsoft Fabric租户,解决开发中常见的身份识别、存储与数据库架构挑战。
微软还官宣了与Replit的合作,Rayfin SDK可以帮助Replit中开发的应用快速部署到Microsoft Fabric租户中。
09.新一代量子处理器登场,可靠度提升千倍
在前沿科学探索方面,微软发布了新一代量子处理器Majorana 2。这一处理器中包含的量子比特比Majorana 1中的量子比特可靠度高出1000倍,其操作可在微秒尺度上进行,平均寿命为20秒,偶尔甚至超过1分钟。
为了创建Majorana 2,微软量子团队改进了Majorana 1的材料堆栈,以创建一个更稳定的拓扑相。Majorana 2用铅取代Majorana 1的超导体铝,并将半导体活性区更新为砷化和砷化锑化物的组合。
这种材料的变化导致性能显著提高,这反映在拓扑相改进的鲁棒性中。 这一处理器中,保护拓扑量子比特免受环境噪声和错误影响的拓扑间隙,是以前量子处理器的两倍多。
基于这一进展,微软正在加快实现可扩展、实用的量子计算机的路线图。Agentic AI的助力下,微软预计在2029年实现真正可规模化的量子计算机。
在AI加速科研方面,微软今天发布了Microsoft Discovery,这是一个覆盖完整科研流程的企业级智能体AI平台,药物研发、半导体等行业的企业已在使用。此外,微软还面向更广泛的科研群体发布了免费的Microsoft Discovery本地应用,现已进入预览阶段。
10.面向智能体升级基础设施,自研芯片Cobalt 200虚拟机推出预览版
纳德拉认为,AI时代衡量云基础设施价值的核心指标是“每瓦特每美元能够生成多少Token(Tokens per Watt per Dollar)”。围绕这一目标,微软正在从能源、电力、网络、存储到芯片的每一个环节进行系统级优化。
目前,Azure已经在全球80个区域部署了超过500座数据中心,构成全球覆盖最广的超大规模云网络之一。过去18个月里,微软新增的数据中心容量已经超过Azure创立后第一个十年的总和。
数据中心本身的形态也正在发生根本转变。过去十五年,Azure主要服务于企业IT、数据库、Web服务等各种异构工作负载;而今天的新数据中心,几乎完全围绕三种AI任务设计:模型训练、模型推理、智能体运行时。
纳德拉详细介绍了代号Fairwater的微软新一代“AI超级工厂”。这一AI超级工厂从零开始面向AI设计,与英伟达深度合作,采用全新的双层架构和三维机架布局,在有限空间内实现更高密度GPU部署。
这种设计带来的直接收益是更高的网络带宽、更低的节点通信延迟、更高效的GPU利用率。
与此同时,微软还重新设计了供电体系,并优化了冷却系统。Fairwater能够在接近零耗水的状态下运行,其全年平均每日用水量大致只相当于一家普通餐厅。
在硬件层面,微软正在同时推进自研芯片和开放生态两条路线。
微软已经成为首家验证英伟达下一代Vera Rubin平台的云服务商,并持续与AMD合作推进MI300及后续产品。
与此同时,微软自研的Maia AI加速器也在快速推进。纳德拉透露,新一代Maia 200已经在美国爱荷华州投入运行,并计划于今年晚些时候扩展至更多区域。
按照微软内部测试数据,Maia 200相较当前主流GPU可实现约30%的Token/美元性能提升,并已在GPT-5.5上完成验证,未来将用于支撑Microsoft 365 Copilot等核心AI服务。
随着AI系统逐渐从单次推理转向持续运行的智能体形态,越来越多任务需要由CPU负责调度、工具调用和状态管理。纳德拉称:“未来智能体系统中,CPU和GPU的比例甚至可能接近1:1。”
面向这类工作负载,微软推出了Cobalt 200虚拟机的预览版。Cobalt 200是微软基于Arm架构打造的新一代云端CPU,于去年正式发布。与Cobalt 100相比,这款CPU在云原生工作负载上的性能提升超过50%,智能体响应延迟降低33%,执行速度提升14%,吞吐量提升23%。
网络正在成为AI基础设施的关键竞争点。纳德拉称,微软已经用MRC网络架构重构了Azure内部流量调度方式,以适应AI训练所需的大规模同步数据并行计算。同时,微软也在建设跨区域AI专用网络。
Fairwater等AI超级工厂将通过微软全球骨干网络互联,形成一个统一的计算池,实现跨数据中心资源调度和弹性扩展。
11.结语:微软要给智能体时代铺路架桥
纵观这场两个半小时的发布会,微软正给加速到来的智能体时代打造基础设施并制定规则与标准。如何让智能体更好地使用工具、融入企业既有流程,并最终成为值得信赖的数字同事,是整场Build大会试图回答的关键问题这一。
微软给出的答案是提供一整套从芯片到云、从操作系统到开发框架的垂直整合方案。在模型能力日趋同质化、逐渐走向商品化的背景下,基础设施层的综合能力,正成为影响胜负的关键因素。
本文来自微信公众号“智东西”(ID:zhidxcom),作者:陈骏达,编辑:心缘,36氪经授权发布。