首页文章详情

OpenAI今晚放大招,奥特曼亲自上阵,GPT-5.6本周反杀

新智元2026-06-02 19:32
群雄争霸,AGI桂冠花落谁家?OpenAI今晚放大招,奥特曼亲自上阵

群雄争霸,AGI桂冠花落谁家?

OpenAI和Anthropic为争夺代码领域的霸主地位你来我往,战况激烈,从无冷场。

AGI Ranker最新Coding排行榜上,Claude Opus 4.8刚刚坐上王座。GPT-5.5的77.48分被踩在脚下,差距3.5分。

三个月内,编程王座几经易主。

第一次,Claude Opus 4.7登顶,Anthropic弹冠相庆。

第二次,GPT-5.5反超,OpenAI扳回一城。

第三次,Opus 4.8杀回来了,81.01分,Anthropic重新站上榜首。

Anthropic虽已秘密提交IPO申请,但先天算力不足,而OpenAI和谷歌DeepMind未尝不能再次赶上。

刚刚,OpenAI今晚直播预告,奥特曼或现身。

群雄逐鹿,OpenAI亮剑?

明天,OpenAI将于美国东部时间上午举行「Intelligence at Work」直播活动,奥特曼将出席。

随后,纳德拉将于美国东部时间下午发表Microsoft Build大会的开幕主题演讲。

微软预计也将在明天发布其自研的新模型。

Anthropic表示将很快推出Mythos级别的模型。

Polymarket预测GPT-5.6将在6月8日至14日之间发布的概率为68%。

这周对OpenAI来说至关重要。

Codex更新,硬刚Claude Code?

OpenAI将于明天发布一次重大的Codex更新。

数月开发,成果非凡。

Codex重大更新,不是小修小补。

据OpenAI内部透露,Codex团队为这次更新开发了数月,核心方向是让Codex从「代码补全工具」进化成「编程智能体」。

昨日,OpenAI确认,Codex及前沿模型现已在AWS Bedrock上全面可用,并将其描述为「更广泛扩展的开端」。

现在,Codex大更新随即发布,这看起来是协调一致的行动,而非巧合。

同时,奥特曼还在宣传OpenAI基金会关于社会韧性的相关工作。

这种软实力布局通常是在重大发布前后进行,而非发布中途。

此外还有个插曲:Anthropic昨天向美国证券交易委员会(SEC)秘密提交了S-1文件。

如今,这两家公司正同时竞相推进IPO和争夺智能编码领域的主导地位。

Anthropic提交S-1文件的次日早晨,OpenAI就发布了Codex的一个重要里程碑,这要么是绝佳的时机,要么就是绝佳的时机。

GPT-5.6爆料炸锅!

内部人士称模型本周即将发布,性能有望直逼Anthropic Mythos顶级水准,却只需2-3倍更低价格。

同步Codex重大升级,推理、前端生成、个性与智能体工作流全面进化,效率优化让长流程Agent真正落地,这可能是2026年最重磅AI发布!

- GPT-5.6预计将于本周发布,同时Codex也将迎来重大更新

- 它的价格大约低2–3倍,却能达到Anthropic Mythos级别的水平

- 它将在推理、前端生成、个性和智能体工作流方面带来重大改进

- 据知情人士透露,GPT-5.6本可以轻松被称为GPT-6

- 重点似乎是效率,旨在让智能体更快、更便宜,并在更长的工作流中更加实用

关于GPT-5.6的讨论并非凭空捏造,但与正式发布之间还差好几步。

据称,一个引用gpt-5.6的rollout-mapping条目短暂出现在OpenAI内部Codex日志中随后消失,而绝大多数条目指向的是GPT-5.5。

这符合金丝雀测试或有限内部探针的特征——它是进行中工作的迹象,而非发布,更不是功能列表。

Polymarket上有一个关于GPT-5.6是否会在某个日期前发布的市场。

截至2026年5月中旬,交易员认为在2026年6月30日前公开发布的概率约为80-89%

这是大众对时间的押注,只是一个概率,不是OpenAI的承诺,类似市场之前也有出错的时候。

但看发布节奏规律:OpenAI快速连续发布了GPT-5.4、GPT-5.5、GPT-5.5 Instant。

延续这一节奏再发布一个小版本更新是合理推测。「基于规律的合理推测」是三个信号中最弱的——它只能说明GPT-5.6值得期待,并不能证明它已存在或何时发布。

但有网友透露,OpenAI胸有成竹,志在必得:

GPT-5.6并非应对性发布。OpenAI志在取胜,而非追赶。

据我所知,GPT-5.6在某些方面的目标是比GPT-5.5提升12%到15%。相比许多人测得的Opus 4.7到4.8之间约6.5%的平均提升幅度,这一步幅可谓巨大。

GPT-6才是真正的动作。

该模型不仅旨在回应Anthropic的Mythos系列,更要以显著优势超越它。

这就是为什么OpenAI没有在Opus 4.8之后匆忙跟进。

Anthropic的算力困局,最强模型,最浅口袋

Anthropic的处境很微妙。

手里的牌面是顶级的。

Opus 4.8登顶Coding榜,Mythos在网安领域碾压对手,Claude Code在开发者社区的口碑持续走高。

模型能力这一项,Anthropic目前不虚任何人。

但模型能力不是唯一的战场。

Anthropic的算力来源高度依赖亚马逊和谷歌的云基础设施。

它没有OpenAI背后的微软Azure那种级别的独占算力协议,也没有谷歌DeepMind那种和硬件团队同在一个屋檐下的垂直整合优势。

IPO是Anthropic补上这块短板的关键一步。秘密提交申请已经确认,但钱什么时候到、到多少、够不够在算力军备竞赛中跟上节奏,都是未知数。

Anthropic手里有最强的模型,但口袋里没有最深的钱。

Mythos的定价策略也暴露了这个矛盾。

6倍于Opus的Token价格,说明Anthropic在用高定价来覆盖高推理成本。这在短期内可以靠能力领先撑住,但一旦竞品用更低的价格做到接近的能力,高价策略就变成了高价包袱。

IPO能不能在OpenAI追上来之前,给Anthropic续上算力的弹药?

这是整个AGI决赛最大的悬念之一。

AGI的计时赛

代码能力排行榜的王座以周为单位易手。

这件事本身,在AI历史上从未发生过。

过去的技术竞赛,领先者的优势以年计。

搜索引擎领域,谷歌领先了二十年。

移动操作系统,iOS和安卓的格局十几年没有本质变化。

但在AGI竞赛的最前沿,两家公司的差距已经压缩到了3.5分——一个季度内三次易手。

这意味着决定胜负的不再是模型本身。

当模型能力趋近时,算力、资本、生态、速度、定价策略、甚至IPO时机,每一个非技术因素都在成为胜负手。

Anthropic有最强的模型,但需要IPO来补算力。OpenAI有最深的口袋,但需要GPT-5.6来夺回王座。谷歌有最大的基础设施,但Gemini的Coding分数正在被拉开。

人类历史上第一次,两家公司以周为单位争夺「最接近通用智能」的桂冠。

今晚OpenAI亮剑之后,排行榜上的数字会不会再变一次?

81.01分的王座,还能坐多久?

参考资料:

https://x.com/GoCocoaAI/status/2061646776168296497 

https://wavespeed.ai/blog/posts/gpt-5-6-canary-leak-what-we-know/ 

https://manifold.markets/Jack1/gpt-56-released-by 

https://codersera.com/blog/gpt-5-6-release-date-whats-new-2026/ 

https://x.com/Eduardopto/status/2061148305858408734?s=20 

本文来自微信公众号“新智元”,作者:ASI启示录,36氪经授权发布。