首页文章详情

对2026 年 AI 发展的 17 个预测

神译局2026-01-29 07:24
AI 将继续飞速演进,但对现实世界经济的影响仍将保持适度。

神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。

编者按:2026年AI泡沫不会破,但神化会碎。这是从“实验室”转场“生意场”的关键年:营收看账本,技术看落地,胜负看执行力。文章来自编译。

2025 年是 AI 发展的大年:新模型层出不穷、编程智能体(coding agents)被广泛采用、企业投资呈爆发式增长,这些都构成了全年的主旋律。这也是自动驾驶汽车大放异彩的一年。Waymo 的周订单量翻了三倍,在多个新城市开启了无人驾驶运营,并开始提供高速公路服务。特斯拉也在奥斯汀和旧金山推出了无人驾驶出租车(robotaxi)服务。

那么 2026 年会带来什么?我们邀请了八位好友分享他们的预测,我们也自己补充了九条。我们为每一项预测都标注了置信度评分;90% 置信度的预测意味着在十次尝试中应该有九次是准确的。

我们并不认为 AI 是一个即将破裂的泡沫,但我们也不认为通用人工智能(AGI)的出现会立刻引发所谓的“一飞冲天”。相反,我们预计模型的能力将持续提升,但其对整个经济产生全面影响尚需时日。

1. 科技巨头的资本支出将突破 5000 亿美元 (75%)

预测人:Timothy B. Lee

2024 年,五大超大规模云服务商——谷歌、微软、亚马逊、Meta 和甲骨文——的资本支出总额为 2410 亿美元。而今年,这些公司的支出预计将超过 4000 亿美元。

这种投入的激增是许多人认为 AI 行业存在泡沫的主因。正如我们之前报道的那样,目前科技公司的投资占经济总量的比重,甚至超过了阿波罗计划或州际公路系统建设高峰期的投入比例。许多人认为,这种水平的支出根本无法持续。

但我并不认同。像马克·扎克伯格和萨提亚·纳德拉这样的行业领袖曾表示,他们建设这些数据中心并非为了应对虚无缥缈的未来需求,而是在全力赶工以满足客户当下的订单。美国企业界对 AI 充满热情,正以前所未有的规模为新型 AI 服务买单。

我不认为 2026 年科技巨头的资本支出增长会像 2025 年那样剧烈,但我预计它仍会保持增长,全年总额最终将突破 5000 亿美元。

2. OpenAI 和 Anthropic 都将实现 2026 年的营收目标 (80%)

预测人:Timothy B. Lee

Anthropic 和 OpenAI 在 2025 年都取得了惊人的营收增长。

  • OpenAI 预计该日历年度的收入将超过 130 亿美元,并以约 200 亿美元的年度经常性收入(ARR)结束这一年。一份泄露的内部文件显示,OpenAI 的目标是在 2026 年实现 300 亿美元的营收,略高于 2025 年的两倍。

  • Anthropic 预计 2025 年的营收约为 47 亿美元。今年 10 月,该公司表示其 ARR 已增长至“近 70 亿美元”。该公司的目标是在 2026 年实现 150 亿美元的营收。

我预测这两家公司都能达成这些目标,甚至可能超额完成。过去一年中,AI 模型的能力有了长足进步,我预计即使没有更新的模型能力,企业在自动化运营方面仍有巨大的发挥空间。

3. 前沿模型的上下文窗口将维持在 100 万 Token 左右 (80%)

预测人:Kai Williams

大语言模型(LLM)有个“上下文窗口”,即其一次能处理的最大 Token(标记)数量。更大的上下文窗口允许模型处理更复杂的任务,但运行成本也更高。

2022 年 11 月 ChatGPT 发布时,它一次只能处理 8192 个 Token。在随后的一年半里,各大厂商提供的上下文窗口激增。OpenAI 在 2023 年 11 月随 GPT-4 Turbo 推出了 12.8 万 Token 的窗口;同月,Anthropic 发布了 Claude 2.1,提供了 20 万 Token 窗口。谷歌则在 2024 年 2 月通过 Gemini 1.5 Pro 提供了 100 万 Token,随后又扩展到了 200 万 Token。

自那以后,进度开始放缓。Anthropic 自 Claude 2.1 以来一直未改变其默认上下文大小。GPT-5.2 的上下文窗口为 40 万 Token,还不及去年 4 月发布的 GPT-4.1。而谷歌最大的上下文窗口也缩减到了 100 万。

我预计 2026 年上下文窗口将保持相对稳定。正如 Tim 在 11 月解释的那样,更大的上下文窗口会触及 Transformer 架构的局限。对于目前大多数任务而言,较小的上下文窗口更便宜且同样有效。2026 年可能会出现一些专门针对编程的模型,这类模型需要读取整个代码库,因此会有更大的窗口。但我预测通用前沿模型的上下文长度在明年基本会维持现状。

4. 美国实际 GDP 增长率将低于 3.5% (90%)

预测人:Timothy B. Lee

在 AI 圈的某些角落,2027 年已经获得了一种图腾般的地位。2024 年,前 OpenAI 研究员 Leopold Aschenbrenner 撰写了一系列广为流传的文章,预测 2027 年将“一飞冲天”。随后在 2025 年 4 月,一个顶尖研究团队发布了《AI 2027》,对 AI 的迅猛进展做了详细预测。他们预言到 2027 年假期季,GDP 会“大涨”。其中一位作者甚至暗示,这最终可能会让美国的 GDP 年增长率高达 50%。

他们没有对 2026 年做出具体预测,但如果这些预言接近事实,我们应该在 2026 年底看到迹象。如果我们正处于 AI 驱动的经济起飞边缘,这理应转化为高于平均水平的 GDP 增长,对吧?

因此我的预测是:2026 年第三季度的扣除通胀后的 GDP 增长率,相比 2025 年第三季度,不会超过 3.5%。在过去十年中,美国 GDP 的同比增速仅在 2021 年底和 2022 年初超过 3.5%,那是由于疫情后的经济复苏。除此之外,实际 GDP 的同比增速一直维持在 1.4% 到 3.4% 之间。

我预计 AI 行业将继续保持健康的增长步伐,这会给美国经济带来适度的提振。事实上,数据中心的建设在过去一年里支撑了经济增长。但我预计这种支撑作用仅占百分之零点几,不足以让整体经济增长超出常规范围。

5. AI 模型将能完成耗时 20 小时的软件工程任务 (55%)

预测人:Kai Williams

AI 评估机构 METR 在今年 3 月发布了这张图表的最初版本。他们发现,顶尖 AI 模型能够以 50% 的成功率完成的软件工程的任务时长,每七个月就会翻一番。请注意,该图表的 Y 轴是对数刻度,因此直线代表指数级增长。

到 2025 年中期,LLM 的发布速度似乎加快了,仅用五个月就实现了任务时长的翻倍。据 METR 估计,11 月发布的 Claude Opus 4.5 已经能以至少 50% 的成功率完成人类需要近 5 小时才能处理的软件任务。

我预测这种加速趋势将在 2026 年持续。随着首批吉瓦(GW)规模的计算集群在明年初投入使用,AI 公司将获得极其庞大的算力资源,同时编程智能体也在加速 AI 的开发进程。不过,也有理由保持审慎。无论是预训练(通过模仿学习)还是后训练(通过强化学习),其收益递减效应都已初显。

无论结果如何,METR 的趋势线是否能维持是一个关键问题。如果加速趋势线能够保持,最强大的 AI 模型将能在 20 小时的软件任务上达到 50% 的可靠性——这相当于软件工程师半个工作周的工作量。

6. AI 爆发初期那种“法律混战”的局面将彻底终结 (70%)

预测人:James Grimmelmann,康奈尔科技学院及康奈尔法学院教授

到目前为止,在那些关乎存亡的诉讼中,AI 公司占据了上风。最典型的例子是,美国、欧盟和英国的法院都裁定,训练模型本身不构成侵犯版权。但在其他方面,法院正开始施加实质性的运营限制。Anthropic 支付了 15 亿美元以和解有关其在影子图书馆下载内容上进行训练的指控,多家法院也已经判定或建议,它们必须建立起防止产出侵权内容的实质性防线。

我预计这一趋势也会延伸到版权之外:法院不会直接勒令 AI 公司倒闭,但如果这些公司不采取合理措施来预防造成那些显而易见的损害,法院将开出巨额罚单。可能还需要一个杀鸡儆猴的典型——我赌是 Perplexity——但我预计 AI 公司在 2026 年会深刻领会到这个信号。

7. AI 在 2026 年不会引发任何灾难 (90%)

预测人:Steve Newman,《Second Thoughts》作者

人们普遍担心 AI 最终可能导致各种灾难性后果。比方说,先进的 AI 可能协助制造化学或生物武器,或者发起毁灭性的网络攻击。这并非完全是假想;Anthropic 最近就发现一个团体利用其编程智能体工具,在极少的人为干预下实施网络攻击。此外,AI 在这些领域的先进能力已开始显现。

然而,我不认为 2026 年会出现任何重大的“AI 灾难”。更准确地说:不会出现 AI 在其中起到关键助推作用的重大实体或经济灾难(其规模远超以往同类事件)。比方说,不会出现具有异常影响力的生物、网络或化学攻击。

原因何在?技术找到实际应用所需的时间总是比预期的要长,即使是恶意应用也不例外。而且 AI 模型供应商也正在采取措施,增加其模型被滥用的难度。

当然,人们可能会倾向于把原本就会发生的事情归咎于 AI,就像某些科技公司首席执行官将疫情期间过度招聘导致的裁员甩锅给 AI 一样。

8. 像 OpenAI 和 Anthropic 这样的大型 AI 公司将停止对 MCP 的投入 (90%)

预测人:Andrew Lee,Tasklet 首席执行官

模型上下文协议(MCP)旨在为 AI 助手提供一种与外部工具和数据源交互的标准方式。自 2024 年底推出以来,它迅速走红。

但问题在于:现代 LLM 已经足够聪明,只要给它们一个常规 API 的描述,它们就能直接推理出如何使用它。而那些 MCP 服务器提供的描述?它们要么已经固化在训练数据中,要么在公开网站上随处可见。

直接访问 API 的智能体可以更加简洁、灵活,并且能够连接到任何服务,而不仅仅是那些支持 MCP 的服务。

到 2026 年底,我预测 MCP 会被视为一种冗余的抽象层,它增加了复杂性却没有带来实质性的好处。主流供应商将停止对其的投入。

9. 一家中国公司的全球无人驾驶出租车车队总规模将超越 Waymo (55%)

预测人:Daniel Abreu Marques,《The AV Market Strategist》作者

Waymo 拥有世界级的自动驾驶技术、广泛的监管认可和成熟的多城市运营模式。但车辆供应仍是一个主要瓶颈。Waymo 计划在未来几个月开始使用中国汽车制造商极氪(Zeekr)的车辆,但关税壁垒和地缘政治压力将限制极氪车队的规模。Waymo 还与现代汽车签署了协议,但量产可能要到 2026 年后才会开始。因此,在未来的一年里,其车队规模只会缓慢增长。

中国的自动驾驶参与者面临的限制则有所不同。像小马智行(Pony.ai)、百度萝卜快跑(Apollo Go)和文远知行(WeRide)等公司已经展示了量产能力。比方说,小马智行在推出第七代平台时,其物料清单成本降低了 70%。这些中国公司正在中国、中东和欧洲同步扩张车队。

目前,Waymo 的商业车队约有 2500 辆车。中国规模最大的公司可能是小马智行,拥有约 1000 辆车。小马智行的目标是到 2026 年底达到 3000 辆车,而 Waymo 若要实现周订单 100 万单的目标,则需要 4000 到 6000 辆车。

但如果 Waymo 的供应链因不可预见的问题或延误而扩张慢于预期,而中国玩家继续提升产能,那么到 2026 年底,至少会有一家中国公司的全球无人驾驶出租车车队总规模超越 Waymo。

10. 首款全自动驾驶汽车将面向消费者开售,但它并非来自特斯拉 (75%)

预测人:Sophia Tung,《Ride AI》通讯内容编辑

目前,许多私家车都配备了先进的驾驶辅助系统(行业术语称为“L2 级”),但还没有哪款车能实现完全无人驾驶(“L4 级”)。我预测这一现状将在 2026 年发生改变:届时你将能买到一辆可以在无人驾驶状态下运行的汽车——至少在某些特定区域内可以实现。

Tensor(前身为 AutoX)是可能提供这类车辆的其中一家公司。Tensor 正在与那些已经在美国交付车辆且更有进取心的年轻车企(如 VinFast)合作进行制造和集成。虽然制造门槛很高,但并非不可逾越。

很多人期待特斯拉能交付首款全自动驾驶私家车,但我认为这不太可能。特斯拉目前的处境相当安逸。它的辅助驾驶系统在大多数时候表现良好,用户认为它“基本上”就是一套全自动驾驶系统。虽然在无人出租车市场落后 Waymo 多年,但这并未损害特斯拉在粉丝心目中的信誉。因此,即使像 Tensor 这样名不见经传的初创公司在特斯拉之前推出了面向消费者的无人驾驶汽车,特斯拉大概率仍能留住客户的忠诚度。

Tensor 有极强的动力去争夺市场的“首发”名号。它可以推出一款在极小范围内实现无驾驶员运行的车辆,并宣称赢得了“市场第一”。Tensor 运营着无人出租车测试项目,因此了解其中的风险。相比之下,特斯拉可能不想为系统导致的事故承担法律责任。因此,我预计特斯拉会采取观望态度,看 Tensor 表现如何,再调整自己的策略。

11. 特斯拉将在至少一个城市开始向公众提供真正的无人驾驶出租车服务 (70%)

预测人:Timothy B. Lee

今年 6 月,特斯拉兑现了埃隆·马斯克在奥斯汀推出无人驾驶出租车服务的承诺。但这种方式有些“取巧”:主驾驶座虽然没人,但每辆 Robotaxi 的副驾驶座都配有一名安全监管员。当特斯拉开始在旧金山湾区提供 Robotaxi 试乘时,那些车上甚至配有安全驾驶员。

这是马斯克在自动驾驶技术上“过度承诺却未达预期”的又一例证。这导致许多特斯拉质疑者彻底否定了其自动驾驶计划,认为特斯拉目前的方案根本无法实现真正的全自动。

但我并不认同。马斯克往往最终能实现那些宏大的技术目标。而且特斯拉的自动驾驶技术确实在取得实质进展。事实上,在 12 月中旬,社交平台上开始流传特斯拉汽车在公路上空无一人行驶的视频。我认为这预示着特斯拉已经接近推出真正的无人驾驶车辆,即车内不需要任何特斯拉员工。

在特斯拉粉丝过于兴奋之前,值得注意的是,Waymo 早在 2020 年就开始了首个全无人驾驶服务。尽管如此,Waymo 直到 2023 年才将商业服务扩展到第二个城市(旧金山)。Waymo 早期的无人车非常谨慎,高度依赖远程协助,这使得快速扩张变得不切实际。我预计特斯拉也会面临同样的情况——真正的无人驾驶 Robotaxi 会在 2026 年到来,但技术和物流方面的挑战将限制其扩张速度。

12. 文本扩散模型将进入主流视野 (75%)

预测人:Kai Williams

目前的大语言模型是“自回归”的,这意味着它们一次生成一个 Token。但这不是 AI 模型生成输出的唯一方式。另一种生成类型是“扩散”(Diffusion)。其基本思想是训练模型逐步去除输入中的噪声。配合提示词,扩散模型可以将随机噪声转化为清晰的输出。

曾几何时,扩散模型是制作图像模型的标准方式,但如何将其应用于文本模型并不明朗。2025 年,这一局面发生了改变。2 月,初创公司 Inception Labs 发布了针对编程的文本扩散模型 Mercury;5 月,谷歌宣布 Gemini Diffusion 开启测试。

与标准模型相比,扩散模型有几个关键优势。首先,它们的速度要快得多,因为它们可以一次性生成多个 Token。此外,根据卡内基梅隆大学研究人员 7 月的一项研究,它们学习数据的效率也可能更高。

虽然我不指望扩散模型能取代自回归模型,但我认为该领域将获得更多关注。至少会有一家成熟的实验室(无论是中国的还是美国的)会发布一款基于扩散技术的 LLM 供主流用户使用。

13. 将出现一个募资至少 2000 万美元的反 AI 超级 PAC (70%)

预测人:Charlie Guo,《Artificial Ignorance》作者

AI 已成为承载各种焦虑的容器:虚假信息、监控、心理健康、水资源消耗,以及对“大科技”权力的普遍担忧。因此,反对 AI 正迅速成为一个两党共同关注的议题。例如在 6 月,泰德·克鲁兹曾试图在预算调整法案中加入暂停 AI 监管的条款(类似于特朗普总统最近的行政令),但最终以 99 比 1 的投票结果惨败。

有趣的是,目前至少有两个资金充足的亲 AI 超级政治行动委员会(super PAC):

  • 一个是“Leading The Future”,拥有来自硅谷知名投资者的 1 亿多美元注资;

  • 另一个是“Meta California”,拥有来自 Facebook 母公司的数千万美元支持。

相比之下,反 AI 阵营尚缺乏同样组织化的抗衡力量。这种不稳定的平衡状态难以持久,我预计到 2026 年底,将会出现一个专门致力于游说反对“AI 友好型”政策的组织。

14. 将 AI 与自杀关联的新闻报道将增加两倍,但实际自杀人数并不会增加 (85%)

预测人:Abi Olvera,《Positive Sum》作者

我们已经看到了媒体对 Character.AI 诉讼案等案件的大规模报道,当时一名青少年的自杀成为了全美焦点。我预计到 2026 年,涉及 LLM 的自杀事件将吸引更多的媒体关注。具体而言,我预测 2026 年媒体数据库中同时提到“AI”和“自杀”的内容将至少是 2025 年的三倍。

但报道的增加并不意味着死亡人数的增加。美国的自杀率很可能会维持在其基准趋势上。

在 2000 年以来几乎持续稳步上升后,美国的自杀率目前处于历史高位附近。尽管 2023 年该比率依然高企,但最新数据显示 2024 年已出现显著下降。我预计自杀率将保持稳定或下降,脱离 2018 年和 2022 年的高峰,回归平均水平。

15. 美国开放权重模型将追上中国模型 (60%)

预测人:Florian Brand,《Interconnects》通讯编辑

2024 年底,阿里巴巴推出的 Qwen 2.5 超越了美国最强开源模型 Llama 3。到了 2025 年,我们见证了大量极其优秀的中国模型——DeepSeek R1、Qwen3、Kimi K2,而美国的开源模型开始掉队。Meta 的 Llama 4、谷歌的 Gemma 3 等虽然在同等参数量下表现出色,但未能触及技术前沿。美国对开放权重模型的投资开始显得乏力,从夏季开始就有传闻称 Meta 正在转向闭源。

但明年情况可能会有所改观。通过像 ATOM 项目(由 Interconnects 创始人 Nathan Lambert 领导)这类倡议,更多的西方公司表现出对构建开放权重模型的兴趣。2025 年底,美国和西方出现了一批扎实的开源模型,如 Mistral 3、Olmo 3、Rnj 和 Trinity。虽然目前这些模型在基础性能上仍稍逊一筹,但我预测 2026 年这种局面将随着西方实验室发力而改变。美国公司依然拥有雄厚资源,像英伟达这样在 12 月宣布将发布 5000 亿参数模型的机构,似乎已做好了重金投入的准备。

16. 一年后 Vibes 的活跃用户数将超过 Sora (70%)

预测人:Kai Williams

今年秋天,OpenAI 和 Meta 都发布了短视频生成平台。最初,Sora 吸引了所有的目光:这款应用搭载了全新的视频生成模型,并具有一个能制作好友深伪(deepfake)视频的巧妙机制。而 Meta 的 Vibes 最初表现平平。Sora 迅速登顶苹果应用商店榜首,而包括 Vibes 在内的 Meta AI 应用则一直在 75 名左右徘徊。

然而现在,形势似乎发生了逆转。随着 AI 视频的新鲜感退去,用户对 Sora 的最初热情已显疲态。与此同时,Vibes 虽然增长缓慢但步履不停,据《商业内幕》报道,它在 11 月中旬的日活用户已达到 200 万。如今,Meta AI 应用在应用商店的排名已经超过了 Sora。

我认为这种逆转还将持续。从个人体验来看,Sora 的推荐算法显得非常笨拙,而 Meta 非常擅长通过打造吸引人的产品来扩大用户群。在运营社交类应用方面,永远不要低估马克·扎克伯格。

17. 反方观点:一年后 Sora 的活跃用户数将超过 Vibes (65%)

预测人:Timothy B. Lee

这是我和 Kai 产生分歧的少数几个地方之一,所以我认为把双方的观点都亮出来会很有趣。

我起初被 Sora 巧妙的产品设计所打动,但自从我 10 月写完评论后,这款应用就没能再吸引我的注意力。不过,在那篇评论的末尾,我曾说过:

我预计随着 Sora 受众的扩大,里面的笑话会变得更有趣。另一个显而易见的方向是获取好莱坞的内容授权。我预计许多用户会非常愿意把自己放进《哈利·波特》、《星球大战》或其他著名虚拟世界的场景中。目前,由于版权担忧,Sora 会生硬地拒绝此类请求。但如果 OpenAI 肯向这些版权方支付足够巨额的支票,情况就会改观。

事实正是如此。OpenAI 刚与迪士尼签署了授权协议,允许用户制作自己与迪士尼旗下角色的互动视频。这一授权在首年是排他的。我预计这将极大地提升用户对 Sora 的兴趣。毕竟,制作一段自己的假视频挺无聊的,但如果能制作一段自己与卢克·天行者或钢铁侠互动的视频,那可就太有吸引力了。

如果只是给用户一个空白的提示词框,我怀疑效果不会太好,因此充分利用这一机会需要精妙的产品设计。但山姆·奥特曼在将极具潜力的模型转化为引人入胜的产品方面,已经展示出了极高的天赋。虽然不能保证他在 Sora 上也能大获全胜,但我猜他能搞定。

译者:boxi。