卖token的卷成了“外卖”,卖铲子的直接“印钱”
AI 这一轮,利润仍然在往最硬的环节集中。
简单来说,AI上游把整个产业链烧的钱快吸光了。
先看几组数字。
美光最新一个季度,营收 414.56 亿美元,营业利润 333.18 亿美元,营业利润率 80.4%。公司下一季度指引更猛,营收约 500 亿美元,毛利率约 86%。
SK 海力士 2026 年一季度,营业利润 37.61 万亿韩元。
三星 2026 年一季度,半导体 DS 分部营业利润 53.7 万亿韩元。虽然这个口径不全是存储,但官方自己点得很明白,核心驱动力就是 AI 需求、Memory 创新高、行业涨价。
把海力士、三星 DS 和美光放在一起看,三家单季营业利润合计,粗算已经接近 1000 亿美元。
对比一下。
英伟达同期单季营业利润,大约 535 亿美元。
也就是说,这三家加起来,单季营业利润已经明显高过英伟达。
老大哥达子和苹果,都不得不向存储大厂低头。
再换个参照物。
科创板 608 家公司,2025 年全年归母净利润合计 586.24 亿元人民币。
而海力士、三星 DS、美光三家,一个季度的营业利润,折成人民币,大约是这个数字的 10 倍以上。
这就是现在 AI 产业链最直白的一幕:
模型层在降成本,而且是被迫降。
OpenAI 这边,API 价格已经卷到非常细:不同模型、不同上下文长度、缓存输入、批处理折扣,全都拆开卖,本质就是在不断压低单位 token 成本,同时提高利用率。
价格越来越透明,竞争越来越直接。
Google Gemini 也是同一套逻辑,分层定价、不同能力对应不同价格,甚至在企业侧不断打包优惠,本质还是在抢量、抢调用。
微软更直接,一边自己做模型,一边把第三方模型(包括 DeepSeek)接进 Azure AI Foundry,让客户可以横向对比、随时切换。
这种“模型超市”模式,本质上进一步压缩了单一模型的议价能力。
国内也一样。
字节的豆包,之前主打低价甚至接近免费,现在也开始逐步收费、分层定价。原因很简单:算不过来了。
调用量一上来,成本直接爆炸,最后发现钱基本都花在 GPU 和存储上,模型本身反而成了“薄利多销”的生意。
换句话说,模型公司在前台拼价格、拼能力,但后台的成本结构越来越刚性。
另一边,存储层在吃利润。
HBM、server DRAM、eSSD,这些东西不是你想扩就能立刻扩出来的。供给释放慢、验证周期长,但需求却被 AI 数据中心、训练、推理、Agent 一起往上顶。
结果就是:价格涨,利润直接体现在报表里。
模型公司在卷价格,存储公司在收现金。
所以现在看 AI,不能只看谁模型最强,还得看谁最卡脖子。
卖 token 的越来越像“外卖”:单量可以越来越大,但价格越来越透明,竞争越来越激烈,平台和商家都在不断让利。
卖铲子的更像“收费站”:你要建数据中心,你要做推理,你要上 Agent,你就得先把钱交出去,而且这个钱很难省。
至少在这一阶段,AI 产业链里最夸张的利润,不在前台卖智能的地方,而在后台卖内存和存储的地方。
在存储和半导体硬件面前,一切公司都成了老登。
本文来自微信公众号 “吴怼怼”(ID:esnql520),作者:吴怼怼,36氪经授权发布。