为何Gemini体验愈发拧巴？优质AI费用攀升，免费AI集体“降智”

发布强的起飞，使用持续降智。

最近这段时间，如果你只看谷歌的宣传资料，大概率会觉得Gemini已经快要无敌了。

论视频生成有Omni，图片生成有Nano Banana，Gemini 3.5 Flash性能比3.1 Pro还强，Gemini Spark还能帮你自动完成任务。从发布会到官方博客，Gemini给人的感觉就像一个六边形战士，几乎每个方向都在进步。

其实前段时间雷科技在报道Google I/O时也给出了盛赞。但这段时间真正用下来之后，小雷却越来越觉得Gemini 3.5 Flash有点拉。

（图源：谷歌）

不是那种跑分不行的拉，也不是能力垫底的拉。恰恰相反，它很多能力依然属于行业第一梯队。

问题在于，当宣传里的各种新功能真正落到日常体验上时，总会出现一种说不上来的别扭感。你明明知道它很强，却总感觉没那么好用；你明明知道很多功能已经上线了，却总有种自己没用到的感觉。

这种割裂感在最近的大模型圈其实并不少见：厂商展示的是能力上限，用户接触到的却是实际体验。前者越来越惊艳，后者却未必同步提升。

而Gemini 3.5 Flash，可能就是这种矛盾最明显的代表之一，槽点太多，不吐不快。

额度、路由、能力，体验都更拧巴了

先说最容易感受到的问题。

额度。

谷歌在I/O 2026大会前夕悄悄修改了会员订阅的额度规则，从固定消息数，改成了基于计算资源的配额（compute-based quota）。

简单来说，以前Gemini只看互动次数，图像、视频、音频和文字大模型的使用次数都是互相独立的，每24小时重置一次。

体感下来，Pro会员视频一天能生成5次，图片能生成50张，而文本根本用不完。

（图源：雷科技）

而在修改之后，谷歌同时设定了每周限额和每五小时重置的临时限额。

现在所有的任务用量都会结合Token消耗等进行计算，如果让模型思考得多，那即使它给你回复的内容不变，花的钱也比以前更多。

问题是，我怎么知道一个任务会让模型消耗多少算力？

（图源：雷科技）

不仅如此，之前分门别类的各项功能，现在都被统一归类为这个用量限额的一部分，不论是视频、图片、深度研究还是Agent，只要其中一个功能耗完限额，接下来几个小时你就啥也别想着干了。

就我自己的体验，用Omni Flash生成一个视频，差不多会消耗Pro订阅的1/3额度，如果希望修改视频，那至少要用到Pro订阅的1/2额度，真就不够用的。

比额度更影响体验的，其实是路由问题。

这可不是我的个人感受，最近不少用户都遇到过类似情况。前面还在正常生成图片，但是聊着聊着，Gemini突然开始表示自己无法生成图片，直接告诉你自己只是一个文本模型，对于这类任务无能为力。

（图源：雷科技）

最搞笑的是，甚至会出现仅提供文本不出图的情况。

（图源：雷科技）

这种情况偶尔出现还能理解，但频率高了之后，用户真的很难搞清楚到底是功能失效了，还是模型切换错了。

能力层面其实也有类似的问题。

Gemini 3.5 Flash给人的感觉一直是能做，但经常做得不够稳。同一道数学题或者推理题，有时候回答得相当漂亮，隔几个小时再问一次，结果可能完全不同。

我测试过几道经典逻辑题，很多时候它前面的分析过程都没有问题，推导链条看起来也很完整，可到了最后一步，经常会出现一些莫名其妙的失误。最离谱的是，它还特别自信，答案错了语气却一点没变。

至于更简单的计算题，该错还是错。

（图源：雷科技）

我知道，这种问题对于聊天来说无伤大雅，但如果放到学习、工作甚至编程场景里，影响就完全不一样了。

好的AI，价格只会越来越贵？

如果说前面的问题属于体验层面，那更深层的问题其实来自谷歌最近的产品和定价策略。

要我说，今年谷歌最喜欢讲的故事就是Agent。

从发布会到官方宣传，几乎所有重点都围绕着Gemini Spark展开。自动搜索资料、整理信息、执行任务，甚至帮用户完成跨应用操作，听起来确实很有未来感，也很符合大家对Agent的想象。

问题在于，你Gemini Spark居然需要Ultra订阅用户才能使用，该订阅起价每月99.99美元，最高级别订阅限时价每月199.99美元（约1352.98元）。

（图源：雷科技）

要知道，OpenAI和天下无敌的Codex，只需要每月20美元即可启用。

于是就出现了一个很有意思的现象：大家看发布会的时候觉得Gemini天下无敌，打开产品之后第一眼看到的却是升级按钮。

这种落差其实比功能缺失更容易影响口碑。因为用户知道能力存在，也知道效果不错，但偏偏自己碰不到。

至于编程的价格，其实也没便宜到哪去。

要知道，在I/O 2026大会上，谷歌CEO皮查伊可没少强调Gemini 3.5 Flash的成本优势。

按照官方价格，Gemini 3.5 Flash每百万输入Token收费1.5美元，每百万输出Token收费9美元。作为对比，Claude Opus 4.7的API定价为每百万输入Token收费5美元，GPT-5.5 Pro则直接来到了每百万输入Token收费30美元。

（图源：雷科技）

单看价格表，确实便宜不少，甚至有一种薄利多销的味道。

但价格表这东西看看就好，对于真正用模型的人来说，更重要的是完成同一个任务到底要花多少钱。

Artificial Analysis在Agent评测里做过统计，Gemini 3.5 Flash跑完整套任务的成本超过1500美元，而Gemini 3 Flash只用了不到300美元，差距直接来到了五倍以上。即便和Gemini 3.1 Pro相比，Flash的整体成本也高出一大截，甚至比GPT-5.5还贵。

（图源：雷科技）

问题出在哪？

答案很简单：太能聊了。

在Agent测试里，Gemini 3.5 Flash平均完成一个任务要接近50轮对话，而很多竞品二十来轮就已经收工。别小看这几十轮差距，每进行一次新对话，模型都要重新读取之前的历史记录，轮次越多，Token就烧得越快。

这就像打车一样，单公里价格确实便宜，可架不住你绕城跑三圈。最后结账的时候，用户看到的永远是总价，而不是起步价。

AI新矛盾：发布强的起飞，使用持续降智

说到底，我并不觉得Gemini 3.5 Flash是一个失败的模型。

事实上，它依然属于行业第一梯队。多模态能力依旧很强，视频生成依旧不错，搜索整合能力依旧是Google的看家本领。很多单项能力放到整个行业里看，依然相当能打。

问题在于强制缩水的用量限额，和因为算力短缺而频繁出现的降智问题。

（图源：雷科技）

不论谷歌怎么宣传，普通用户并不关心排行榜，也不关心Gemini 3.5 Flash有多省算力，他们关心的是能不能顺利完成任务，能不能稳定输出结果，能不能不用研究复杂的规则，也不用担心额度什么时候突然归零。

这也是为什么最近越来越多人开始怀念某些老版本模型。

要知道在大概半年前，Google AI Studio每天还会给免费用户发放50次Pro模型交互量，令人无限唏嘘。

对于Gemini来说，未来最大的希望依然是Agent。

毕竟谷歌拥有全行业最完整的生态资源，只要未来真的能够打通搜索、邮件、日历、文档和安卓系统，让Agent帮用户完成更多真实任务，那它依然有机会建立起其他厂商难以复制的优势。

只是现阶段，小雷对Gemini 3.5 Flash的评价显然不会变。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

为何Gemini体验越来越拧巴？好AI越用越贵，免费AI集体降智

额度、路由、能力，体验都更拧巴了

好的AI，价格只会越来越贵？

AI新矛盾：发布强的起飞，使用持续降智