为何Gemini体验越来越拧巴?好AI越用越贵,免费AI集体降智
最近这段时间,如果你只看谷歌的宣传资料,大概率会觉得Gemini已经快要无敌了。
论视频生成有Omni,图片生成有Nano Banana,Gemini 3.5 Flash性能比3.1 Pro还强,Gemini Spark还能帮你自动完成任务。从发布会到官方博客,Gemini给人的感觉就像一个六边形战士,几乎每个方向都在进步。
其实前段时间雷科技在报道Google I/O时也给出了盛赞。但这段时间真正用下来之后,小雷却越来越觉得Gemini 3.5 Flash有点拉。
(图源:谷歌)
不是那种跑分不行的拉,也不是能力垫底的拉。恰恰相反,它很多能力依然属于行业第一梯队。
问题在于,当宣传里的各种新功能真正落到日常体验上时,总会出现一种说不上来的别扭感。你明明知道它很强,却总感觉没那么好用;你明明知道很多功能已经上线了,却总有种自己没用到的感觉。
这种割裂感在最近的大模型圈其实并不少见:厂商展示的是能力上限,用户接触到的却是实际体验。前者越来越惊艳,后者却未必同步提升。
而Gemini 3.5 Flash,可能就是这种矛盾最明显的代表之一,槽点太多,不吐不快。
额度、路由、能力,体验都更拧巴了
先说最容易感受到的问题。
额度。
谷歌在I/O 2026大会前夕悄悄修改了会员订阅的额度规则,从固定消息数,改成了基于计算资源的配额(compute-based quota)。
简单来说,以前Gemini只看互动次数,图像、视频、音频和文字大模型的使用次数都是互相独立的,每24小时重置一次。
体感下来,Pro会员视频一天能生成5次,图片能生成50张,而文本根本用不完。
(图源:雷科技)
而在修改之后,谷歌同时设定了每周限额和每五小时重置的临时限额。
现在所有的任务用量都会结合Token消耗等进行计算,如果让模型思考得多,那即使它给你回复的内容不变,花的钱也比以前更多。
问题是,我怎么知道一个任务会让模型消耗多少算力?
(图源:雷科技)
不仅如此,之前分门别类的各项功能,现在都被统一归类为这个用量限额的一部分,不论是视频、图片、深度研究还是Agent,只要其中一个功能耗完限额,接下来几个小时你就啥也别想着干了。
就我自己的体验,用Omni Flash生成一个视频,差不多会消耗Pro订阅的1/3额度,如果希望修改视频,那至少要用到Pro订阅的1/2额度,真就不够用的。
比额度更影响体验的,其实是路由问题。
这可不是我的个人感受,最近不少用户都遇到过类似情况。前面还在正常生成图片,但是聊着聊着,Gemini突然开始表示自己无法生成图片,直接告诉你自己只是一个文本模型,对于这类任务无能为力。
(图源:雷科技)
最搞笑的是,甚至会出现仅提供文本不出图的情况。
(图源:雷科技)
这种情况偶尔出现还能理解,但频率高了之后,用户真的很难搞清楚到底是功能失效了,还是模型切换错了。
能力层面其实也有类似的问题。
Gemini 3.5 Flash给人的感觉一直是能做,但经常做得不够稳。同一道数学题或者推理题,有时候回答得相当漂亮,隔几个小时再问一次,结果可能完全不同。
我测试过几道经典逻辑题,很多时候它前面的分析过程都没有问题,推导链条看起来也很完整,可到了最后一步,经常会出现一些莫名其妙的失误。最离谱的是,它还特别自信,答案错了语气却一点没变。
至于更简单的计算题,该错还是错。
(图源:雷科技)
我知道,这种问题对于聊天来说无伤大雅,但如果放到学习、工作甚至编程场景里,影响就完全不一样了。
好的AI,价格只会越来越贵?
如果说前面的问题属于体验层面,那更深层的问题其实来自谷歌最近的产品和定价策略。
要我说,今年谷歌最喜欢讲的故事就是Agent。
从发布会到官方宣传,几乎所有重点都围绕着Gemini Spark展开。自动搜索资料、整理信息、执行任务,甚至帮用户完成跨应用操作,听起来确实很有未来感,也很符合大家对Agent的想象。
问题在于,你Gemini Spark居然需要Ultra订阅用户才能使用,该订阅起价每月99.99美元,最高级别订阅限时价每月199.99美元(约1352.98元)。
(图源:雷科技)
要知道,OpenAI和天下无敌的Codex,只需要每月20美元即可启用。
于是就出现了一个很有意思的现象:大家看发布会的时候觉得Gemini天下无敌,打开产品之后第一眼看到的却是升级按钮。
这种落差其实比功能缺失更容易影响口碑。因为用户知道能力存在,也知道效果不错,但偏偏自己碰不到。
至于编程的价格,其实也没便宜到哪去。
要知道,在I/O 2026大会上,谷歌CEO皮查伊可没少强调Gemini 3.5 Flash的成本优势。
按照官方价格,Gemini 3.5 Flash每百万输入Token收费1.5美元,每百万输出Token收费9美元。作为对比,Claude Opus 4.7的API定价为每百万输入Token收费5美元,GPT-5.5 Pro则直接来到了每百万输入Token收费30美元。
(图源:雷科技)
单看价格表,确实便宜不少,甚至有一种薄利多销的味道。
但价格表这东西看看就好,对于真正用模型的人来说,更重要的是完成同一个任务到底要花多少钱。
Artificial Analysis在Agent评测里做过统计,Gemini 3.5 Flash跑完整套任务的成本超过1500美元,而Gemini 3 Flash只用了不到300美元,差距直接来到了五倍以上。即便和Gemini 3.1 Pro相比,Flash的整体成本也高出一大截,甚至比GPT-5.5还贵。
(图源:雷科技)
问题出在哪?
答案很简单:太能聊了。
在Agent测试里,Gemini 3.5 Flash平均完成一个任务要接近50轮对话,而很多竞品二十来轮就已经收工。别小看这几十轮差距,每进行一次新对话,模型都要重新读取之前的历史记录,轮次越多,Token就烧得越快。
这就像打车一样,单公里价格确实便宜,可架不住你绕城跑三圈。最后结账的时候,用户看到的永远是总价,而不是起步价。
AI新矛盾:发布强的起飞,使用持续降智
说到底,我并不觉得Gemini 3.5 Flash是一个失败的模型。
事实上,它依然属于行业第一梯队。多模态能力依旧很强,视频生成依旧不错,搜索整合能力依旧是Google的看家本领。很多单项能力放到整个行业里看,依然相当能打。
问题在于强制缩水的用量限额,和因为算力短缺而频繁出现的降智问题。
(图源:雷科技)
不论谷歌怎么宣传,普通用户并不关心排行榜,也不关心Gemini 3.5 Flash有多省算力,他们关心的是能不能顺利完成任务,能不能稳定输出结果,能不能不用研究复杂的规则,也不用担心额度什么时候突然归零。
这也是为什么最近越来越多人开始怀念某些老版本模型。
要知道在大概半年前,Google AI Studio每天还会给免费用户发放50次Pro模型交互量,令人无限唏嘘。
对于Gemini来说,未来最大的希望依然是Agent。
毕竟谷歌拥有全行业最完整的生态资源,只要未来真的能够打通搜索、邮件、日历、文档和安卓系统,让Agent帮用户完成更多真实任务,那它依然有机会建立起其他厂商难以复制的优势。
只是现阶段,小雷对Gemini 3.5 Flash的评价显然不会变。