腾讯、网易前员工组队,把蔡浩宇押注的AI世界成本砍下来80%
前不久,蔡浩宇创办的AI公司Anuttacon公开了一项名为Agentopia的研究。
研究团队搭建了几个虚拟场景,让100个智能体在其中生活了整整10个模拟年。
在这10年里,智能体会交朋友、换工作、接受心理辅导,做出诸如此类的社会行为,研究者再从中筛选表现较好的“人生经验”,用于训练模型的角色扮演能力。
构建这样一个AI世界,为的自然是以后的游戏里能出现更符合直觉、看起来更自然的NPC。
但如果从研究走向游戏,一重现实会拦在面前:NPC每周规划一次生活需要多少钱?每晚总结一遍记忆又要消耗多少Token?最终带来的乐趣,能不能覆盖背后的模型成本?并且更关键的是,这些成本会随着玩家的长线游玩,变得越来越多。
这几乎是目前商业化的AI游戏共同面对的一笔账。但最近,一支国内AI游戏团队给出了两个颇为夸张的数据。
奥拓盖母(AutoGame)团队的成员向竞核透露,在他们的游戏《麦琪的花园》最近的版本中,游戏整体的AI相关Token成本相比他们过去降低了约80%;在生成道具、生成关卡等特定业务上,成本最高降低了约96%。
如果从新品节前三天(6月12号)一直算到今天为止,将近一个月的时间里,大致有1W名左右的玩家下载并体验了游戏,而《麦琪的花园》在大模型服务上花费的成本不到200刀——这可能比一些Vibe Coding的小体量游戏开发还要便宜。
如果要在已经公开的国产商业游戏中,寻找一款与Agentopia命题相近的产品,《麦琪的花园》也算是候选之一。
目前奥拓盖母的团队约有13人,其中一些成员来自腾讯、网易、吉比特、冰川等游戏公司,参与过百亿级流水的项目,也有成员具备算法与AI相关经验。
《麦琪的花园》从2023年年底开始开发,团队此后完成过三轮融资。在斯坦福小镇的概念出现之后,它应该算得上目前国内最早、完成度最高,也最有可能真正落地商业化的产品。前段时间,游戏首次参加了Steam新品节,竞核也借此试玩了最新版本,并和团队成员们聊了聊,看看《麦琪的花园》这样一款称得上明星级的产品做到什么程度了。
一场雨六块钱
如果暂时关掉AI,《麦琪的花园》首先是一款像素风的沙盒冒险游戏,它的基础玩法会比较像《星露谷物语》或者《环世界》。
玩家扮演一名退休勇者,在奥兹大陆建设营地、种田采集、制作装备,也可以进入矿洞和不同生态区域探索、战斗。它有一套相对传统的资源循环和冒险框架,也支持最多四人联机。
AI则被放在了角色、任务和内容生成的位置。玩家可以通过文字描述或上传图片,在酒馆里招募一名AI伙伴,除了外貌以外,还可以设定它的性格、职业和背景故事;招募完成后,这些角色会加入队伍、参与战斗,也能被安排去砍树、采集,承担营地里的日常工作。
继续相处下去,它们还可能依据自己的背景提出新任务,并进一步生成任务地点、剧情和道具。
官方展示中,根据歌姬背景生成的舞台歌唱剧情
这些能力并不只停留在宣传文本里。早在去年的测试中,玩家就已经可以创建角色,让它们参与战斗与生产,并在长期相处后触发新的任务和故事;现在游戏则依旧可以在Steam上下载,供想要体验的玩家参与测试。
但真正把AI角色交到玩家手里之后,奥拓盖母面对的问题也发生了变化。
随着更多玩家进入,大家向NPC提出的要求也开始超出团队原本划定的范围。有玩家会直接要求路边的NPC去做饭,也有玩家会直接询问某件道具位于哪个方向;此时,NPC不仅要理解语言,还要读取周围环境、判断自己的能力,并将一句回答转化成实际行动。
如果完全不考虑成本,这些问题并非无法解决。按照团队的说法,只要把更多游戏数据交给模型,开放更完整的环境感知、行动规划与寻路能力,再换用足够强的模型,总能通过“力大砖飞”的方式接近玩家想要的效果。
但在一款面向大量用户、希望长期运行的商业游戏里,这种办法显然很难持续。NPC每多感知一项信息、多作出一次判断,背后都可能增加新的模型调用;等玩家数量和游玩时间增长以后,那些单次看来不算夸张的消耗,也会迅速积累成一笔无法忽视的成本。
奥拓盖母内部曾经测试过一个更复杂,也更能说明问题的设计:假如某个地区长期下雨或者长期不下雨,NPC会观察天气变化,推测某类道具可能涨价,并且自动生成一个道具作为商品,然后主动找到玩家推销。
天气、经济和NPC行为由此串在了一起,NPC根据世界状态作出了自己的判断,这正是很多人想象中的AI世界。从逻辑上来说,这和Agentopia中的智能体社会并不遥远:角色持续读取环境,根据自己的处境作出判断,再把判断转化成具体行动。区别在于,研究项目只需要证明这种现象能够发生,商业游戏则要为它的每一次发生支付成本。
所以当他们进一步计算成本时就发现,完成这一整套事件的链路,可能需要消耗约6元的大模型成本,而且大模型在这个过程中会持续产生大量无用的信息。
这笔钱玩家不一定会愿意承担,那解决的办法就只剩下一条。
如何降本
对奥拓盖母来说,解决问题的方法显然不能像实验室环境里那样,继续增加预算、换用更强的模型。过去几个月里,他们做的事情恰恰相反:重新拆解《麦琪的花园》里已经实现的AI功能,判断哪些环节真正需要调用大模型,哪些结果可以通过工程管线、游戏规则与代码兜底来完成。
这项工作由四名成员持续进行了约四个月,涉及模型调优、管线调整、成果筛选等等,最终得到的结果就是开头提到的两个数字。
这种拆分能力与奥拓盖母大多由大厂前员工组成的团队多少有些关系,他们在AI视野方面看得也比较远。相比将大模型视作一个能够包办所有功能的黑箱,制作组的成员们更倾向于把AI看作游戏工程中的一个模块,再判断模型、程序和策划各自应该处理什么问题。
尽管我们没法知道他们具体做了些什么,但主策苦丁给我们举了一个例子:对于大部分AI开发者而言,大家都能在开发过程中意识到某些大模型的优势,比如哪一款模型“人味”比较重,哪一款又更擅长数据。在实验室或原型开发阶段,选择这些价格偏高的模型自然是合理的。
但考虑到商业因素,好用的模型可能会下架,游戏自然也想尽可能减少受到模型厂商变化的影响。随着模型迭代,某个便宜模型的能力可能发生变化,如果产品的优势来自于模型厂商,那么为了保持原有质量,团队便只能换用更新、更强,同时也更加昂贵的版本。
因此,他们做的思路其实不复杂,就是弄清楚某类角色应该怎样表达,玩家需要什么样的反馈,便可以通过提示词、角色背景、规则与代码兜底,在价格更低的模型上复现相近效果。
团队需要优化的并不是一个抽象的“AI智力”,而是游戏中的具体问题:一名沉默寡言的NPC应该怎样说话,角色被拒绝以后需要表现得多生气,一件根据任务经历生成的道具,必须包含哪些信息才能继续参与后续玩法。
这些问题拆得足够清楚以后,并不是每项功能都需要最强的模型。这要求团队掌握的不只是各家模型的能力差异,还要具备为体验下定义的能力。
这项工作在今天变得更加重要,原因是因为如今市面中的AI游戏希望实现的功能增长得相当快。
早期产品可能只需要把玩家的一段话发送给模型,再接收一段回答;如今,仅仅做到自由聊天,已经很难成为足够有力的产品卖点。大多数作品为了让角色真正参与游戏,模型还要读取人物背景、长期记忆、队伍关系、环境状态和当前任务,再将生成结果交给游戏系统执行。
像竞核曾报道过的《AI2U》或者《代号:黑箱》都在试着用AI在游戏内实现更多的功能。
由于每增加一项能力,都会带来更多上下文、更长的输出和更多次模型调用。因此,即使单个Token的价格持续下降,一次完整玩法所消耗的Token仍可能变得更多。这也解释了一个看似矛盾的现象:模型厂商的Token越来越便宜,但一款真正试图让角色参与世界运行的AI游戏,依然很贵。
到了这个阶段,AI游戏比拼的已经不只是模型接入能力。谁能以更便宜、更稳定的方式,持续提供玩家真正需要的智能效果,可能才是产品能否长期运行的关键。
不过,即便成本已经砍掉80%,剩下的20%依旧需要有人付钱。
把黑箱打开
苦丁说,他们认为目前市面上的AI游戏,大致只有三种处理模型成本的思路。
第一种是按照对话、回合或者Token消耗收费,《历史模拟器:崇祯》采用的便是这类模式。它最接近模型厂商本身的计费方式,玩家使用多少便支付多少,团队不必承担过重的长线成本。但问题也很明显,如今这种持续付费的模式偏向早期的点卡模式,现在的玩家则大多习惯了free-to-play或买断制的体验。
《历史模拟器:崇祯》在上线后因此遭遇过舆情,AI情感陪伴产品《EVE》或多或少也撞上过这堵墙。
第二种是免费开放AI能力,或者采用一次买断,再由开发团队的其他业务和收入补贴后续成本。这类方式对玩家最友好,却很难随着用户规模持续扩大;游戏越受欢迎、玩家游玩时间越长,团队需要承担的模型费用反而越高。
第三种则是将模型消耗封装成玩家能够理解的具体商品。奥拓盖母正在尝试这条路。
这条路的原理是,玩家不会为Token本身付费,但会为自己能够感知的游戏内容付费。
“招募一名AI NPC”是一件相对容易理解的事情。玩家写下角色背景,设定性格、职业和说话方式,最终得到一名可以参与战斗、生产和生活的伙伴;这个角色还可能继续生成任务、故事和道具,也能通过独立标识码分享给其他玩家。
因此,《麦琪的花园》准备把主要收费窗口放在角色创建与复制上。
按照团队目前的设想,玩家购买游戏以后,可以正常体验传统玩法和基础AI功能,只有在大量创建原创角色、复制其他玩家的角色,或者使用部分成本难以覆盖的功能时,才需要额外付费。对于模型有特殊需求的重度用户,未来也可能允许其接入自己的API。
换句话说,对玩家来说原先可能不确定的AI token其实是一个完全无法理解的黑箱,人们没有道理为这样的产物心甘情愿地付费;但假如把它换算成具体的某一个角色,这条路也许就能跑通了。
当然,这仍然只是一套等待验证的成本模型。他们也承认,如果一名玩家购买游戏以后,长期高强度地与NPC对话,他们也可能会在这名用户身上亏钱。
比如之前出现过的《刀锋Blade》被薅羊毛事件
不过团队的判断比较乐观,沙盒游戏本身具有角色分享和多人传播属性,一名愿意长期游玩的核心用户,也可能为游戏带来新的玩家;多出来的模型成本,某种程度上可以被视为换取口碑传播的费用。
当然,在成本之外,现在摆在《麦琪的花园》正式EA前还有一些工作要做。比如他们目前想继续调整一些前期流程与新手引导。
相比此前的测试,这次《麦琪的花园》放出了近5个小时的主线内容,这些内容其实都是引导玩家能更深地理解自己能在游戏世界里做什么的引子。在一些可能破坏游戏沉浸感的细节上,他们也做足了功夫,比如说把生成角色时的等待时间自然地内化成了一个招募中的事件;或者当玩家在游戏里创建一个奥特曼的时候,游戏不会直接把一个来自光之国的巨人塞进游戏,而是将其重新解释成奥兹大陆能够容纳的角色。
团队的运营老王给我举了另一个例子,完全开放的AI可能就像一块橡皮泥,理论上,玩家想捏什么都可以,但结果难以预测,成本也很难控制;《麦琪的花园》更希望像一套积木,每块积木都有固定的形状,玩家可以自由组合,探索游戏的边界。
如果你关注过奥拓盖母此前的采访,也会意识到,这是他们提出的“底座游戏”的概念,即游戏提供一块土壤,其他的内容由玩家和AI去生长。
从这个角度看,奥拓盖母对成本和玩法采用的其实是同一种思路。他们没有把一切交给模型,而是将近乎无限的生成能力拆成角色、任务和道具等具体模块,再让这些内容进入游戏原有的生产、战斗和探索循环。
相比过去AI行业总是强调的无限世界、无限对话,这种世界显然更可信,也更好玩。
本文来自微信公众号“竞核”(ID:Coreesports),作者:唐宸尧,36氪经授权发布。