刚刚,Seedream 5.0上线,字节又一新模型
Seedance 2.0的热度还没下去,字节新模型又来了!
智东西2月10日报道,今日,字节图像生成模型Seedream 5.0在视频编辑应用剪映、剪映海外版Capcut、字节AI创作平台小云雀均已上线,在即梦AI平台开启灰度测试,图片生成可限时免费体验。
▲Capcut官宣截图(左)、小云雀主页模型选择(右)
Seedream 5.0的图像支持2K和4K分辨率输出,2K为图片生成直出,4K为AI增强后的分辨率。根据Capcut官网,新模型5.0的升级点为首次支持检索生图,对提示词的理解准确性增强、支持更细节、精致纹理的图像生成,还允许用户精确调整图像。Seedream 4.5于2025年12月4日上线。
智东西实际体验并对比了Seedream 5.0与Nano Banana Pro、Seedream 4.5,发现新模型可以理解“静谧科技感”等抽象提示词,但最后的生成效果相比Seedream 4.5很难说有跨越式提升,其联网搜索能力尚不稳定、生成效果升级点体现在更美观、多样化上。
Capcut的官宣推文里提到,Seedream 5.0可与Nano Banana Pro对标,且更便宜,目前所有用户可免费使用20次,美国地区之后上线。有网友对比了Nano Banana Pro、ChatGPT、Seedream 5.0、Grok Imagine Image的生成效果,其提示词为:生成一张高质量的信息图,解释在特拉普修道院制作啤酒的过程,并配有丰富的插图。
▲第一排从左至右为Nano Banana Pro、ChatGPT生成,第二排从左至右为Seedream 5.0、Grok Imagine Image生成
相比于其他几个,Seedream 5.0的步骤解释最为详细,每步都有详细的文字说明,但艺术设计感相比Nano Banana Pro稍弱。
从社交平台X上的网友评论来看,此次Seedream 5.0预览版的升级优先考虑的是智能水平而非美观,可以应对复杂的知识驱动型任务。
有网友认为,Seedream 5.0的智能水平、中文能力有提升,但都比不上Nano Banana Pro。
还有网友调侃,新模型的进步程度仅0.09,仅相当于加了网络搜索的Seedream 4.5。
01.三大能力增强,主攻实用性需求
根据Capcut官网,此次Seedream 5.0的重要升级点包括准确性与智能水平增强、更快更具表现力的图像创建、支持联网知识整合。
首先在智能水平方面,Seedream 5.0能深入理解提示词,生成与用户意图相匹配、细节精准、布局清晰、文本渲染效果更佳的图像。
第二点是增强风格化效果,其图像到图像功能增强了风格化效果,模型可以提供更清晰的细节、精致的纹理和平衡的照明。该模型还新增了编辑功能,用户可以控制笔刷精准选择并调整相应元素。
最后是智能推理能力,其官网提到,新模型的多步逻辑、空间理解及特定领域知识增强。
02.相较Seedream 4.5提升小,能理解抽象需求
智东西体验了Seedream 5.0的图片生成能力。
第一个提示词是“为《静夜思》生成古诗插图”,可以看到生成的结果中人物“举头望明月”这一关键元素都没有缺失,还附上了人物在月光下的影子等,但原诗中的“床前”等没有在图片中涉及到。
为了考验Seedream 5.0的联网搜索能力,智东西输入了提示词“最近有很多家机器人都要参加2026春晚,生成一张已官宣参加春晚的机器人海报”。
Seedream 5.0生成的视觉元素准确,在大段文字生成中也未出现乱码,表现稳定。但其并没有理解“已官宣参加春晚的机器人”,而是仅生成了机器人上春晚的海报。
还有抽象的提示词,智东西输入“生成一个静谧科技感且带有落日余晖氛围的闹钟图片”,新模型生成的图片中,从闹钟的设计到背景将落日、科技感融合在了一起。
关于更为细致的图像输出,提示词为“特写电影感肖像,一位有雀斑、深色卷发的年轻女性,被鲜艳的野花和藤蔓环绕,头上戴着花冠。在黄金时段拍摄,温暖的逆光在她的头发和皮肤上形成光晕,浅景深,前景花朵柔焦,照片级真实感”。
可以看到,输出的图片中的逆光效果非常到位,发丝边缘的光晕、皮肤的光泽以及前景花朵的柔焦虚化,都营造出了自然的氛围感。
当智东西的提示词为“最新奥斯卡获奖者红毯风格”时,Seedream 5.0可以直接生成有红毯、背景板、摄影师的完整图像,背景板还有不少奥斯卡的小金人。
根据参考图生成图片方面,智东西上传了最近热度超高的《闪灵》男主杰克,并让Seedream 5.0“生成这个人的拜年图片,主人公要身有年味的服装,手拿灯笼和对联”。
生成的效果中,主人公的面部与参考图一致,手拿灯笼、对联的元素也都具备。
智东西还比较了Seedream 5.0与Nano Banana Pro的生成效果。一个超难提示词为“生成一个用左手写字的人,背景有一个显示5:25的模拟时钟”,Seedream 5.0与Nano Banana都失败了,要么是拿笔的手不对,要么是背景的钟表时间不对。
Nano Banana Pro生成的图片中,人物握笔的手为左手,可以从模糊的时钟看出其时间为5:30左右。
▲Nano Banana Pro生成的图片
虽然Seedream 5.0有些图片生成的并不准确,但其一次性生成的图片更具多样性,从现代风、古风到卡通都有。
▲Seedream 5.0生成的图片
在比较Seedream 4.5和Seedream 5.0时,智东西上传的提示词是“帮我生成西红柿炒鸡蛋的菜谱,卡通风格”。相比之下,Seedream 5.0的整体排版、架构设计会更为美观。
▲上为Seedream 4.5生成的图片,下为Seedream 5.0生成的图片
03.结语:图像模型正朝,实用能力升级迭代
当前头部图像模型的迭代路径,正朝着提升理解能力、可控生成、编辑精度等实用能力升级。
从Seedream 5.0的升级来看,其选择在检索增强、细节纹理、精准调整、4K增强上做优化,生成的结果并没有颠覆性效果,这或许更贴近用户的实际需求。但从实测与舆论反馈来看,用户对小版本迭代的感知正在变弱,尤其在抽象语义理解、文字渲染、复杂逻辑构图等方面仍存在技术瓶颈。
本文来自微信公众号 “智东西”(ID:zhidxcom),作者:程 茜,36氪经授权发布。