最近被香蕉包围了,
做梦都是香蕉围在我身边给我唱歌跳舞,
在这种氛围之下,我直接一个雷欧飞踢!
发动面子果实,拿到了豆包的 Seedream 4.0 图片生成模型的内测,
一句话,这是一个能玩出nano banana效果但又超越了它的模型!
大家都比较熟悉 Nano Banana 的爆火效果们了吧,我直接上几组 豆包 Seedream 4.0 和 nano banana的1v1相同提示语的效果对比。
这些爆火的效果都能实现的情况下,
豆包 Seedream 4.0 还能做到 nano banana做不到的效果,比如中文。
最重要的是,我一直苦恼nano banana的几个问题:
❌ 英文提示语效果才够稳定 ❌ 低清晰度 ❌ 不能写中文 ❌ 不能固定图片比例
但现在的豆包 Seedream 4.0 都解决了:
✅ 中文提示语 ✅ 直接输出2k清晰度还可以再高清 ✅ 稳定的中文海报 ✅ 图片比例自定义
更重要的是,豆包 Seedream 4.0 生成出的图片其实更符合国内的场景和审美,就比如我同样让它们都给这个女孩画个妆,我没有限定妆容的风格,Seedream 4.0 画出来的就是最近很流行的妆容甚至还用了哑光口红,而nano banana上来就给我整了一个大浓妆。
怀着小激动,我直接百镜系列回归,来个超全大测评。
前方多图预警,Here we go!
文中所有图片和提示语我都会整理到文档中,公众号后台回复“豆包4”就可以啦
首先,自然是先看Seedream 4.0主打的中文能力,都知道之前的模型做中文海报就已经很厉害了,那现在的4.0在此基础上还可以做到,海报相似风格模仿。
字体、视觉重心、甚至连每一处标题的位置放的都能对应上。
参考图片的风格制作一张海报,中秋节主题海报,古风水墨风格,蓝紫与金色主调,圆月高挂,桂花飘香,玉兔依偎,湖面倒影宁静唯美,大标题“月圆人团圆”,整体画面温馨浪漫,高清,3:4比例
也可以给已有的海报(最左侧图片)修改其中的文字内容、字体、位置,在修改过程中能够统统保持原图的高度一致,
还可以直接根据提示语批量调整海报的排版,这个调整不只是仅仅针对图片中文字,而是在保持图片风格完全一致的情况把元素和文字都重新排成你需要的样子,
海报要显贵,字体基础,排版就不基础
将海报分别改为上下排版、左右排版、对称排版、包围式排版的4种不同排版
当然,我们还可以用豆包Seedream 4.0批量生图,一次性完成一整套品牌设计,不仅能够给我们完整设计各种产品,还能够在所有生成的图片严格保持logo一致。这个一致性对于品牌来说有多重要不用我多说了吧,
严格一致就代表着可以商业化。
使用图中的logo,设计品牌名称为“逐野”的帽子、包装盒、水杯、工牌、帆布包、手环等周边产品,绿色为主色调,年轻化产品设计
One more time!
豆包Seedream 4.0 是具有图片推理能力的,可以自己根据提示语进行推理补充生成,说简单一点的,我只给Seedream 4.0一个菜名,让它自己生成菜谱,要把图片和做菜步骤都画出来并对应上,
手帐手绘风格,做出一张青椒炒肉的制作步骤完整教程长图,步骤说明要中文,图片比例9:16
可以看到它每一步的画面和文字内容都对应上了,而且这么多的文字都一字不差的精准的写在了画面上。
看得我都想自己去厨房炒两菜。
甚至我还可以让Seedream 4.0根据我给的人物形象做出卡通剧情漫画,这个风格和它自己补足的剧情,我以后真的可以随时随地在朋友圈发布自己的个人ip小漫画了。
给图片中的人物创建一组搞笑蜡笔手绘剧情漫画,讲述女孩上班面对各种各样的工作很颓废,下班立刻容光焕发充满活力的搞笑剧情,使用中文文字,每张图片的比例都是1:1
我还可以!!
让它做一组电影分镜,每一张的氛围感都很到位,而且对比原图人物的面部一致性保持的非常稳定,这对有制作剧情AI视频的朋友们简直是巨大的帮助,效率蹭蹭蹭的。
参考图片中的形象制作一组法国爱情片电影剧情分镜
甚至在图片推理这一块,最令我惊讶的就是,可以推理出一张图的下一秒会发生什么,Amazing啊。
生成一张图片告诉我这个男人看见了什么
一分钟后这个显示多少
而且多图参考的一致性也非常之牛,目前是我见过人脸一致性做的最好的模型了,我分别给了豆包一张我女朋友的照片、一张我的照片、还有一张我家小猫的照片,这个效果做出来的人脸还有猫脸我自己都惊住了,一下没分出来到底是真的还是假的,真的太像了。。。
如果我换成非常多的元素给到豆包,也可以让Seedream 4.0把这些东西都套在我身上,同时还保持我的脸和图片中的元素全部一致。
甚至我也可以让豆包把一张非常复杂的图片拆分成单独的视觉元素单元,同时保持所有元素的一致性。
这个case我目前就没怎么看到有成功的。
即使是同一个人物去做三视图,也能够保持这个人物不同角度的不同角度的人脸、服装都完全一致。
最后,我们还可以上传不同的图片来玩一个人物姿势模仿,
玩法实在有点太太太太多了,
我是真的玩了一个晚上还有今天一天,感觉都没有探索完全,可玩性实在太高。
包括前面我们做的所有牛x效果全部都是建立在一致性非常稳定的基础之上。
我快忘记nano banana了,
这就是我们自己的、一致性最强的国产生图模型豆包 Seedream 4.0!!
至于什么时候正式上线,大家赶快催催催催催催吧,没准人多过几天就都能用上了!
小道消息可能是下周一哦,把我这一大堆玩法收藏起来到时候用!
我都感觉我之前囤的10个G的lora,comfyUI啥的快封尘了。
推理模型在慢慢成为文本大模型的主流,图像模型开始流行超强一致性和多图组合。
都说时尚是个轮回,AI也一样,
我合理期待后面的AI视频模型又将会有一大圈突破。
或许是明天,或者是下周,
谁知道呢?
我太太太太期待了。
@ 作者 / 卡尔 & 阿汤
最后,感谢你看到这里如果喜欢这篇文章,不妨顺手给我们点赞|在看|转发|评论
如果想要第一时间收到推送,不妨给我个星标
更多的内容正在不断填坑中……
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.