网易首页 > 网易号 > 正文 申请入驻

Nano banana手办玩法火爆出圈!无需抽卡,效果惊了(°o°)

0
分享至

不圆 一水 发自 凹非寺
量子位 | 公众号 QbitAI

小某书最新起号方式,还得看AI(doge)。

这两天打开一看,几乎全被各种精致逼真的手办图刷屏了:

而且仔细一扒,甭管是AI圈、二次元圈还是骑行圈等等,感觉大家一下子都在玩。

so,发生了啥?到底是什么引得大家如此动作一致?

时刻游走在吃瓜第一线的量子位赶紧去瞧了瞧,结果发现,这不是最近爆火的图像编辑模型nano-banana嘛。

这个模型起初在LMArena平台匿名出现,后来因生图表现太好突然爆火,继而引得无数网友猜测其归属。

直到两天之前,谷歌才终于站出来认领了该模型,并表示其真身为Gemini 2.5 Flash Image

而随着nano-banana揭开神秘面纱,国内外网友更是掀起了一波疯狂试玩的热潮,其中手办尤其受到大家的青睐。

所以,如何用nano-banana生成同款手办?提示词该怎么写?

量子位手把手教程这就奉上——

实测爆火手办玩法

不卖关子,先看看网上爆火的生成“真实手办”的提示词。

Use the nano-banana model to create a 1/7 scale model, in a realistic style and environment. Place the figure on a computer desk, using a circular transparent acrylic base without any text.On the computer screen, display the ZBrush modeling process of the figure.Next to the computer screen, place a TAMIYA-style toy packaging box printedwith the original artwork.

(中译方便对照版:使用nano-banana模型制作一个1/7比例的实体模型,风格和环境保持写实。将模型摆放在电脑桌上,底座为圆形透明亚克力材质,且不带任何文字。电脑屏幕上显示的是该模型在ZBrush中的建模过程。在电脑屏幕旁边,放置一个TAMIYA风格的玩具包装盒,包装盒上印有原始插画。)

就用这套提示词和Gemini 2.5 Flash,让我们试试水~

(PS:支持中文提示词,但偶尔会出现错误,需要多试几次,建议使用英文。)

动漫角色为参考图,生成的“手办”效果确实不错。

出乎意料的是,只用了上面的提示词,它居然可以识别出是艾伦耶格尔(盒子上有他的名字)。

而且即使不是全身像也可以生成,但参考图以外的部位可能会有一些奇怪的地方。

可是一想到是银魂就觉得很合理怎么回事。

用家里的毛孩子作为参考图,简直是让人大呼“购买链接在哪里”的程度……

猫猫和狗狗都非常可爱。

要是能结合3D打印做出来就更好了(真的可以)。

虽然网上的案例已经很多了,但让我们再试试真人效果呢。

亲测,最好使用全身图。

只要是全身图就能成,包括这种搞怪动作乱飞的。

非常适合……你知道的,哪怕不是给自己,谁手里没几张好朋友的怪照片呢?

美中不足的是生成的“手办”好像没有支撑,但再补充一句就行。

  • 上面的模型飘起来了,给它加个支撑。

这些玩法也很火

除了手办,nano-banana还有一些脑洞大开的玩法也很火。

它可以同时结合3张图片进行创作,既然如此,有网友意识到,为什么不试着控制角色的姿态呢。

还可以结合视频生成模型创作连贯的动画。

不需要太过完整的动作示例(虽然使用详细示例可能会更精细),火柴人小草图同样可行。

也有网友选择打破次元壁,让二次元人物成为真人出现在漫展场地。

这和真实的cosplayer有什么差别?

上述玩法我们也“顺带”实测了一下,提示词放在下面了,一起看看效果:

  • 让图一和图二的角色摆出图三的姿势,一条手臂搭在对方的肩膀上,另一条手臂比心。

  • 让图一和图二的角色以图三的姿势战斗,一个人出拳,一个人用腿踢。

  • 生成一张真人扮演这张插画的照片,背景设置为Comiket。

是生图(指没有修过的原图)啊,完全是coser生图啊!

团队透露背后技术细节

通过以上实测不难发现,nano-banana确实有点东西。

趁热打铁,谷歌AI Studio负责人Logan Kilpatrick(最右)最近还采访了这个项目背后的团队。

从左到右分别是:研究工程师Kaushik Shivakumar、研究工程师Robert Riachi、小组产品经理Nicole Brichtova、研究科学家Mostafa Dehghani。

略过开头的产品功能介绍和演示环节,咱们直接来看看背后的核心技术原理。

第一,以文本渲染作为核心指标来快速衡量模型性能。

对图像生成模型来说,一个无法回避的难题是如何进行有效评估。传统的评估方法严重依赖“人类偏好评估”,不仅非常主观,而且需要耗费大量昂贵人力。

为此团队提出了一个新的替代指标——文本渲染。按照Robert Riachi的话来说:

  • 当模型能处理好这种复杂的文字结构时,它同样也能学会图像里的其他结构。

Kaushik Shivakumar进一步解释,之所以使用这个指标,还是因为一直以来几乎所有模型都无法很好解决文本渲染的问题。

  • 它为模型训练提供了一个客观、可量化且不易饱和的衡量标准。相比于很快就会触及瓶颈的其他自动化图像质量指标,文本渲染的难度足够大,能够持续为模型的改进提供指引。

而且有趣的是,这一做法还带来了意料之外的好处——一些原本并非针对文本渲染的改动,却意外地提升了该指标的表现

不过需要提醒,这并非意味着完全放弃了人工评估,只是考虑到训练成本,文本渲染可以作为一种更高效、经济且可靠的替代方案。

第二,通过原生多模态与交错式生成,实现复杂编辑与情境感知。

团队提到,该模型的核心优势在于原生多模态。原生多模态意味着图像的理解和生成能力被深度整合进了一个模型中,而非两个系统的简单拼接。

之所以要采用原生多模态,主要目标是在不同模态和能力之间实现“正向迁移”。

就拿之前经常提到的数手指案例来说,明明图片上是6只手指,但AI可能会基于文本知识硬说成5只,而视觉信号能够为模型学习世界知识提供一条捷径。

根据介绍,堪比“一对姐妹”的图像理解与生成,其协同作用在“交错式生成”中得到了最充分的体现。

“交错式生成”被视为该模型实现复杂、多轮编辑的关键技术,与传统模型一次性生成一张图片不同,交错式生成是一个连续的过程——不仅能理解当前的文本指令,还能看到并理解对话历史中的所有图片。

Mostafa Dehghani进一步指出,它为解决极其复杂的图像生成任务提供了一种全新范式:

  • 如果你的提示词包含了6个甚至50个不同的编辑要求,传统模型很可能在一次生成中无法满足所有细节。但利用交错式生成,模型可以将这个复杂任务分解为多个步骤,在不同的对话轮次中逐一完成编辑。

第三,该模型的进步离不开对上一代模型的深入反思和对用户反馈的积极响应。

根据透露,团队会直接在等社交平台上搜集用户反馈,将用户报告的失败案例系统性整理起来,并将其构建成内部的评估基准。

也就是说,每一个新版本的模型都必须在这些来自真实世界挑战的测试集上证明自己。

具体而言,这些曾经出现的bug包括:

1、像素级精确编辑:在Imagen 2.0中,用户在尝试对图像进行局部编辑时,模型可能会在添加新元素的同时不必要地改变图像的其他部分。

2、角色一致性:Imagen 2.0已经能够在不改变角色位置的情况下为其添加帽子或改变表情。而新模型则实现了更高层次的一致性,能够从不同角度渲染同一个角色,生成看起来完全是同一个人的侧面或背面视图。它还可以将一件家具从原始照片中取出,放置到一个全新的环境中。

3、更自然的图像质感:之前的编辑操作有时会产生不自然的PS感或叠加感。

Anyway,正是因为团队积极收集用户反馈,弥补这些曾经的短板,新模型这才有了如今的爆火。

未来,谷歌的目标是将所有模态都整合到Gemini中,以实现AGI。

One More Thing

顺带一提,谷歌这次还计划举办Nano Banana Hackathon(黑客马拉松)活动。

持续时间为2天,届时将提供免费API使用额度。

获奖者有机会赢得奖品和开发者积分,以及一些和Gemini有关的“酷炫玩意儿”。

最后,如果你现在想要试玩Nano Banana模型,可以通过AI Studio或Gemini API体验。

也可以直接在Gemini内使用。

AI Studio体验地址:
https://aistudio.google.com/prompts/new_chat?model=gemini-2.5-flash-image-preview

参考链接:
[1]https://x.com/kei31/status/1961052667381203235
[2]https://x.com/yuhasbeentaken/status/1960778503366041769
[3]https://x.com/kiyoshi_shin/status/1960841949281443874
[4]https://x.com/lakeside529/status/1960875127123632297
[5]http://x.com/OfficialLoganK/status/1961127857192673540
[6]https://x.com/OfficialLoganK/status/1960725463694753930

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
215斤!宁波渔民东海捕获1条巨型龙趸,体长超1.8米!老渔民:头一回见到这么大的龙趸

215斤!宁波渔民东海捕获1条巨型龙趸,体长超1.8米!老渔民:头一回见到这么大的龙趸

环球网资讯
2026-04-23 15:04:09
伊朗宣布关闭霍尔木兹海峡

伊朗宣布关闭霍尔木兹海峡

财联社
2026-04-19 02:25:05
奥斯卡影后查理兹·塞隆公开讲述:为了保护我,母亲枪杀了父亲……

奥斯卡影后查理兹·塞隆公开讲述:为了保护我,母亲枪杀了父亲……

大风新闻
2026-04-23 17:21:03
光纤再爆单!20家年报集体增长最高3212%,社保基金、外资重仓6家

光纤再爆单!20家年报集体增长最高3212%,社保基金、外资重仓6家

长风价值掘金
2026-04-23 15:16:51
局势恶化!日本开出危险一枪,中国红线遭踩踏,东部战区行动了

局势恶化!日本开出危险一枪,中国红线遭踩踏,东部战区行动了

人间无味啊
2026-04-23 17:30:01
徐明联手本拉登家族,400亿硬刚中石油,帝国崩塌

徐明联手本拉登家族,400亿硬刚中石油,帝国崩塌

圆梦的小老头
2026-04-17 23:52:41
倒查13年,央国企开始慌了

倒查13年,央国企开始慌了

新浪财经
2026-04-23 02:44:17
卢拉:赶紧给特朗普颁个奖 “这样就不会有战争了”

卢拉:赶紧给特朗普颁个奖 “这样就不会有战争了”

新华社
2026-04-22 15:50:02
特朗普延长停火竟在“等他”?迟迟未露面的伊朗新最高领袖将对美方最新提议作出回应

特朗普延长停火竟在“等他”?迟迟未露面的伊朗新最高领袖将对美方最新提议作出回应

红星新闻
2026-04-23 12:38:15
“10分钟的商务座,你拍了9分钟的照”,穷养女炫富,反被群嘲

“10分钟的商务座,你拍了9分钟的照”,穷养女炫富,反被群嘲

妍妍教育日记
2026-04-15 08:25:03
对阵火箭G3赛前,詹姆斯提醒湖人全队警惕杜兰特

对阵火箭G3赛前,詹姆斯提醒湖人全队警惕杜兰特

生活新鲜市
2026-04-23 17:33:08
粟裕那一枪,到底是打歪了,还是故意打歪的

粟裕那一枪,到底是打歪了,还是故意打歪的

鹤羽说个事
2026-03-30 22:03:41
来自地狱的女儿,加拿大亚裔女孩雇凶杀害父母,内幕竟如此残忍

来自地狱的女儿,加拿大亚裔女孩雇凶杀害父母,内幕竟如此残忍

谈史论天地
2026-04-23 10:40:03
公安明确了!这5种人永远开不出无犯罪记录证明,第3种最冤枉

公安明确了!这5种人永远开不出无犯罪记录证明,第3种最冤枉

娱乐圈见解说
2026-04-23 07:44:42
当年张柏芝抱着lucas后面居然是大s,到现在才发现,真美好

当年张柏芝抱着lucas后面居然是大s,到现在才发现,真美好

动物奇奇怪怪
2026-04-23 18:03:34
女子爱上情夫后,为他花了一个亿,2013年情夫不肯离婚被杀死了

女子爱上情夫后,为他花了一个亿,2013年情夫不肯离婚被杀死了

汉史趣闻
2026-04-23 11:04:16
WCBA总决赛:山西女篮险胜四川追到2-2 奥贡鲍尔被驱逐布朗34分

WCBA总决赛:山西女篮险胜四川追到2-2 奥贡鲍尔被驱逐布朗34分

醉卧浮生
2026-04-22 21:14:40
贝森特:多个海湾盟友及部分亚洲国家已请求建立货币互换安排

贝森特:多个海湾盟友及部分亚洲国家已请求建立货币互换安排

财联社
2026-04-22 22:59:08
朝鲜两名高官发动兵变为张成泽报仇,因细节败露,金正恩一招镇压

朝鲜两名高官发动兵变为张成泽报仇,因细节败露,金正恩一招镇压

阿胡
2024-04-30 11:48:45
北京官方:感谢维克特-贝利做出的贡献,祝愿未来一切顺利

北京官方:感谢维克特-贝利做出的贡献,祝愿未来一切顺利

懂球帝
2026-04-23 16:50:10
2026-04-23 19:08:49
量子位 incentive-icons
量子位
追踪人工智能动态
12522文章数 176457关注度
往期回顾 全部

头条要闻

五角大楼"斩"海军部长 知情人士:他没认清谁是老大

头条要闻

五角大楼"斩"海军部长 知情人士:他没认清谁是老大

体育要闻

莱斯特城降入英甲,一场亏麻了的豪赌

娱乐要闻

王大陆因涉黑讨债被判 女友也一同获刑

财经要闻

关于AI算力链"瓶颈" 这是高盛的最新看法

科技要闻

马斯克喊出"史上最大产品",但量产难预测

汽车要闻

令人惊艳的奇瑞车 风云A9可不只是样子货

态度原创

游戏
数码
本地
艺术
公开课

R星还是卡普空?十年磨一剑还是年年有得玩?

数码要闻

消息称三星电子、金士顿双双向渠道通知固态硬盘涨价至少10%

本地新闻

SAGA GIRLS 2026女团选秀

艺术要闻

这是汉朝国师写的草书,王羲之笔法正源于此

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版