![]()
作者 | 周一笑
邮箱 | zhouyixiao@pingwest.com
2月26日,Google发布了Nano Banana 2,Nano Banana图像生成系列的第三款模型。
技术名称为Gemini 3.1 Flash Image,它试图解决一个此前横亘在开发者和普通用户面前的矛盾:想要Pro级画质,就得忍受Pro级的价格和等待;想要快和便宜,就只能将就初代Nano Banana的能力天花板。
先简单回顾一下这条产品线。2025年8月,初代Nano Banana(Gemini 2.5 Flash Image)以匿名身份在LMArena上亮相后迅速出圈,成为Google近年来少有的病毒传播AI产品。三个月后的11月,Nano Banana Pro(Gemini 3 Pro Image)发布,带来了4K分辨率、精准文字渲染和"先推理再画图"的架构升级,被视为图像生成领域的新标杆。
现在又过了三个月,Nano Banana 2把Pro的核心能力装进了Flash的壳里,并且将全面替代Pro,成为Google全线产品的默认图像生成模型。
半年三代,这个推进节奏在Google的AI产品矩阵中也属罕见。
![]()
Pro的能力,Flash的成本
Nano Banana 2最直观的变化是“Pro级能力 + Flash级速度”的组合,但具体拆开来看,几个能力点值得关注。
联网搜索增强的世界知识。这可能是Nano Banana 2与市面上大多数图像生成模型最本质的差异。生成过程中,模型可以调用Google Search获取实时信息和图片参考,再将其融入生成结果。
Google在开发者博客中展示了一个名为“Window Seat”的demo应用:给定一个地点名称,模型会先搜索该地点的实时天气和街景图片,再生成一张对应的窗外风景。它不再单纯依赖训练数据进行“回忆”,转为基于实时信息开展创作。
这个能力让Nano Banana 2在生成信息图、数据可视化、或涉及特定真实场景的内容时,具备了传统扩散模型难以匹配的优势。
联网搜索为全球任意窗户生成更精准的窗外景观。
文字渲染与图内翻译。文字生成一直是AI图像模型的痛点,初代Nano Banana在这方面表现尤其不稳定。Nano Banana 2继承了Pro版本的字符级验证机制,能逐字检查生成文字的准确性。
![]()
更实用的是,它新增了图内多语言翻译功能。给定一张包含英文标识的图片,可以直接要求模型将文字翻译为其他语言并重新渲染,同时保持画面一致性。Google官方demo展示了一个“Native Wildlife”路牌被翻译为印地语的案例,文字替换后画面的光照和质感保持了连贯。
![]()
水循环图解生成效果
主体一致性。Nano Banana 2支持在单个工作流中维持最多5个角色的外貌一致性,以及最多14个物体的视觉保真度。这对需要连续叙事的场景来说是关键能力,比如故事板、品牌素材、漫画分镜等。
Google展示了一组案例,三个毛绒角色搭建树屋的六格连续故事,每格的角色服装和面部特征保持稳定,但表情和姿态有自然变化。
![]()
三个毛绒角色搭建树屋的六格故事
分辨率与格式覆盖。 支持512px到4K的四档分辨率输出。其中512px是新增的低分辨率档位,专为需要快速迭代的批量生成场景设计。宽高比方面新增了4:1、1:4、8:1、1:8等极端比例,覆盖了从竖版社交媒体到超宽banner的各类需求,这些是Pro版本此前不支持的。
可配置思考深度。 面向开发者的新功能:允许调节模型的推理强度,从Minimal(默认,最快)到High/Dynamic(更慢但更精准)。相当于把"画质vs速度"的取舍权交到了开发者手中,可以根据场景灵活选择。
![]()
发布后,独立评测机构Artificial Analysis在X上公布了Arena排名结果,Nano Banana 2以Pro一半的价格拿下了文生图榜单第一,图像编辑方面排名第三,仅次于GPT Image 1.5和Nano Banana Pro。独立开发者levelsio在获得提前体验后也表示,主体一致性是这次最大的突破,“照片终于真正像你训练的那个人了,而不是有点像”。
在Google官方公布的GenAI-Bench评测结果中,NB2在开启联网搜索和Thinking模式后,三项指标均领先于Nano Banana Pro和GPT-Image 1.5。
![]()
把图像生成变成基础设施
如果只看能力升级,Nano Banana 2是一次常规的版本迭代。但Google围绕它做的产品布局,透露出更大的意图。
全线替换为默认。Nano Banana 2将成为Gemini App中Fast、Thinking和Pro三个模式的默认图像生成引擎,直接替换此前的Nano Banana Pro。绝大多数Gemini用户接触到的图像生成能力,都将由NB2提供。
Pro版本并未下线,但被推到了一个更小众的位置:只有Google AI Pro和Ultra的付费用户可以通过"三点菜单 → 重新生成"来手动调用。
产品渗透范围。 除Gemini App外,NB2同步上线了Google Search的AI Mode和Lens(覆盖141个新国家和地区、8种新增语言)、Flow(Google的AI创意工具,NB2成为默认且零积分使用)、Google Ads(生成广告素材建议)、AI Studio、Gemini API、Vertex AI和Google Antigravity。
![]()
Google做了一个演示应用“全球广告本地化器”来展示NB2的能力
几乎覆盖了Google AI产品矩阵中所有与图像相关的触点。目前NB2已开始滚动上线,普通用户打开Gemini App即可体验(已替换为默认模型),已在搜索(覆盖 141 个国家)以及 Flow+中推出,开发者可通过AI Studio和Gemini API接入,Antigravity也已上线,目前为preview状态。
定价策略。 API端的价格值得单独说。1K分辨率下,NB2的单张生成成本约$0.067,相比Pro的$0.134几乎砍半;4K分辨率约$0.151,较Pro节省近40%。Batch模式(异步处理,24小时内交付)在此基础上再打对折。文本token的输入输出价格也较Pro低了约75%。
![]()
把这些动作放在一起看:Google的意图不在发布一个供用户挑选的新工具,而是在把图像生成能力以尽可能低的摩擦嵌入其所有产品。当NB2成为Search、Ads、Flow的默认引擎时,大量用户甚至不需要主动选择就已经在使用它。对开发者而言,大幅下降的API成本让大规模调用成为现实。
NB2的竞争策略不完全是在图像模型的维度上对标竞品,而是利用Google的分发优势和生态整合能力,让图像生成渗透到用户的日常工作流里。
对手在卷画质,Google在卷覆盖
Nano Banana 2并非在真空中发布。前段时间阿里Qwen团队推出了Qwen-Image-2.0,一个70亿参数的图像模型,社区评价认为其质量已接近Nano Banana Pro。虽然权重尚未公开,但前代Qwen-Image系列均以Apache 2.0协议开源,社区普遍预期2.0也会跟进,届时企业就可以在自己的基础设施上运行,无需按张付费。
Qwen不是个例。去年11月,由Stable Diffusion原班人马创立的Black Forest Labs发布了FLUX.2系列,其最高配置FLUX.2 [max]拥有320亿参数,同样集成了语言模型推理和联网搜索能力,直接对标Nano Banana Pro。字节跳动也在今年2月推出了Seedream 5.0 Lite,同样具备联网搜索和推理生图能力,并已嵌入剪映和CapCut,走的也是能力内嵌到现有产品的路线。
加上此前各家陆续释出的图像模型,这个赛道上的替代方案正在迅速丰富起来,在文字渲染、风格控制、编辑能力等不同维度上各有所长。
NB2的回应方式并不是单纯的质量碾压。来自The Decoder的早期实测显示,在一个包含马骑人的复杂反常识prompt测试中,NB2成功完成了任务,此前只有Pro版本能稳定做到。但评测者也指出,Pro在整体画面的真实感和动态感上仍然优于NB2,后者在某些场景下还有一种略显人工的质感。
![]()
上:NB2 下:NBPro
Google显然也清楚这一点,否则没有必要继续为付费用户保留Pro选项。NB2的竞争策略更准确地说是,用Flash级的成本提供“足够好”的质量,然后靠Google的分发网络在规模上取胜。这和开源阵营追求的在自有基础设施上运行最好的模型形成了两条完全不同的路径。
在安全标记方面,所有NB2生成的图像都将携带SynthID水印,并支持C2PA Content Credentials标准。Google称自去年11月上线SynthID验证功能以来,该功能已被使用超过2000万次。
半年时间,Google把Nano Banana从一个病毒传播的实验功能推进到了覆盖核心产品线的默认能力。当AI图像生成的成本不断趋近于零、质量趋近于足够好,Google没有选择在模型竞赛中争夺每一个百分点的画质优势,而是把这个能力做成水电一样的东西,默认开启,随处可用。对于Google来说,Nano Banana系列真正的产品不是图像模型本身,而是“让十亿级用户在不知不觉中开始使用AI图像生成”这件事。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.