![]()
刚刚,Google 发布了 Nano Banana 2,用 Flash 的速度跑出了 Pro 的画质,价格砍半。
![]()
Nano Banana 这条产品线的历史不长:
V1 去年 8 月发,Nano Banana Pro 去年 11 月跟上。
Pro 版本发布后直接爆了,用量暴涨到 Google 不得不限制免费使用。
来看个对方图:
![]()
而这次的 Nano Banana 2,底层模型叫 Gemini 3.1 Flash Image,定位明确:把 Pro 的专业级画质,塞进 Flash 架构的速度里。
说人话就是:又快又好还便宜。
有多快
先看速度。
标准分辨率下,Nano Banana 2 的生成时间可以压到 2 秒以内。实测数据:p50 延迟 0.86 秒,p90 是 1.02 秒,p99 也才 1.28 秒。
作为对比:Nano Banana Pro 通常要 8-12 秒,Midjourney 要 20-30 秒。
压力测试下,每分钟能稳定输出 347-356 张图,没有内存泄漏。
![]()
Logan Kilpatrick 在上线公告中称:
在早期测试中,我们看到客户用 Flash 的速度和成本,拿到了 Pro 级别的画质。
![]()
这对需要批量生成的开发者来说,可谓是个巨大的好消息。
画质
快是快了,但画质呢?
Nano Banana 2 在光照、纹理和细节锐度上都做了明显提升。
Wavespeed AI 的对比文章打了个比方:Pro 是摄影棚相机,Flash 是智能手机相机。
虽然极端场景下 Pro 还是更强,但日常使用中,差距已经非常小了。
![]()
更值得注意的是几个细节能力:
角色一致性:单次工作流中能维持最多 5 个角色的外观一致,最多 14 个物体的精确还原。测试数据显示一致性达 95%,Midjourney 大约 70%。
文字渲染:这是 V1 时代「几乎不可用」的功能,现在字符准确率飙升到约 94%。能准确生成 UI 元素、数学公式,甚至小号字体。
图内翻译:可以直接在图片内渲染不同语言的文字,一张广告素材能自动本地化成多语言版本。
搜索加持
这可能是 Nano Banana 2 最独特的能力:内置了 Web 图片搜索。
模型不再只靠训练数据里的「记忆」来画画,它可以实时从网上搜索参考图片,然后基于这些真实图片来生成。
比如你让它画「巴黎埃菲尔铁塔在雨中的样子」,它会先从网上搜索相关图片,再结合 Gemini 的世界知识来渲染,而非凭空想象。
Google 做了个 Demo App 叫「Window Seat」来展示这个能力:输入一个世界各地的地点,结合实时天气数据,生成逼真的窗外风景。
从此,AI 图像生成第一次有了「实时视觉参考」的能力。
创作更可控
除了质量,Nano Banana 2 在可控性上也下了功夫:
宽高比:在原有基础上新增了 4:1、1:4、8:1、1:8 等超宽/超窄比例,覆盖更多设计场景。
新分辨率档位:新增 512px 低分辨率选项,加上已有的 1K、2K、4K,开发者可以按需选择,512px 适合快速迭代,4K 适合最终交付。
Thinking 级别可调:可以设置模型的「思考深度」,Minimal(默认)适合简单任务快速出图,High/Dynamic 则让模型在渲染前充分推理,处理复杂 prompt 时画质明显提升。
Google 还做了个「Pet Passport」Demo:上传一张宠物照片,AI 保持宠物外观一致的前提下,把它「送」到全球各大地标拍照。
用这个 Demo,可以直接体验各种创作控制参数。
价格砍半
来看钱的问题。
模型
每张图价格
Nano Banana V1
~$0.000039
Nano Banana Pro
$0.134
Nano Banana 2
$0.0672
Nano Banana 2 的价格大约是 Pro 的一半。用 Batch API 模式还能再降 50%。
第三方平台已经开始卷价格了,有的报价低到 $0.03 一张。
对于需要大规模图像生成的产品来说,成本差异是巨大的。
安全机制
Google 在安全上做了双保险:
SynthID:DeepMind 开发的不可见像素级水印,扛得住裁剪、缩放和 JPEG 压缩。自 Nano Banana Pro 以来,这个核查功能在 Gemini 应用中已被使用超过 2000 万次。
C2PA Content Credentials:行业标准的内容凭证,记录 AI 参与创作的具体方式。
每张 AI 生成的图片都会同时嵌入这两种标识。
开发接入
已经有不少团队把 Nano Banana 2 投入了生产。
![]()
时尚科技公司 Whering 表示,Nano Banana 2 能把用户的低质量照片转化为专业级素材,同时保留真实纹理。
![]()
HubX 的数据更直接:延迟降低 74-76%,人脸编辑工作流 快了 4 倍,画质没有妥协。
![]()
KLIPY 用它来生成表情包和贴纸,重点夸了文字渲染能力和自定义宽高比。
![]()
Emergent 的 CTO 则说,模型在复杂多约束 prompt 下表现出色,人物动作还原度很高。
![]()
Nano Banana 2 的独特优势在于三点:文字渲染、角色一致性、实时 Web 搜索 Grounding,这三个能力目前没有竞品能同时做到。
如何使用
Nano Banana 2 已经全面铺开:
消费者端:Gemini 应用的所有模式(Fast/Thinking/Pro)都已默认切换到 Nano Banana 2。Google Search 的 AI Mode 和 Lens 功能也在全球 141 个国家上线了。
开发者端:Google AI Studio、Gemini API、Vertex AI、Firebase、Gemini CLI 全部可用。模型 ID 是 gemini-3.1-flash-image-preview,目前处于预览阶段。
需要注意的是,在 Google AI Studio 中使用需要付费 API Key。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.