成本只要两毛钱生成1000张图,压过自家价格更贵的专业版模型。这个事本身听着就跟“便宜没好货”的直觉对着干。
Google 新近端出的 Nano Banana 2 Lite,就是那个专治图像生成延迟、高并发成本、多接口维护麻烦的轻量级选手。给一组硬邦邦的数字:超 1000 张图的生成,它干完活大概只要 4 秒。价格定死在每千张 0.034 美元,差不多两毛三。Elo 评分停在 1251 分,直接压过定价更高的 Nano Banana Pro 那 1245 分一线。这些数字堆在一起,对那些被 API 响应时间、图像生成单价、多套接口搞得头皮发麻的开发者来说,是个有分量的消息。
![]()
这一波提速,根子不在常规的降低出图分辨率那一套。运行底座是 Gemini 3.1 Flash Lite 模型,专门针对低延迟推理下了手。对比标准版 Gemini Flash Image,它拿到了 2.7 倍的加速,原因是架构层面的调整——砍掉了产生冗余计算的部分,但出图的核心质量没往下掉。这种“不减画质加画速”的账,开发者算得过来。
一图读懂 Nano Banana 2 Lite 的设计思路,就是在做减法——把接口数量减到最少。图像生成、编辑、合成三类任务,过去要在项目里分别挂好几套接口,现在融成一套。代码的维护量、潜在的出错分支、单元测试的复杂度,都跟着往下降。特别是那条 Interactions API:支持多轮会话,能做最多 3 次带上下文记忆的连续编辑。如果后续还要搭图片转视频管线,它也可以跟 Gemini Omni Flash 打配合。
看跑分容易心虚,看跑分对应的实际产出才实在。Elo 1251 分到底兜得住多少场景?拿几个常见的开发者用例来检验。第一类,动态产品图。一杯咖啡放在书桌上、一件 T 恤平铺、某个小物件被人握在手里——这种带环境的商品展示图,色彩还原的准确度够得上电商商用线,产品特征出图后不会跑偏到认不出。
第二类,界面原型快速生成。用文字描一个登录界面、一张仪表盘布局、一套设置页面,它给出的视觉成品已经够得上开设计讨论会和内部演示的门槛。别指望拿来当像素级的高保真稿,但方向的准确性没问题。
第三类,图像里的文字呈现。这是一个真正让人重新审视它的点。很多模型碰到要在图里精确生成招牌、标签、按钮文案、叠加文字的需求,常常翻车。Nano Banana 2 Lite 在多数生成结果里,把这些内嵌文字处理得清晰且可读。如果业务场景跟制作带文字的证书、卡片、促销图相关,这个表现就很关键。
第四类,角色一致性。输入同一个角色特征描述,多次生成的图像之间可以认出是同一个角色的延续。撑不住要求逐帧严格一致的动画级连续出图,但想做一个有固定角色形象的系列内容,稳定性够用。
技术规格这块,生产环境得留意三个固定参数:分辨率覆盖 1K 级别,比例有 14 种可选。默认配置里自带了 SynthID 水印保护和 C2PA 内容证书,对商用合规是个保底的交代。
目前接入 Nano Banana 2 Lite,可以直接通过 Gemini API 跑起来。要上批量化内容生成的生产线,已经有人测试出成熟的集成模式在跑。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.