网易首页 > 网易号 > 正文 申请入驻

Nano Banana Pro上线,AI生图或许真的要进入“工业化”时代了

0
分享至

就在 Gemini 3 大语言模型发布的 48 小时后,Google 在刚刚再次投下一枚重磅炸弹:Nano Banana Pro(即 Gemini 3 Pro Image)正式上线。

这款建立在 Gemini 3 Pro 架构之上的新模型,旨在解决长期困扰 AI 绘图领域的两大顽疾:不可控的随机性与对物理世界认知的匮乏。与此前主打速度与成本效益的 Nano Banana(即 Gemini 2.5 Flash Image)不同,Pro 版本被明确定义为一款“高保真(High-fidelity)”工具,它不再满足于仅仅生成一张好看的图片,而是试图理解图片背后的逻辑。这种理解力来源于 Gemini 3 强大的推理引擎,Google DeepMind 的产品经理 Naina Raisinghani 将其描述为一种能够调用“世界知识”的能力。

最直观的体现在于信息图表的生成。在以往,要求 AI 绘制一张关于特定植物的科普图,往往会得到一张充满虚构文字和错误生物特征的图片。但在 Nano Banana Pro 的官方演示中,当用户要求生成一张关于“乌龟串(String of Turtles)”植物的养护指南时,模型不仅准确还原了叶片特殊的纹理细节,还通过 Google Search 的接地(Grounding)技术,实时检索并正确标注了原产地、光照需求等真实信息。

对于设计师和品牌方而言,新模型带来的最大惊喜莫过于对文本渲染(Text Rendering)和多语言本地化的史诗级增强。长期以来,AI 在处理图像内文字时总是显得力不从心,生成的字符往往乱码难以辨认。而 Nano Banana Pro 似乎彻底攻克了这一难关。在官方展示的一个饮料品牌案例中,模型不仅在易拉罐曲面上完美贴合了英文品牌名,甚至能根据指令,直接生成符合透视关系和光影逻辑的法文版包装图。

而在创意控制力方面,Google 此次展现出了与其“Pro”后缀相匹配的专业度。过去,为了保持角色一致性,创作者往往需要借助复杂的 LoRA 训练或 ControlNet 插件,而 Nano Banana Pro 原生支持了极高强度的上下文保持能力。

据技术文档显示,该模型可以同时处理多达 14 张参考图像的输入,并能在一个复杂的场景中,精准锁定并保持多达 5 个不同角色的面部特征与服装细节不变。

无论是将草图转化为精细的 3D 渲染图,还是在不同分镜中保持主角形象的统一,这种“导演级”的控制力让 AI 生成的内容终于能够承载连贯的叙事。此外,针对专业摄影需求,模型开放了对景深(Bokeh)、光影角度、色彩分级(Color Grading)等物理参数的微调权限,支持最高 4K 分辨率的输出,这无疑是向 Midjourney 等竞争对手发起的直接挑战。

除了模型本身的进化,Nano Banana Pro 也进一步地与 Google 生态有所整合。在前不久刚随 Gemini 3 发布的 Antigravity 中,开发者可以直接调用 Nano Banana Pro 生成高保真的 UI 界面原型,随后让 AI 智能体直接根据视觉设计编写前端代码。这种跨越视觉与逻辑边界的协作方式,正在模糊设计师与程序员的职业分野。同时,该模型也已确认将整合进 Adobe、Figma 等主流创意软件,以及 Google 自家的 Slides、Vids 和 Flow 视频工具中,试图全面接管创意工作流。

当然,顶级性能对应的是高昂的算力成本。Google 在定价策略上毫不掩饰其高端定位:相比于生成一张 1024px 图片仅需 0.039 美元的普通版 Nano Banana,使用 Pro 版本生成一张 1080p 或 2K 图像的成本跃升至 0.139 美元,而 4K 图像的单次生成成本更是高达 0.24 美元。这清晰地划分了用户群体:Flash 版本服务于日常娱乐和快速预览,而 Pro 版本则是为那些容错率极低的专业商业场景准备的。

为了验证 Google 官方宣传的这些“神奇特性”是否属实,我也在第一时间进行了实测。

我首先要求模型生成一张“酸碱滴定实验原理与滴定曲线综合示意图”。在上个版本的 Nano Banana 中,这类有较多汉字且考察理解能力的教学示意图绝对无法是完成的,通常你会得到满是乱码的坐标轴和错乱的玻璃仪器。但这次 Nano Banana Pro 交出的答卷让人震惊。如实测图所示,模型精准地绘制出了滴定管、锥形瓶等实验装置,以及右侧的滴定曲线等,都与要求相符。唯一可惜的是,图片中的文字标注,多少还是有轻微的模糊和乱码。

我要求它生成一张“具有《守望先锋》风格的第一人称射击游戏 HUD 界面,生成的图像展现出相当惊人的语义理解力,尽管个别 UI 布局、地图场景等元素与实际游戏不同,但游戏角色、字体风格与游戏整体美术风格都高度统一,还原程度相当高。

至于在下面这个常规的考察对物理光影的掌控能力的场景中,其理解能力和真实程度也是不必多说。

甚至还能生成连贯的漫画。

初步体验下来,尽管还有一些遗憾,但这大概确实是目前对提示词依从度最高、文字处理能力最强的图像模型。

此外,为了防范更强大的模型带来更多深度伪造(Deepfake)的风险。Google 宣布所有经由 Nano Banana Pro 生成的图像都将强制嵌入 SynthID 数字水印。这是一种在像素层面无法被肉眼察觉,但能被算法精准识别的技术,即便图片经过裁剪、压缩或滤镜处理,水印依然有效。

Google 甚至在 Gemini App 中直接面向消费者推出了验证工具,用户只需上传图片并询问“这是 AI 生成的吗?”,系统即可给出判定。对于免费用户,图片上还会保留可见的“Gemini Sparkle”标记,只有企业级用户和 Ultra 订阅者才能获得无可见水印的纯净图像。这显然是在为未来的监管风暴做准备。当 AI 生成的图像逼真到连光影物理学都无懈可击时,唯一的辨别方式可能真的只剩下密码学了。

Nano Banana Pro 的发布,或许真的标志着 AI 图像生成进入了“工业化”阶段。

如果说 2023-2024 年是 AI 绘画的“奇观时代”,大家惊叹于它能画出什么;那么 2025 年则是“控制力时代”,大家开始在意它能多精准地执行命令。

通过 Gemini 3 Pro 的认知能力与 Antigravity 的工程化落地,Google 正在将“文生图”从一种娱乐消遣,转变为一种可精确控制、可规模化生产、具备真实世界认知的工业级服务。尽管更高昂的价格可能会劝退部分个人创作者,但对于那些渴望将想象力无损转化为生产力的专业人士来说,这或许正是他们等待已久的那块拼图。

参考资料:

1.https://blog.google/technology/ai/nano-banana-pro/?utm_source=x&utm_medium=social&utm_campaign=&utm_content=

2. https://blog.google/technology/developers/gemini-3-pro-image-developers/

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
吸烟真的有害吗?英国烟草公司用48只狗实验,4年竟抽掉14万支烟

吸烟真的有害吗?英国烟草公司用48只狗实验,4年竟抽掉14万支烟

掠影后有感
2026-06-24 10:52:34
赖清德的后台终于现出原形,大陆这回铁定下手不留情!

赖清德的后台终于现出原形,大陆这回铁定下手不留情!

橙色书卷
2026-05-28 15:02:05
山姆买的啤酒罐口长毛了 消费者拒绝代金券补偿,厂家出面赔付千元

山姆买的啤酒罐口长毛了 消费者拒绝代金券补偿,厂家出面赔付千元

信网
2026-06-25 21:35:18
5-0大胜却丢掉榜首,葡萄牙末轮死磕豪门改写命运

5-0大胜却丢掉榜首,葡萄牙末轮死磕豪门改写命运

youyou喜欢你
2026-06-26 13:49:50
长城全新旗舰大型SUV亮相,归元平台打造,配1.5T插混系统

长城全新旗舰大型SUV亮相,归元平台打造,配1.5T插混系统

汽车公告板
2026-06-26 17:36:44
砍掉一辆车,却量产了全部新技术

砍掉一辆车,却量产了全部新技术

灰度测试中
2026-06-25 00:51:44
世界杯头号卧底!1 亿新星致命失误葬送德国,一战打出水货本质

世界杯头号卧底!1 亿新星致命失误葬送德国,一战打出水货本质

澜归序
2026-06-26 07:36:26
《父母爱情》无人翻拍的原因:灵魂人物已去世,四个角色无法超越

《父母爱情》无人翻拍的原因:灵魂人物已去世,四个角色无法超越

动物奇奇怪怪
2026-06-26 14:30:33
俄军武器被缴获,泽连斯基拟32国分享,中方态度坚决

俄军武器被缴获,泽连斯基拟32国分享,中方态度坚决

猪小艳吖
2026-06-26 03:30:29
大量上市!含钾是冬瓜23倍,建议夏天要多吃,手脚有劲精神好!

大量上市!含钾是冬瓜23倍,建议夏天要多吃,手脚有劲精神好!

王二哥老搞笑
2026-06-26 03:58:15
章子怡坦言:你帮别人养孩子我管不着,但我儿女的抚养费一定给全

章子怡坦言:你帮别人养孩子我管不着,但我儿女的抚养费一定给全

张鴘喜欢软软糯糯
2026-06-21 00:17:49
华国锋巨幅楷书你见过吗?生宣熟宣哪种更适合书法创作?

华国锋巨幅楷书你见过吗?生宣熟宣哪种更适合书法创作?

书画相约
2026-06-22 10:18:23
孟晚舟是我见过最得体的名媛:衣不穿无袖、裙不穿短,特优雅贵气

孟晚舟是我见过最得体的名媛:衣不穿无袖、裙不穿短,特优雅贵气

蒂蒂茱家
2026-05-30 15:55:41
51年一特务被捕后语出惊人:杨靖宇不是自杀,害他的人在北京当官

51年一特务被捕后语出惊人:杨靖宇不是自杀,害他的人在北京当官

北海史记
2026-06-23 09:43:51
巴媒:阿森纳准备第二次报价吉马良斯,球员专注于世界杯

巴媒:阿森纳准备第二次报价吉马良斯,球员专注于世界杯

懂球帝
2026-06-26 19:05:13
《妻旅》格格不入的夫妻:懒、不上道、脾气大,还没孙杨这对舒服

《妻旅》格格不入的夫妻:懒、不上道、脾气大,还没孙杨这对舒服

一娱三分地
2026-06-25 19:09:02
菲律宾没想到,自己刚在南海挑事,洪森就再次访华,直接摆明立场

菲律宾没想到,自己刚在南海挑事,洪森就再次访华,直接摆明立场

呼呼历史论
2026-06-26 18:13:15
高峰也没想到,他当年狠心抛弃的儿子,如今开始给母亲那英争光了

高峰也没想到,他当年狠心抛弃的儿子,如今开始给母亲那英争光了

柏拉图的诉说1
2026-06-24 18:22:06
71岁卢卡申科新伴仅22岁,常年被美女模特环绕,分居妻子杳无音信

71岁卢卡申科新伴仅22岁,常年被美女模特环绕,分居妻子杳无音信

译言
2026-06-21 07:11:28
研究发现:吃甜食的老人,健康指数是吃蔬菜的人的9倍不止?

研究发现:吃甜食的老人,健康指数是吃蔬菜的人的9倍不止?

荷兰豆爱健康
2026-06-26 18:25:16
2026-06-26 19:48:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16884文章数 515054关注度
往期回顾 全部

科技要闻

拿了500亿的梁文锋,只挖地基,不信销售

头条要闻

女子称遭性侵警方不予立案 内裤裆部和胸部检出男方DNA

头条要闻

女子称遭性侵警方不予立案 内裤裆部和胸部检出男方DNA

体育要闻

我在世界杯的每次奔跑,都为了证明你没看错

娱乐要闻

玥儿不回北京,马筱梅解释后妈身份

财经要闻

悬在科技头上的达摩克利斯之剑

汽车要闻

老板们的新座驾!65万元起,尊界V800/V680开启预订

态度原创

教育
游戏
时尚
数码
亲子

教育要闻

什么样的孩子适合学医?医生:游戏玩得好的是潜力股

发售前领证的独游夫妻 做了一款不受苦的类银

盛夏,才要穿出松弛感!

数码要闻

PC配置退回十年前!Goodram推出4GB单条新品

亲子要闻

对话南开大学教授、人口学者吴帆:怎样才是“好妈妈”

无障碍浏览 进入关怀版