网易首页 > 网易号 > 正文 申请入驻

谷歌Nano Banana Pro上线,深度结合Gemini 3,这下生成世界了

0
分享至

机器之心报道

编辑:冷猫

三个月前,来自谷歌 AI Studio 负责人 Logan Kilpatrick 的一个香蕉表情暗示了现象级图像生成模型 Nano-banana 出自谷歌,引发了轩然大波。

Nano-banana,也就是 Gemini 2.5 Flash Image 模型,有多猛大家也不陌生了。无论是修复老照片,还是生成迷你手办,Nano Banana 在图像编辑方面迈出了重要一步,让普通创作者也能轻松表达创意。

我们也曾经翻遍全网,整理了 7 种体现纳米香蕉超强图像理解生成能力的趣味玩法,感兴趣的读者可以回顾一下。

就在前两天,Gemini 3 发布前,Logan Kilpatrick 故技重施,点燃了大家对新模型的期待。

结果今天下午梅开三度。

网友说:「停停」。

在 Gemini 3 重磅登场后,谷歌的王炸模型只剩下了那支传说级的香蕉。

不出所料,就在刚刚,谷歌最新,最强大,最全面的图像生成模型 Nano Banana Pro(Gemini 3 Pro Image)正式登场,挂上了「专业级」后缀的纳米香蕉,结合了 Gemini 3 Pro 的强大推理能力和世界知识,实力再次实现了飞跃。

  • 官方链接:https://gemini.google/overview/image-generation/

简而言之,Nano Banana Pro 主要 Pro 在 :前所未有的控制力、完美的文字渲染效果和更强的世界知识,具备打造工作室级别的设计作品的生成能力。

前所未有的控制力

高分辨率

作为一款图像生成模型,Nano Banana Pro 这次最直观、最能有感的基础能力升级,是能够生成 2K 和 4K 的高分辨率图像

图像像素量有显著的提升,意味着模型必须同时在细节刻画、画面精度、生成稳定性、一致性以及可控性上全面升级。

除此以外,Nano Banana Pro支持了广泛的图像长宽比,解决了基础款 Nano Banana 使用时很难控制图像比例的痛点问题,尤其是在 Gemini 对话中明确要求图像比例时,Nano Banana 仍不能生成对应长宽比的图像。

Nano Banana Pro 生成不同比例的超高清图像

得益于多种可用的长宽比和 2K / 4K 高分辨率,谷歌声称:「作品可以直接用于任意平台,从社交媒体到印刷物料。」

更强大的一致性

Nano Banana 火遍全网,其中最重要的原因就在于它令人惊叹的视觉一致性控制。

举个大家最熟悉的例子:只需上传一张简单的服装图和人物照片,再配上一两句限制性文本指令,它就能快速精准地将元素融合,轻松生成风格统一、构图自然,并且保持人物和服装一致的 OOTD 合成照。感兴趣的读者可以看看我们这一篇报道,轻轻松松做一名时尚博主。

而使用 Nano Banana Pro,你可以融合比以往更多的元素:

最多使用 14 张参考图像,保持多达 5 个人物的一致性与相似度。

让我们简单来看两个实例:

Prompt: Combine these images into one appropriately arranged cinematic image in 16:9 format

Prompt: A medium shot of the 14 fluffy characters sitting squeezed together side-by-side on a worn beige fabric sofa and on the floor. They are all facing forwards, watching a vintage, wooden-boxed television set placed on a low wooden table in front of the sofa. The room is dimly lit, with warm light from a window on the left and the glow from the TV illuminating the creatures’ faces and fluffy textures. The background is a cozy, slightly cluttered living room with a braided rug, a bookshelf with old books, and rustic kitchen elements in the background. The overall atmosphere is warm, cozy, and amused.

效果非常令人惊讶,Nano Banana Pro 不仅可以保留参考图片中的物体和人物特征,更能够理解参考图片中的背景图像信息,理解光影、材质和图像结构,深刻洞察用户的设计意图。哪怕高达 14 张参考图像,Nano Banana Pro 都能够在新图像中保留全部的细节。

不管是将一张随手勾勒的手绘草图变成可落地的实体产品,还是把技术蓝图转化为质感逼真的 3D 结构,Nano Banana Pro 都能帮你轻松跨越那道长期存在的从想象到落地的鸿沟。

此外,在设计领域中,Nano Banana Pro 也可以为设计稿一键套入理想的视觉风格,包括品牌主视觉、潮流配色,不同材质和质感的测试效果,它都能快速生成。最终呈现的结果在所有关键特征上都能保持高度统一,从电商图到宣传海报,从社交内容到实体包装,毫无割裂感。

相比 Nano Banana 更强的一致性控制,远远拓展了参考图生成的上限,创造了更多玩法可能。

更灵活的创意控制

借助 Nano Banana Pro 的全新能力,高级图像编辑不再是专业团队的专属 —— 真正的创意控制权被交回到用户手中。

用户可以对画面进行近乎「分子级」的操控:

  • 自由选取并重塑图像任意局部区域,实现精准微调
  • 切换摄像机角度,快速生成不同视角与构图
  • 调整焦点位置,打造更具叙事感的画面重心
  • 应用电影工业级调色,一键改变视觉气质
  • 重塑场景光照,从白天到夜晚、从硬光到散景过渡皆可瞬时完成

这些能力让 Nano Banana Pro 从简单的图像生成工具,跃升为一个能够支持创作者进行分镜级、视觉导演级创作的图像引擎。

视频中也简单演示了从一张图像,到天气的重塑,最后使用 Veo 3 模型生成极具电影风格的视频的全过程。下面两个示例不仅能够展示 Nano Banana Pro 强大的创意控制能力,也展开了结合首尾帧视频生成的全新可能。

Prompt: change lighting of this portrait to from the left, diffused and soft

Prompt: Focus on the flowers

文字与知识大师

轻松拿捏文字生成

我们知道,在图像生成模型中,生成文本一直是一个难点。

Nano Banana Pro 正是在这一痛点上实现了再一次迭代:它具备非常强大的文本生成能力,能够生成包含更准确、清晰可读、多语言文本的视觉内容。

Nano Banana Pro 是生成图像内可读文本的最佳模型,无论你需要的是一句简短标语还是一整段较长文本,都能够清晰,完整,合理的生成,并且与图像内容完美融合。

Prompt: make 8 minimalistic logos, each is an expressive word, and make letters convey a message or sound visually to express the meaning of this word in a dramatic way. composition: flat vector rendering of all logos in black on a single white background

Prompt: Create an image showing the phrase "How much wood would a woodchuck chuck if a woodchuck could chuck wood" made out of wood chucked by a woodchuck.

现在我们可以在视觉设计或海报中创建带有更多细节的文本,具备更广泛的纹理、字体与创意样式。

另外,凭借Gemini 的增强多语言推理能力,我们可以通过 Nano Banana Pro生成多语言文本,或对内容进行本地化与翻译,从而实现全球化扩展,或更轻松地与朋友和家人分享内容。

就比如将饮料瓶上的英文翻译成韩语,并且无缝的合成在原文字的位置,还能保证超高质量的细节和字体风格。

Prompt: translate all the English text on the three yellow and blue cans into Korean, while keeping everything else the same

Gemini 3 赋能知识库

由于和 Gemini 3 大模型的深度融合,可以借助 Gemini 3 的高级推理,Nano Banana Pro 不只是生成漂亮的图像,它还能帮助你创建更有用的内容。

Nano Banana Pro 将庞大的知识库融入生成过程,能够比以往的图像生成模型产出更具事实准确性的视觉内容。

此外,在启用相关能力时,通过与Google 搜索的检索基座相结合,模型可以连接到实时的网页内容,生成基于最新数据的输出。

于是我们可以获得准确的解释内容,进一步理解一个事实主题,并且生成语境丰富的信息图和示意图。

这对于需要精确呈现现实信息的应用场景尤为重要,如生物学示意图或历史地图。

Nano Banana Pro 生成的制作豆蔻茶的教程图片

更进一步,Nano Banana Pro 还具备根据内容自动生成 PPT 页面的能力。

无论用户提供的是一段文字、几条要点,还是一篇长文,模型都能自动理解内容和结构,生成对应演示文档图像。实现了「从文字到展示」的流程自动化与智能化的实用进步。

隐形水印,快速验证

Nano Banana Pro 的图像生成能力再次进化后,生成图像和真实图像愈发难以区分。

但谷歌在这次更新发布后,对 AI 图像鉴别采取了新的方法,提高内容来源的透明度。

Gemini 应用中现在加入了一项新功能:用户可以直接验证某张图像是否由 Google AI 生成或编辑。

从今天开始,用户可以直接在 Gemini 应用中验证某张图像是否由 Google AI 生成或编辑。

如果你看到一张图像并希望确认它是否由 Google AI 生成,只需将其上传至 Gemini 应用,并提出类似于:「这是由 Google AI 生成的吗?」的问题,就可以获取准确的答案。

这一能力由SynthID实现,这是谷歌的数字水印技术,它将不可察觉的信号嵌入到 AI 生成内容中。谷歌在 2023 年推出 SynthID。自那以来,已有超过 200 亿份AI 生成内容通过 SynthID 加上水印。

Gemini 会检测图像中的 SynthID 水印,并结合自身的推理能力,为用户提供结果,使用户更了解你在网上看到的内容的背景。不久后,谷歌将扩展 SynthID 验证能力,支持包括音视频在内的更多格式,并让这些能力覆盖更多产品,如搜索等。

作为此次发布的一部分,从今天起,通过 Gemini、Vertex AI,Google ADs、Flow 生成的 Nano Banana Pro(Gemini 3 Pro Image)图像都将嵌入 C2PA 元数据,进一步提升图像生成方式的透明度。

面向各类用户上线

谷歌表示,会在多个原本支持旧版本模型的 Google 产品中上线 Nano Banana Pro:

面向消费者与学生

  • 在 GeminiApp 中,当你选择 「Create images」并使用 「Thinking」模型时,将在全球范围内陆续上线。
  • 免费用户会获得有限的免费额度,用完后将回退至原版 Nano Banana 模型。
  • Google AI Plus、Pro 和 Ultra 的订阅用户将获得更高额度。
  • 在搜索的 AI Mode 中,Nano Banana Pro 将向美国的订阅用户提供。
  • NotebookLM 中,Nano Banana Pro 也将向全球订阅用户提供。

面向专业人士

  • Google Ads 将升级图像生成功能至 Nano Banana Pro,让广告主可在 Asset Studio 中使用最前沿的生成与编辑能力。
  • 同时,它也将从今天开始陆续向 Workspace 用户推出,包括 Google Slides 和 Google Vids。

面向开发者与企业

  • 可通过 Gemini API 与 Google AI Studio 访问,并可在 Google Antigravity 中用于创建丰富的 UX 布局与原型。
  • 企业可立即在 Vertex AI 中开始大规模内容创作支持,并且即将登陆 Gemini Enterprise。

面向创意人士

  • Nano Banana Pro 将提供给使用 Flow 的 Google AI Ultra 订阅用户,为创作者、导演与营销团队提供更精准、更可控的镜头与场景生成能力。

Gemini 2.5 Flash Image 和 Gemini 3 Pro Image 模型可通过 Gemini API、Google AI Studio 和 Vertex AI 以付费预览形式使用。

使用 Nano banana (Gemini2.5 Flash Image)获取更快、更低成本的图像生成/编辑;使用 Nano banana Pro(Gemini 3Pro Image)处理更加复杂、要求更高的任务,但成本与延迟也更高。

https://blog.google/technology/ai/nano-banana-pro/

文中视频链接:

https://mp.weixin.qq.com/s/rZqBxTyDI9KyXod03vteCg

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
明明隔18公里就是江苏,河南骑车过不去,一脚踩进安徽砀山太憋屈

明明隔18公里就是江苏,河南骑车过不去,一脚踩进安徽砀山太憋屈

奇思妙想生活家
2026-06-03 12:57:48
善恶终有报!放弃国籍、贬低中国,68岁瘫在轮椅的张铁林活成笑话

善恶终有报!放弃国籍、贬低中国,68岁瘫在轮椅的张铁林活成笑话

混沌录
2026-06-01 23:24:09
肠子悔青!《给阿嬷的情书》男主嫌剧组太简陋跑路,错失10亿票房,深夜痛哭再求合作

肠子悔青!《给阿嬷的情书》男主嫌剧组太简陋跑路,错失10亿票房,深夜痛哭再求合作

科学发掘
2026-06-03 07:05:34
马刺尼克斯谁能夺得NBA总冠军?巴克利、苏群、杨毅给出了预测

马刺尼克斯谁能夺得NBA总冠军?巴克利、苏群、杨毅给出了预测

篮球大视野
2026-06-03 08:58:53
杀派出所所长,灭银行行长满门,凶手竟成城管局长,凯里两案纪实

杀派出所所长,灭银行行长满门,凶手竟成城管局长,凯里两案纪实

易玄
2026-06-03 08:50:51
有他管不了,没他赢欧冠:恩里克一句实话,戳破了多少巨星神话?

有他管不了,没他赢欧冠:恩里克一句实话,戳破了多少巨星神话?

落夜足球
2026-06-02 13:12:41
为什么领导都喜欢上班?网友曝光领导抽屉都是性用品:丝袜、套套

为什么领导都喜欢上班?网友曝光领导抽屉都是性用品:丝袜、套套

黯泉
2026-06-01 15:33:05
就在昨夜!这组炸裂的美国就业市场数据 令华尔街大吃一惊

就在昨夜!这组炸裂的美国就业市场数据 令华尔街大吃一惊

财联社
2026-06-03 08:42:13
新疆传来一声怒吼,全世界都想不到,中国这次真的攥稳底牌了!

新疆传来一声怒吼,全世界都想不到,中国这次真的攥稳底牌了!

福建睿平
2026-06-03 14:28:37
还没踏上旧金山,郑丽文的两岸路线就被美国质疑,特朗普改口了

还没踏上旧金山,郑丽文的两岸路线就被美国质疑,特朗普改口了

你是佛的弟子
2026-06-02 14:07:31
“不理解但尊重”,家长打扮粉嫩幼态送娃上学,网友:很不得体

“不理解但尊重”,家长打扮粉嫩幼态送娃上学,网友:很不得体

蝴蝶花雨话教育
2026-06-03 00:05:12
王守业贪污1.6亿,2005年“双规”后却被放出,他叫嚣:我摆平了

王守业贪污1.6亿,2005年“双规”后却被放出,他叫嚣:我摆平了

帝哥说史
2026-06-02 21:40:03
罗马诺爆料!皇马2大重磅官宣,签5000万铁卫、2500万飞翼敲定?

罗马诺爆料!皇马2大重磅官宣,签5000万铁卫、2500万飞翼敲定?

阿纂看事
2026-06-03 17:40:04
一张斩首照,让澳洲全国暴怒:百万人报名参军,追杀到天涯海角

一张斩首照,让澳洲全国暴怒:百万人报名参军,追杀到天涯海角

凉州辞
2026-06-03 07:25:03
日菲悍然“划界”,那就体验铁拳吧

日菲悍然“划界”,那就体验铁拳吧

侠客栈
2026-06-02 14:45:16
马上扔掉家里这1种调料,不仅有毒还致癌!很多人还天天吃

马上扔掉家里这1种调料,不仅有毒还致癌!很多人还天天吃

39健康网
2026-06-01 08:31:23
四川特大串标案曝光!涉案 110 亿,22 人获刑

四川特大串标案曝光!涉案 110 亿,22 人获刑

奇思妙想生活家
2026-06-03 17:41:10
94版《三国演义》司马懿饰演者魏宗万去世,享年89岁

94版《三国演义》司马懿饰演者魏宗万去世,享年89岁

新京报
2026-06-02 20:07:01
赖昌星前妻近状曝光:拒绝政府安置,独居3000平老宅,只做一件事

赖昌星前妻近状曝光:拒绝政府安置,独居3000平老宅,只做一件事

人生录
2026-06-01 13:52:39
绍伊古发出骇人警告:中国赶快醒醒,日本已经勾结上三股邪恶势力

绍伊古发出骇人警告:中国赶快醒醒,日本已经勾结上三股邪恶势力

阅尽天下大事
2026-06-03 06:08:18
2026-06-03 18:44:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13159文章数 142660关注度
往期回顾 全部

数码要闻

苹果公布2026年Apple设计大奖名单:赛博朋克2077获奖

头条要闻

网友花120万在直播间买原石 警方:30人拼单29个是托

头条要闻

网友花120万在直播间买原石 警方:30人拼单29个是托

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

官方痛批乱象 刘涛郑恺等艺人遭点名

财经要闻

AI,开始偷懒了?

科技要闻

传DeepSeek融资意向500亿:腾讯投100亿

汽车要闻

专访蒋平:安全不做高低配 长安要让安全技术普惠

态度原创

教育
手机
旅游
时尚
家居

教育要闻

【草原英雄征途】锡林郭勒·少年那达慕成长营

手机要闻

世界杯观赛神器 vivo Y600 Turbo看球无压力

旅游要闻

文旅新探|寻味隆福寺

休闲T恤舒适感极佳,夏天必不可少!轻轻松松拿捏日常的造型

家居要闻

江畔轻奢 观云大宅

无障碍浏览 进入关怀版