网易首页 > 网易号 > 正文 申请入驻

谷歌旗下最强图像模型来了,P图师要消失了?

0
分享至

在视频生成模型称霸多个榜单之后,谷歌终于将战火引至图像领域。当地时间8月26日,谷歌发布了其最新的图像生成和编辑模型Gemini 2.5 Flash Image,并迅速登顶多个主流图像排行榜,成为新晋性能冠军。


第一财经记者实测后发现,确实如众多网友所体验的那样,模型各方面表现堪称优秀,无论是角色的一致性、提示词的跟随、物理逻辑的真实性还是画面审美方面都保持了水准。但对中国用户的一大限制在于不支持中文输入。即使用户使用英文提示,若生成内容涉及中文,效果仍会显著下降。测试中还发现,模型偶尔会出现多肢体等结构错误。

尽管如此,Gemini 2.5 Flash Image 仍被广泛认为是当前市场上最强的图像编辑和生成模型之一。谷歌官方演示显示,该模型已具备替代部分人工修图的能力,可帮助设计师一键完成图像修改与创意生成,也适用于电商产品图的制作。更值得注意的是,其单张图像生成成本不到3毛钱,极具性价比,有望大幅推进AI图像生成的商业化进程。

登顶双榜单

实际上,在正式发布之前,市场已经有一些风声。上周一款名为“nano-banana”的模型出现在大模型竞技场中,开始接受用户的匿名体验和打分,目前投票数超过250万。如今谜底揭晓,“nano-banana”正是Gemini 2.5 Flash Image。

在大模型竞技场LMArena的文生图与图像编辑两个场景,谷歌的图像模型均拿下全球第一,在图像编辑榜单上模型表现尤为出色,获得1362的高分,以171分的差距领先第二名flux-1-knotext-max。


知名AI基准测试机构Artificial Analysis同样获得了早期访问权限,并在过去一周以“rex”的化名在竞技场中进行了测试。目前谷歌的模型在图像编辑方面排名第一,超过了OpenAI的GPT-4o和国内阿里的Qwen-Image-Edit,在文生图方面则略逊于字节Seedream 3.0和GPT-4o,排名第三。

Artificial Analysis还做了一个对比测试,给出了一张图,让谷歌、阿里通义和OpenAI三家的模型生成新的照片:在自行车后座上加一名乘客,并将地点更改为内蒙古的草原。


从输出结果看,千问的图像模型未能准确进行指令跟随,在画面真实度上,谷歌的模型表现则比GPT-4o更为突出。

谷歌称,Gemini 2.5 Flash Image的核心亮点是图像编辑能力,这一模型可将多个图像混合到一幅图像中,保持高度的角色一致性,还能使用自然语言进行有针对性修改,并充分利用Gemini的世界知识来生成和编辑图像。

一直以来,图像生成中的一个根本挑战是如何在多个提示和编辑中保持角色或物体的外观。“我们知道,当你编辑自己或熟悉的人时,哪怕是细微的差别都会显得刺眼 。”谷歌官方表示,“差一点但不完全一样”的效果就是感觉不对,模型的最新更新专门针对这一点,让朋友、家人,甚至宠物始终看起来像他们自己。

谷歌CEO桑达尔·皮查伊(Sundar Pichai)和谷歌DeepMind CEO戴密斯·哈萨比斯(DemisHassabis)在发布时亲自下场带货。

皮查伊借助最新模型生成了家里爱犬冲浪、做大厨的照片,画面质感相当不错。哈萨比斯则给自己生成了一个肖像照,将照片背景做了修改,切换为古典风格,但是人物的容貌没有出现改变。


从画面来看,谷歌这一模型可做到在不同的姿势、光线和环境中保持人物或角色的相似性,甚至可以将相同的角色应用到新的风格和表面上。

现在用户使用Gemini App可以免费体验,但面向开发者的版本,算下来每张生图成本也不到3毛钱。Gemini 2.5 Flash Image的定价为30美元/100万个输出token,每张图像为1290个输出token,每张图像价格约为0.039美元(约合人民币0.28元),这远低于OpenAI的0.19美元/张的价格。

实测表现:中文是短板,一致性出众

根据官方的发文,Gemini 2.5 Flash Image除了角色一致性方面,在渲染文本方面也表现出色。模型可以准确生成包含清晰易读且位置合理的文本的图片,非常适合用于徽标、图表和海报。

在商业化场景中,例如广告制作方面,主体特点、主角容貌不变,文字不变形这些都非常重要。在这一基础上,谷歌认为,他们的模型已经能适应产品模型和商业摄影,为电子商务、广告或品牌宣传制作清晰专业的商品照片。

具体模型在这些方面的表现如何?第一财经基于哈萨比斯的肖像照进行了测试。加上一张家里猫咪的照片,让Gemini融合生成哈萨比斯抱着猫坐在沙发上的图像,并且更换家居服。


从第一次输出结果来看基本上找不出瑕疵,AI此前容易犯的错包括手指变形、虚化的背景形态错误、人物容貌细微变化等等都没有发生,甚至连哈萨比斯左手的手表细节都保持了一致。唯一不够满意的是,画面虽然是高清图,但分辨率并不高。


接下来,第一财经记者加大难度,让猫坐在沙发上,而哈萨比斯手里拿一本汉语大词典正在翻阅,沙发换成深绿色。


可以看到,第二次生成时,模型在涉及中文场景的画面时开始出现错误,哈萨比斯拿着的并不是汉语大词典,甚至很难对应上正确的中文字体,但颜色和形状上保持了合理性。

第一财经记者进一步更改提示词,让模型发挥想象力,将猫换成主角,坐在沙发翻阅牛津词典,并让哈萨比斯在旁边给猫按摩。


在这一步,模型开始出现明显的错误,指令并没有完全跟随,甚至猫多出了一条腿。不过,确实如官方所说,在英文场景下,文字的渲染没有出现差错,哈萨比斯手中牛津词典的书名拼写完全正确。

综上,该模型在面貌一致性、文本准确性方面表现优异,尤其擅长英文环境;而在中文理解与复杂构图指令方面仍存在明显缺陷。

在商业应用上,基于模型性能的提升,或许将重塑设计、广告与电商行业。

官方表示,模型支持用自然语言进行针对性地变换和精准局部编辑。例如,可以模糊图像背景、去除T恤上的污渍、从照片中移除整个人物、改变拍摄对象的姿势、为黑白照片添加颜色。这很大程度上已经能替代图像领域的王者Adobe的PS,可见的未来,修图师的地位也岌岌可危。

在设计领域,一些图形风格更改也可以一键完成了。谷歌提到,模型现在可以轻松地将其从一张图像转移到另一张图像,同时保留前一个主题的形式和细节,这种一致性可用于专业设计场景。例如,模型能在不改变形状和细节的前提下,完成纹理的更换。


在物理知识方面,模型表现也较为出色。根据谷歌的案例,给模型一个气球飘向仙人掌的视觉图像后,提示其想象生成下一个可能的情况。从画面来看,模型能够预判气球爆炸后的物理特征。


在电商场景中,已有海外用户尝试用该模型生成商品展示图。如将人物手中的涂抹区域替换为香奈儿手袋,效果逼真,几乎看不出合成痕迹。


可以预见,随着生成效果不断优化与使用成本持续降低,Gemini 2.5 Flash Image 有望加速AI在电商、广告、设计乃至专业摄影领域的影响和替代效应,修图师与部分视觉设计师的工作内容,或将被重新定义。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
卡里克大清洗!7000 万巨星遭弃用,曼联新最强 11 人曝光

卡里克大清洗!7000 万巨星遭弃用,曼联新最强 11 人曝光

澜归序
2026-01-16 05:30:06
杨瀚森参加混音赛后大合影!站在最边上出镜 搂住队友一脸微笑

杨瀚森参加混音赛后大合影!站在最边上出镜 搂住队友一脸微笑

罗说NBA
2026-01-15 15:06:11
军统南京站站长是臭名远扬的大特务,为何要追授他为共和国烈士?

军统南京站站长是臭名远扬的大特务,为何要追授他为共和国烈士?

鹤羽说个事
2026-01-15 15:06:44
白银50天涨逾80%,疯狂程度远超黄金,历史上爆炒白银往往预示贵金属牛市已到高潮,这次有何不同?

白银50天涨逾80%,疯狂程度远超黄金,历史上爆炒白银往往预示贵金属牛市已到高潮,这次有何不同?

每日经济新闻
2026-01-16 00:16:06
部队退役我当了狱警,给一个死刑犯剃头时,认出他是失踪多年的队长

部队退役我当了狱警,给一个死刑犯剃头时,认出他是失踪多年的队长

浮生实录集
2025-09-18 15:10:05
大量14T低价硬盘涌入闲鱼!1T折合44元,到底有啥猫腻?

大量14T低价硬盘涌入闲鱼!1T折合44元,到底有啥猫腻?

闲搞机
2026-01-16 11:14:40
8强对阵出炉!国乒占2席,头号种子0:3被淘汰,梁靖崑林诗栋出局

8强对阵出炉!国乒占2席,头号种子0:3被淘汰,梁靖崑林诗栋出局

国乒二三事
2026-01-16 08:53:38
郑丽文盼望的大事,大陆没有松口,但给国民党吃了一颗定心丸

郑丽文盼望的大事,大陆没有松口,但给国民党吃了一颗定心丸

杰丝聊古今
2026-01-16 10:44:33
2026央视春晚首次彩排引热议,语言类节目回春,9大看点令人期待

2026央视春晚首次彩排引热议,语言类节目回春,9大看点令人期待

白面书誏
2026-01-13 16:43:06
QQ官方回应沈腾空间被盗传闻:非盗号,是腾哥的来时路

QQ官方回应沈腾空间被盗传闻:非盗号,是腾哥的来时路

TechWeb
2026-01-15 17:56:03
伊朗警察局长出手:誓抓每一个抗议暴徒

伊朗警察局长出手:誓抓每一个抗议暴徒

桂系007
2026-01-16 00:00:23
中央一号文放大招!城镇户口能迁回农村了,这几类人要偷着乐!

中央一号文放大招!城镇户口能迁回农村了,这几类人要偷着乐!

今朝牛马
2026-01-15 17:36:28
5行代码,逼疯整个硅谷!澳洲放羊大叔,捅开AI编程奇点

5行代码,逼疯整个硅谷!澳洲放羊大叔,捅开AI编程奇点

新智元
2026-01-14 17:38:10
司晓迪爆出了与鹿晗的真相,网友:关晓彤我连心疼你都有时差

司晓迪爆出了与鹿晗的真相,网友:关晓彤我连心疼你都有时差

动物奇奇怪怪
2026-01-16 08:41:25
美航母打击群开往中东 特朗普:希望“速战速决”伊朗进入最高战备状态 约2000枚导弹可覆盖美以基地

美航母打击群开往中东 特朗普:希望“速战速决”伊朗进入最高战备状态 约2000枚导弹可覆盖美以基地

每日经济新闻
2026-01-15 21:38:58
24分大胜!杨瀚森22+7+3,赛后小杨走到对方替补席,逐一握手致意

24分大胜!杨瀚森22+7+3,赛后小杨走到对方替补席,逐一握手致意

担酒
2026-01-15 12:10:16
第二个乌克兰出现了?特朗普突然变脸,美军瞒天过海,普京被骗了

第二个乌克兰出现了?特朗普突然变脸,美军瞒天过海,普京被骗了

小嵩
2026-01-16 10:38:52
赖昌星发妻曾明娜现状:逃亡10年后回国,守着3000平老宅安静养老

赖昌星发妻曾明娜现状:逃亡10年后回国,守着3000平老宅安静养老

古书记史
2025-12-12 11:21:38
致特朗普总统:伊朗军民盼解放,愿与美国共筑新生

致特朗普总统:伊朗军民盼解放,愿与美国共筑新生

老马拉车莫少装
2026-01-14 22:52:20
华国锋退下来了,组织专门找到他的秘书,诚恳让其自己挑前途~

华国锋退下来了,组织专门找到他的秘书,诚恳让其自己挑前途~

鹤羽说个事
2026-01-14 15:22:18
2026-01-16 11:56:49
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
241571文章数 621211关注度
往期回顾 全部

科技要闻

被网友"催"着走,小米紧急"抄"了特斯拉

头条要闻

"装死"小羊身价飙至30万元 专家:可以人工繁殖更多只

头条要闻

"装死"小羊身价飙至30万元 专家:可以人工繁殖更多只

体育要闻

聂卫平:黑白棋盘上的凡人棋圣

娱乐要闻

黄慧颐手撕保剑锋 曾黎意外卷入风波

财经要闻

深圳有白银商家爆雷 维权群超350人

汽车要闻

从 "商务" 变 "潮酷" 全新一汽奥迪A6L首秀亮相

态度原创

本地
艺术
健康
手机
数码

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

艺术要闻

300亿!341米!迪拜将建全球首个奔驰品牌城市

血常规3项异常,是身体警报!

手机要闻

荣耀Magic8 RSR官宣搭载第五代骁龙8至尊版+24GB LPDDR5X至尊版

数码要闻

罗马仕被曝正亏本清理库存充电宝:27000mAh型号售价45元

无障碍浏览 进入关怀版