网易首页 > 网易号 > 正文 申请入驻

“唠嗑式P图”,修图改图“动口不动手”!每经记者实测Gemini 2.0 Flash图像生成器:一键给漫画上色、生成图文菜谱......

0
分享至

3月12日,谷歌正式发布Gemini 2.0 Flash全模态图像生成器,支持原生图像生成功能。现在,所有开发者都可以通过Gemini API和Google AI Studio中的实验版本使用Gemini 2.0 Flash进行原生图像生成。

《每日经济新闻》记者(以下简称“每经记者”)在Gemini 2.0 Flash原生图像生成功能开放后进行了测试。测试发现,Gemini 2.0 Flash在给漫画上色、生成图文菜谱、添加元素等多项任务上,均表现出色。

图片来源:谷歌官网

“唠嗑式P图”,修图改图“动口不动手”

据谷歌介绍,Gemini 2.0 Flash具有出色的文本和图像结合能力。它能够根据文本描述生成连贯的故事,并自动匹配相应的插图,在整个故事中保持角色和场景的高度一致性。而且,用户如果对生成的内容不满意,只需给予反馈,模型便会重新讲述故事或改变绘画风格,为创作者提供了极大的便利和创作空间。

此外,其会话式图像编辑功能也十分强大,做到了“唠嗑式P图”。无论是调整细节还是探索不同的创意方向,用户都可以通过多次自然语言对话,轻松地对图像进行编辑。

在世界理解方面,Gemini 2.0 Flash与传统模型相比,具有明显优势。Gemini 2.0 Flash利用丰富的世界知识和增强的推理能力来生成图像,能够更好地理解现实世界中的各种概念和关系,从而生成更加逼真、详细且符合上下文的图像。例如,在生成食谱相关图像时,它可以准确地描绘出真实的食材和烹饪方法,同时在Google AI Studio中实现文本和图像的交错输出,让用户获得更直观的体验。

值得一提的是,Gemini 2.0 Flash在文本渲染上表现卓越。大多数传统图像生成模型在处理长段文本时,容易出现格式不佳、字符难以辨认或错别字等问题,而Gemini 2.0 Flash的内部基准测试显示,其在渲染方面优于竞争对手的领先模型,这使其在创建广告、社交媒体帖子和邀请函等需要高质量文本图像的场景中具有巨大的优势。

OpenAI前研究科学家威廉·古斯(William H.Guss)在社交媒体上感叹道,“谷歌实力回归了。”

图片来源:X

多任务实测:生成图文菜谱、制作生日贺卡、给漫画上色等轻松拿捏

在Gemini 2.0 Flash原生图像生成功能开放后,每经记者通过生成图文菜谱、制作生日贺卡、给漫画上色等多项任务,对该功能进行了测试。

任务1:添加或去掉元素

首先,记者发送了OpenAI首席执行官山姆·奥尔特曼出席活动的一张照片,希望Gemini 2.0 Flash去掉图片中的部分元素——头发。

经过五分钟的等待,Gemini 2.0 Flash完成了记者提出的需求。虽耗时较长,但令人惊喜的是,处理前后的两张图片保持了高度一致性。不管是人物神态及五官、虚化的背景墙,还是图像生成模型很难避开的“坑”——人物手部细节,Gemini 2.0 Flash都处理得相当完美

然而,Gemini 2.0 Flash在运行过程中也出现了一些状况。当记者在同一对话页面继续与模型交互,提出“去掉黄仁勋眼镜”的指令时,Gemini 2.0 Flash给出的回应并非如预期那样。其回传的图片中,主体变成了刚刚生成过的奥尔特曼形象,同时还融入了记者发送的黄仁勋图片中的英伟达芯片元素。

随后,记者又向Gemini 2.0 Flash发送了一张电车的图片,并提出在车顶上添加“TAXI”标志的指令。经Gemini 2.0 Flash处理后回传的图片,“TAXI”标志与电车整体融合度极高,几乎难以察觉到后期添加的痕迹。

不过,记者也留意到,图片中车牌上的文字变得模糊难辨,除此之外,该图片在其他方面的表现堪称出色,很难找出明显瑕疵。

任务2:上色、改色

在上一项的测试任务中,Gemini 2.0 Flash展现出的一致性表现着实令人惊艳。那么,面对线条复杂、图片中还夹杂着对话的漫画场景,Gemini 2.0 Flash能否延续其出色发挥?

记者随后发送了一张黑白漫画,并要求模型为该图片上色,且色彩风格需契合漫威的风格。

待Gemini 2.0 Flash完成处理后,记者将前后图片进行比对,发现模型精准锚定了指令需求,专注于为图片上色,未对图片其他元素做额外改动。漫画中的原有文字,无论是字体样式还是位置排版,均与处理前保持了高度一致。

图片上色不成问题,那么改动某个物体的颜色,Gemini 2.0 Flash又表现如何呢?

记者随即向Gemini 2.0 Flash发送了一张玫瑰的图片,要求模型将玫瑰的颜色改成鲜红色。

这次模型很快输出了结果。回传的图片中,玫瑰呈鲜红色,其色泽与质感高度贴近现实中红玫瑰的视觉效果,无论是花瓣的纹理还是整体色调的过渡,均处理得极为自然,几乎难以察觉AI的修改痕迹。

任务3:AI电商模特,一键换衣

随着记者加大测试难度,向其发送了一套服装的图片,要求模型将这套服装穿到一位男性模特身上,同时将图片背景色设定为橙色。

Gemini 2.0 Flash同样很好地完成了任务。图片中,服装完美适配男性模特身形,且背景色也被准确替换为橙色,整体效果自然流畅,毫无违和感。

不仅如此,当记者进一步要求AI模特展示不同动作时,Gemini 2.0 Flash同样轻松应对,快速为AI模特更换了拍照动作,堪称电商从业者的福音。

任务4:生成图文菜谱

Gemini 2.0 Flash还具备一项技能——生成图文并茂的菜谱。为测试其实际表现,记者以“番茄炒蛋”这道家常菜为例,要求模型生成一份包含详细步骤的图文菜谱。

可以看到,模型不仅完整且条理清晰地呈现出了“番茄炒蛋”的菜谱,从食材准备、烹饪步骤到火候掌控等信息一应俱全,还在菜谱相应位置精准插入了与之匹配的图片。值得注意的是,这些图片均由Gemini 2.0 Flash自行生成,而并非从互联网上搜索获取。

任务5:制作生日贺卡

在图像生成领域,众多模型在应对长段文本处理时,常陷入格式不佳、字符模糊难辨或错别字频出等问题。Gemini 2.0 Flash在这方面的表现如何呢?

记者向Gemini 2.0 Flash下达指令,要求其设计一张生日贺卡,并明确规定了贺卡上需呈现的文字祝福内容。

约十秒钟后,Gemini 2.0 Flash便生成了一张设计精美的生日贺卡。仔细查看,贺卡上不仅完整涵盖了记者所要求的全部文字,而且文字清晰易读,格式也规范得体。

总体来看,Gemini 2.0 Flash原生图像生成功能的表现可圈可点,虽有一些小瑕疵,但为图像生成技术的应用拓展了边界。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
0-3!U19国足土伦杯第二轮以0射门完败,解说员:对手11个奥斯卡

0-3!U19国足土伦杯第二轮以0射门完败,解说员:对手11个奥斯卡

足球大腕
2026-06-02 23:44:19
泰山教练组大洗牌!宿茂臻下课、韩鹏考证,新教练暗藏翻盘希望

泰山教练组大洗牌!宿茂臻下课、韩鹏考证,新教练暗藏翻盘希望

体坛小鹏
2026-06-02 18:10:13
淮海战役惨败后,王凌云只身脱逃,隐姓埋名潜入深山娶了个村姑

淮海战役惨败后,王凌云只身脱逃,隐姓埋名潜入深山娶了个村姑

磊子讲史
2026-05-29 16:17:30
黄仁勋从口袋掏出RTX Spark,PC行业的“iPhone时刻”来了

黄仁勋从口袋掏出RTX Spark,PC行业的“iPhone时刻”来了

新京报
2026-06-02 12:16:41
特大串通投标案,涉案金额达110亿余元,22人已判刑!

特大串通投标案,涉案金额达110亿余元,22人已判刑!

新浪财经
2026-06-03 02:41:42
鹿晗被张雨霏公主抱,张雨霏:真的太轻松了

鹿晗被张雨霏公主抱,张雨霏:真的太轻松了

动物奇奇怪怪
2026-06-02 16:22:44
阿隆索疯了!切尔西要回购自家水货,当年 6000 万买来被扫地出门

阿隆索疯了!切尔西要回购自家水货,当年 6000 万买来被扫地出门

奶盖熊本熊
2026-06-03 05:08:29
调查发现:血管最怕的早餐,油条排第6,第1名很多人天天都在吃

调查发现:血管最怕的早餐,油条排第6,第1名很多人天天都在吃

健康之光
2026-06-02 21:50:03
宝妈吐槽女儿同学来家玩没有边界感,很晚也不回家,评论区炸锅!

宝妈吐槽女儿同学来家玩没有边界感,很晚也不回家,评论区炸锅!

另子维爱读史
2026-06-02 20:59:16
以色列总理扬言伊朗政权将覆灭 !伊朗方面消息称霍尔木兹海峡通行许可已开放申请

以色列总理扬言伊朗政权将覆灭 !伊朗方面消息称霍尔木兹海峡通行许可已开放申请

每日经济新闻
2026-06-03 00:17:10
心理学:女人人品好不好,不用深交,看这两个细节,多半一目了然

心理学:女人人品好不好,不用深交,看这两个细节,多半一目了然

心理观察局
2026-06-02 06:30:21
好消息!下个月起,单位不能随便辞退老员工了!

好消息!下个月起,单位不能随便辞退老员工了!

岁月有情1314
2026-06-03 01:36:24
101万亿债务压顶!全民化债浪潮袭来,收入受影响普通人该咋办?

101万亿债务压顶!全民化债浪潮袭来,收入受影响普通人该咋办?

今朝牛马
2026-06-02 21:24:29
伊媒:霍尔木兹海峡通行许可已开放申请

伊媒:霍尔木兹海峡通行许可已开放申请

新京报
2026-06-02 21:29:37
上海男篮公示总决赛G5主场球票:有望18000名球迷见证队史第二冠

上海男篮公示总决赛G5主场球票:有望18000名球迷见证队史第二冠

狼叔评论
2026-06-03 00:23:11
小红书爆料:香港科技大学饶某教授的瓜(附完整版PDF)

小红书爆料:香港科技大学饶某教授的瓜(附完整版PDF)

考研阅读
2026-06-01 15:50:12
300架歼-20也不灵?拉瑟姆没撒谎,但他只给你看了一半真相

300架歼-20也不灵?拉瑟姆没撒谎,但他只给你看了一半真相

介知
2026-06-01 19:06:01
王晓晨俞灏明被曝就医,王晓晨街边抽烟,全程眉头紧锁,神色焦灼

王晓晨俞灏明被曝就医,王晓晨街边抽烟,全程眉头紧锁,神色焦灼

韩小娱
2026-06-02 15:22:29
奚梦瑶婚礼被扒!场地费不超50万,婚纱赞助杂志宣传,全是生意?

奚梦瑶婚礼被扒!场地费不超50万,婚纱赞助杂志宣传,全是生意?

萌神木木
2026-06-02 11:07:12
NBA官宣总决赛裁判名单:福斯特托尼兄弟等多位名哨领衔

NBA官宣总决赛裁判名单:福斯特托尼兄弟等多位名哨领衔

醉卧浮生
2026-06-03 00:41:39
2026-06-03 05:39:00
每日经济新闻 incentive-icons
每日经济新闻
中国主流财经全媒体平台。
1584816文章数 2726388关注度
往期回顾 全部

科技要闻

烧掉千亿后,美团、阿里、京东谁先止血?

头条要闻

演员魏宗万去世 曾在94版《三国演义》中饰演"司马懿"

头条要闻

演员魏宗万去世 曾在94版《三国演义》中饰演"司马懿"

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

奚梦瑶何猷君补办婚礼超幸福

财经要闻

智元和宇树的“暗战”愈演愈烈

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

手机
房产
旅游
公开课
军事航空

手机要闻

华为凌霄子母路由Q7电线版星闪电竞专链功能首批支持机型公布

房产要闻

5200巨量投资曝光!未来五年,海南格局大变!

旅游要闻

北京位列全球数字旅游引领型城市榜首

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗媒体新发布最高领袖照片

无障碍浏览 进入关怀版