网易首页 > 网易号 > 正文 申请入驻

“唠嗑式P图”,修图改图“动口不动手”!每经记者实测Gemini 2.0 Flash图像生成器:一键给漫画上色、生成图文菜谱......

0
分享至

3月12日,谷歌正式发布Gemini 2.0 Flash全模态图像生成器,支持原生图像生成功能。现在,所有开发者都可以通过Gemini API和Google AI Studio中的实验版本使用Gemini 2.0 Flash进行原生图像生成。

《每日经济新闻》记者(以下简称“每经记者”)在Gemini 2.0 Flash原生图像生成功能开放后进行了测试。测试发现,Gemini 2.0 Flash在给漫画上色、生成图文菜谱、添加元素等多项任务上,均表现出色。

图片来源:谷歌官网

“唠嗑式P图”,修图改图“动口不动手”

据谷歌介绍,Gemini 2.0 Flash具有出色的文本和图像结合能力。它能够根据文本描述生成连贯的故事,并自动匹配相应的插图,在整个故事中保持角色和场景的高度一致性。而且,用户如果对生成的内容不满意,只需给予反馈,模型便会重新讲述故事或改变绘画风格,为创作者提供了极大的便利和创作空间。

此外,其会话式图像编辑功能也十分强大,做到了“唠嗑式P图”。无论是调整细节还是探索不同的创意方向,用户都可以通过多次自然语言对话,轻松地对图像进行编辑。

在世界理解方面,Gemini 2.0 Flash与传统模型相比,具有明显优势。Gemini 2.0 Flash利用丰富的世界知识和增强的推理能力来生成图像,能够更好地理解现实世界中的各种概念和关系,从而生成更加逼真、详细且符合上下文的图像。例如,在生成食谱相关图像时,它可以准确地描绘出真实的食材和烹饪方法,同时在Google AI Studio中实现文本和图像的交错输出,让用户获得更直观的体验。

值得一提的是,Gemini 2.0 Flash在文本渲染上表现卓越。大多数传统图像生成模型在处理长段文本时,容易出现格式不佳、字符难以辨认或错别字等问题,而Gemini 2.0 Flash的内部基准测试显示,其在渲染方面优于竞争对手的领先模型,这使其在创建广告、社交媒体帖子和邀请函等需要高质量文本图像的场景中具有巨大的优势。

OpenAI前研究科学家威廉·古斯(William H.Guss)在社交媒体上感叹道,“谷歌实力回归了。”

图片来源:X

多任务实测:生成图文菜谱、制作生日贺卡、给漫画上色等轻松拿捏

在Gemini 2.0 Flash原生图像生成功能开放后,每经记者通过生成图文菜谱、制作生日贺卡、给漫画上色等多项任务,对该功能进行了测试。

任务1:添加或去掉元素

首先,记者发送了OpenAI首席执行官山姆·奥尔特曼出席活动的一张照片,希望Gemini 2.0 Flash去掉图片中的部分元素——头发。

经过五分钟的等待,Gemini 2.0 Flash完成了记者提出的需求。虽耗时较长,但令人惊喜的是,处理前后的两张图片保持了高度一致性。不管是人物神态及五官、虚化的背景墙,还是图像生成模型很难避开的“坑”——人物手部细节,Gemini 2.0 Flash都处理得相当完美

然而,Gemini 2.0 Flash在运行过程中也出现了一些状况。当记者在同一对话页面继续与模型交互,提出“去掉黄仁勋眼镜”的指令时,Gemini 2.0 Flash给出的回应并非如预期那样。其回传的图片中,主体变成了刚刚生成过的奥尔特曼形象,同时还融入了记者发送的黄仁勋图片中的英伟达芯片元素。

随后,记者又向Gemini 2.0 Flash发送了一张电车的图片,并提出在车顶上添加“TAXI”标志的指令。经Gemini 2.0 Flash处理后回传的图片,“TAXI”标志与电车整体融合度极高,几乎难以察觉到后期添加的痕迹。

不过,记者也留意到,图片中车牌上的文字变得模糊难辨,除此之外,该图片在其他方面的表现堪称出色,很难找出明显瑕疵。

任务2:上色、改色

在上一项的测试任务中,Gemini 2.0 Flash展现出的一致性表现着实令人惊艳。那么,面对线条复杂、图片中还夹杂着对话的漫画场景,Gemini 2.0 Flash能否延续其出色发挥?

记者随后发送了一张黑白漫画,并要求模型为该图片上色,且色彩风格需契合漫威的风格。

待Gemini 2.0 Flash完成处理后,记者将前后图片进行比对,发现模型精准锚定了指令需求,专注于为图片上色,未对图片其他元素做额外改动。漫画中的原有文字,无论是字体样式还是位置排版,均与处理前保持了高度一致。

图片上色不成问题,那么改动某个物体的颜色,Gemini 2.0 Flash又表现如何呢?

记者随即向Gemini 2.0 Flash发送了一张玫瑰的图片,要求模型将玫瑰的颜色改成鲜红色。

这次模型很快输出了结果。回传的图片中,玫瑰呈鲜红色,其色泽与质感高度贴近现实中红玫瑰的视觉效果,无论是花瓣的纹理还是整体色调的过渡,均处理得极为自然,几乎难以察觉AI的修改痕迹。

任务3:AI电商模特,一键换衣

随着记者加大测试难度,向其发送了一套服装的图片,要求模型将这套服装穿到一位男性模特身上,同时将图片背景色设定为橙色。

Gemini 2.0 Flash同样很好地完成了任务。图片中,服装完美适配男性模特身形,且背景色也被准确替换为橙色,整体效果自然流畅,毫无违和感。

不仅如此,当记者进一步要求AI模特展示不同动作时,Gemini 2.0 Flash同样轻松应对,快速为AI模特更换了拍照动作,堪称电商从业者的福音。

任务4:生成图文菜谱

Gemini 2.0 Flash还具备一项技能——生成图文并茂的菜谱。为测试其实际表现,记者以“番茄炒蛋”这道家常菜为例,要求模型生成一份包含详细步骤的图文菜谱。

可以看到,模型不仅完整且条理清晰地呈现出了“番茄炒蛋”的菜谱,从食材准备、烹饪步骤到火候掌控等信息一应俱全,还在菜谱相应位置精准插入了与之匹配的图片。值得注意的是,这些图片均由Gemini 2.0 Flash自行生成,而并非从互联网上搜索获取。

任务5:制作生日贺卡

在图像生成领域,众多模型在应对长段文本处理时,常陷入格式不佳、字符模糊难辨或错别字频出等问题。Gemini 2.0 Flash在这方面的表现如何呢?

记者向Gemini 2.0 Flash下达指令,要求其设计一张生日贺卡,并明确规定了贺卡上需呈现的文字祝福内容。

约十秒钟后,Gemini 2.0 Flash便生成了一张设计精美的生日贺卡。仔细查看,贺卡上不仅完整涵盖了记者所要求的全部文字,而且文字清晰易读,格式也规范得体。

总体来看,Gemini 2.0 Flash原生图像生成功能的表现可圈可点,虽有一些小瑕疵,但为图像生成技术的应用拓展了边界。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
45岁李尚宝家中离世,死因未明,一家四口皆已离世,一生未婚

45岁李尚宝家中离世,死因未明,一家四口皆已离世,一生未婚

陈意小可爱
2026-03-31 09:52:46
二婚太难了!不要彩礼不生孩,女子哭诉,相亲要对方善待母子被拒

二婚太难了!不要彩礼不生孩,女子哭诉,相亲要对方善待母子被拒

火山詩话
2026-04-05 05:50:02
断更五个月!知名网红董赤赤发声,患严重抑郁,还遭导演恶意引导

断更五个月!知名网红董赤赤发声,患严重抑郁,还遭导演恶意引导

裕丰娱间说
2026-04-04 19:21:13
斯卢茨基:谢鹏飞的能力毋庸置疑,未来还会有更多高水平表现

斯卢茨基:谢鹏飞的能力毋庸置疑,未来还会有更多高水平表现

懂球帝
2026-04-05 23:27:47
克洛普二世来了!他主动想接利物浦,斯洛特下课进入倒计时?

克洛普二世来了!他主动想接利物浦,斯洛特下课进入倒计时?

澜归序
2026-04-06 03:39:34
中国驻以使馆:将再组织一批在以中国公民通过埃及塔巴口岸转移撤离

中国驻以使馆:将再组织一批在以中国公民通过埃及塔巴口岸转移撤离

澎湃新闻
2026-04-04 16:03:26
教育部发布“教师二十严禁”!这回,老师不准做的事,全写清楚了

教育部发布“教师二十严禁”!这回,老师不准做的事,全写清楚了

笑熬浆糊111
2026-04-05 00:05:25
别让腰痛毁掉你的下半生!每天10分钟,腰板直得像20岁

别让腰痛毁掉你的下半生!每天10分钟,腰板直得像20岁

徐孟医生说疼痛
2026-04-03 07:00:15
随着浙江0-1,武汉三镇2-5,上海申花3-2,中超最新积分榜出炉

随着浙江0-1,武汉三镇2-5,上海申花3-2,中超最新积分榜出炉

俯身冲顶
2026-04-05 21:52:31
亚洲第一赌场新东泰覆灭记:性交易泛滥,富商疯狂砸钱,挥金如土

亚洲第一赌场新东泰覆灭记:性交易泛滥,富商疯狂砸钱,挥金如土

谈史论天地
2026-04-04 17:30:03
巡回锦标赛收官:再爆大冷世界第1惨败!赵心童夺冠了=历史第一人

巡回锦标赛收官:再爆大冷世界第1惨败!赵心童夺冠了=历史第一人

求球不落谛
2026-04-06 05:10:07
马克龙承诺高示,G7峰会没中国,48小时刚过,又在韩国摆中方一道

马克龙承诺高示,G7峰会没中国,48小时刚过,又在韩国摆中方一道

三石记
2026-04-05 23:48:07
一级致癌物已经公布,世卫组织呼吁停止食用,看完转告父母

一级致癌物已经公布,世卫组织呼吁停止食用,看完转告父母

刘哥谈体育
2026-04-05 00:07:28
联合国:苏丹医疗机构遭袭已致超2000人死亡

联合国:苏丹医疗机构遭袭已致超2000人死亡

环球网资讯
2026-04-04 19:18:15
男子骑电动车带妻子去接孩子,途中车底锂电池突然爆燃,火焰瞬间吞没车身,后座的妻子沦为火人

男子骑电动车带妻子去接孩子,途中车底锂电池突然爆燃,火焰瞬间吞没车身,后座的妻子沦为火人

观威海
2026-04-05 07:31:02
特朗普宣布:美军完成史上最大胆搜救行动,一名飞行员安全获救

特朗普宣布:美军完成史上最大胆搜救行动,一名飞行员安全获救

可达鸭面面观
2026-04-05 12:53:09
16GB+1TB!新机官宣:5月31日,开启预约!

16GB+1TB!新机官宣:5月31日,开启预约!

科技堡垒
2026-04-05 11:23:12
82比81险胜1分!女篮霸主斩获开门红:9大国手混战太火爆了!

82比81险胜1分!女篮霸主斩获开门红:9大国手混战太火爆了!

篮球快餐车
2026-04-06 00:08:28
美军跳伞飞行员身背“小金库”,步枪金条电台一应俱全,非常难捉

美军跳伞飞行员身背“小金库”,步枪金条电台一应俱全,非常难捉

利刃号
2026-04-05 23:38:07
抵达日本!张本智和爸爸上任,新岗位曝光,年薪不菲,开启新时代

抵达日本!张本智和爸爸上任,新岗位曝光,年薪不菲,开启新时代

萌兰聊个球
2026-04-05 16:48:53
2026-04-06 06:43:00
每日经济新闻 incentive-icons
每日经济新闻
中国主流财经全媒体平台。
1529275文章数 2725080关注度
往期回顾 全部

科技要闻

花200薅5千算力,Claude冷血断供“龙虾”

头条要闻

伊朗军方:过去两天击落美军12架战机

头条要闻

伊朗军方:过去两天击落美军12架战机

体育要闻

CBA最老球员,身价7500万美元

娱乐要闻

王灿兮否认婆媳不和 晒与杜淳妈合影

财经要闻

谁造出了优思益这头“怪物”?

汽车要闻

家用SUV没驾驶乐趣?极氪8X第一个不同意

态度原创

游戏
健康
本地
旅游
公开课

三天鼠标干坏两个,你这还是自走棋嘛?

干细胞抗衰4大误区,90%的人都中招

本地新闻

跟着歌声游安徽,听古村回响

旅游要闻

文明旅游|清明出游请注意!莫让这些不文明行为煞风景!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版