网易首页 > 网易号 > 正文 申请入驻

ChatGPT能靠吉卜力风翻盘吗?

0
分享至

出品|虎嗅科技组

作者|余杨

编辑|苗正卿

头图|视觉中国

在大模型热火朝天的战斗之中,吉卜力拉了OpenAI一把。

4月7日消息,OpenAI正在测试为GPT-4o图像生成模型加入水印。

这是一款最初只对ChatGPT Plus用户开放的ImageGen模型,能够生成带有文字的图片和逼真的视觉作品。OpenAI表示,该模型通过大量图像与文本的联合训练,展现出惊艳的视觉表现力和良好的上下文理解能力。

一周前的愚人节,OpenAI首席执行官山姆·奥特曼刚刚宣布,ChatGPT图像生成功能将向所有免费用户推出。很快,吉卜力风格的 AI 图迅速全网刷屏。

紧随其后,Midjourney 发布 AI 图片生成模型 Midjourney V7 版本并开启 alpha 测试。全新的“草图模式”,支持对话式交互界面、实时编辑、语音识别生成功能。作为OpenAI的“同款”,Midjourney不甘示弱,和OpenAI 暗暗较劲。

“吉卜力”(Ghibli)是宫崎骏的动画工作室和美术馆的名称,其含义指的是撒哈拉沙漠上吹过的热风。风格特点主要是水粉与水彩的结合,动画的核心多与自然相关,又在自然中注入了高级灰,呈现出轻盈温柔、舒适幽静的视觉效果。

不仅如此,这种风格擅长通过同类色的色彩滤镜传达画面情绪,在同类色比重较高的画面中,又通过笔触和细微配色差异性来调度画面层次,运用暖光加强深浅层次。人物设计上则强调简约与绘本风格,使用干练的简笔线条勾勒形象。

OpenAI正在为免费用户生成的图像测试水印,而ChatGPT Plus用户则可保存无水印图像。

今天就一起来看看ChatGPT的魔法,测评一下OpenAI 的吉卜力实力。

prompt1:没有圆柏的北京 春天 阳光明媚 周末的马路上 人群穿梭 中景 吉卜力风格

prompt2:九又四分之三站台 有人在抽烟 旁边有人斜视 近景 吉卜力风格

prompt3:自由女神在电脑面前办公 戴着防蓝光眼镜 脸上流露出牛马的苦恼 特写 吉卜力风格

参与测评的玩家则有即梦、可灵和ChatGPT,也看看各家所长。

即梦AI

即梦的文生图,速度很快,平均10秒。

不仅如此,支持图片比例的调整,在完成图片生成后,可以挑选图片进行编辑,支持高清、细节修复、局部重绘、生成视频、扩图、消除笔等功能。

最终生成图如下。

prompt1:没有圆柏的北京 春天 阳光明媚 周末的马路上 人群穿梭 中景 吉卜力风格

prompt2:九又四分之三站台 有人在抽烟 旁边有人斜视 近景 吉卜力风格

prompt3:自由女神在电脑面前办公 戴着防蓝光眼镜 脸上流露出牛马的苦恼 特写 吉卜力风格

可灵AI

可灵的等待时间略长于即梦,大约30秒生成完毕。

不过,可灵有着较好的生态组合,prompt输入框的右上角就有着DeepSeek的提示词优化入口,图片生成完成后,又可以一键点击生成视频。也就是说,从文到图、再从图到视频,可灵给安排得明明白白。

最终生成效果如下。

prompt1:没有圆柏的北京 春天 阳光明媚 周末的马路上 人群穿梭 中景 吉卜力风格

prompt2:九又四分之三站台 有人在抽烟 旁边有人斜视 近景 吉卜力风格

prompt3:自由女神在电脑面前办公 戴着防蓝光眼镜 脸上流露出牛马的苦恼 特写 吉卜力风格

ChatGPT

根据OpenAI在官网的介绍,它的文生图模型DALL·E 3 是基于 ChatGPT 原生构建的,它适用于利用 ChatGPT 做头脑风暴创意,只需要询问 ChatGPT 想在从简单句子到详细段落的任何内容中看到什么即可。

和可灵借助DeepSeek一样,ChatGPT 会自动为 DALL·E 3 生成量身定制的详细提示。

同时支持对图片的微调,即如果对某张图片大致满意,但又有不太合适的地方,可以要求 ChatGPT 用几句话进行调整。

点开右边的更多,可以看到创建图片的选项。选择创建图片,输入prompt即可。

整体来说,操作简单,流程丝滑,30秒左右的时候已经产生基本色调,但整个过程的平均等待时长达到了150秒。

下面是成果。

prompt1:没有圆柏的北京 春天 阳光明媚 周末的马路上 人群穿梭 中景 吉卜力风格

prompt2:九又四分之三站台 有人在抽烟 旁边有人斜视 近景 吉卜力风格

prompt3:自由女神在电脑面前办公 戴着防蓝光眼镜 脸上流露出牛马的苦恼 特写 吉卜力风格

总结

即梦以平均10秒的生成速度脱颖而出,这种即时性对于需要快速迭代创意的用户来说是巨大的优势。然而,速度的提升往往伴随着细节把控的妥协。从生成效果来看,即梦的图像虽然能够快速呈现吉卜力风格的基调,但在情绪传达和层次调度上稍显不足。尤其是prompt1中“没有圆柏的北京”这一复杂场景,即梦的生成结果未能完全捕捉到“高级灰”与“自然氛围”的微妙平衡。

相比之下,可灵虽然生成速度稍慢(约30秒),但通过DeepSeek的提示词优化和视频生成能力,构建了一个从文到图再到视频的完整生态。这种生态整合能力,尤其适合需要多模态输出的用户,比如动画创作者或短视频制作者。

从生成图片的质量上看,ChatGPT对吉卜力风格有着更好的理解,色调和情绪的把控都相对准确。例如,在prompt3“自由女神在电脑前办公”这一脑洞场景中,ChatGPT成功捕捉到了“防蓝光眼镜”与“牛马的苦恼”之间的微妙情绪张力,同时保持了吉卜力风格的轻盈与温柔。

这种优势源于ChatGPT的提示词优化机制。它能够根据用户输入的prompt,自动生成更详细的描述,从而提升生成图像的精准度。此外,ChatGPT支持对图像的微调功能,允许用户通过简单的语言描述调整细节,这种灵活性进一步增强了其在创意表达上的竞争力。

官网的展示中,ChatGPT所生成的图片风格并不限于吉卜力,还有如下的细节图、脑洞图和创意图。

而对于图片版权问题,大方开源,使用 DALL·E 3 创建的图像归属用户,无需获得OpenAI许可即可重印、出售或销售。

不仅如此,OpenAI确认正在开发ImageGen API,未来开发者可利用该API构建应用产品,拓展图像生成模型的应用场景。开发者可以利用该API构建自己的应用产品,比如教育工具、设计辅助平台等。这种开放生态的构建,将推动AI生成图像技术的普及与创新。

ChatGPT这次换了个思路。似乎显示着,大语言模型一枝独秀还不够,集成多种生态的多元赛道势头正好。用产品cue着中国的大模型:该你出牌了。

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com

本文来自虎嗅,原文链接:https://www.huxiu.com/article/4218368.html?f=wyxwapp

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
如果不出意外,2026年7月开始,中国楼市或迎来“5大变局”

如果不出意外,2026年7月开始,中国楼市或迎来“5大变局”

童童聊娱乐啊
2026-06-28 20:56:13
中国灵活就业者突破3.2亿大关,占就业人口比例高达44%。

中国灵活就业者突破3.2亿大关,占就业人口比例高达44%。

流苏晚晴
2026-06-13 18:21:18
非必要不做CT?医生强调:只要做过CT,患者一定多加关注这4点!

非必要不做CT?医生强调:只要做过CT,患者一定多加关注这4点!

叙说医疗健康
2026-06-16 08:00:21
皇马新援B席世界杯与罗德里戈提前碰面

皇马新援B席世界杯与罗德里戈提前碰面

赛场名场面
2026-06-29 00:18:33
一场不可思议的3-3,让亚足联的遮羞布,变成了伊朗的“亡命符”

一场不可思议的3-3,让亚足联的遮羞布,变成了伊朗的“亡命符”

林子说事
2026-06-28 21:15:52
“为钱玩命的傻瓜用完了!”前线军人道破真相:克里姆林宫只剩两条路?

“为钱玩命的傻瓜用完了!”前线军人道破真相:克里姆林宫只剩两条路?

荷兰豆爱健康
2026-06-28 10:15:29
很多人已经在崩k的边缘了!

很多人已经在崩k的边缘了!

灯锦年
2026-06-23 20:04:22
生日尾数是这6个数,年轻时多吃苦奔波,晚年富贵福气挡不住

生日尾数是这6个数,年轻时多吃苦奔波,晚年富贵福气挡不住

叮当当科技
2026-06-28 21:25:52
网传80%的高校教师陷入最无奈的困境,没空做学术…

网传80%的高校教师陷入最无奈的困境,没空做学术…

慧翔百科
2026-06-23 11:34:37
俄罗斯GDP,1993年是中国的97%,2009年是中国的23.5%,2025年呢

俄罗斯GDP,1993年是中国的97%,2009年是中国的23.5%,2025年呢

混沌录
2026-06-24 22:25:07
1951年海南剿匪,横行11年女匪首被捕,老政委看了一眼耳环当场吓跪

1951年海南剿匪,横行11年女匪首被捕,老政委看了一眼耳环当场吓跪

睡前讲故事
2026-06-18 19:33:01
离谱!1区TOP论文,图片含“豆包AI水印” ,兰州大学发布《情况说明》

离谱!1区TOP论文,图片含“豆包AI水印” ,兰州大学发布《情况说明》

高分子科学前沿
2026-06-28 17:17:10
1亿中锋仅要1个首轮!交易市场最超值的大鱼出现,湖人等多队哄抢

1亿中锋仅要1个首轮!交易市场最超值的大鱼出现,湖人等多队哄抢

你的篮球频道
2026-06-28 11:57:08
200万粉网红诋毁袁隆平水稻育种技术,抖音回应:已无限期封号

200万粉网红诋毁袁隆平水稻育种技术,抖音回应:已无限期封号

识礁Farsight
2026-06-28 17:24:49
法国的国菜鹅肝,正在被中国的两个小县城悄悄打垮。

法国的国菜鹅肝,正在被中国的两个小县城悄悄打垮。

电动猫
2026-06-26 13:17:53
百亿福耀科大办学一年就扛不住?高分考生别盲目冲新校

百亿福耀科大办学一年就扛不住?高分考生别盲目冲新校

音乐时光的娱乐
2026-06-28 19:26:03
繁华后的凄凉:耗资近34亿的鸟巢,如今被用来干嘛了?回本了吗?

繁华后的凄凉:耗资近34亿的鸟巢,如今被用来干嘛了?回本了吗?

非虚构人间
2026-06-29 00:18:18
同是穆斯林都信真主,爱吃烤肉,土耳其和阿拉伯为何相互看不顺眼

同是穆斯林都信真主,爱吃烤肉,土耳其和阿拉伯为何相互看不顺眼

孤痞野猫
2026-06-27 17:08:05
改革、重组,中国央国企马上要迎来一场大洗牌?

改革、重组,中国央国企马上要迎来一场大洗牌?

时尚的弄潮
2026-06-28 12:01:37
劳动性所得统一征税!国家新明确:未来五年,税收将迎来8大变化

劳动性所得统一征税!国家新明确:未来五年,税收将迎来8大变化

学税
2024-07-23 15:25:30
2026-06-29 01:56:49
虎嗅APP incentive-icons
虎嗅APP
个性化商业资讯与观点交流平台
26554文章数 687841关注度
往期回顾 全部

科技要闻

DeepSeek最新论文:如何让大模型跑得更快

头条要闻

四川宜宾市高县发生5.5级地震 震中距宜宾28公里

头条要闻

四川宜宾市高县发生5.5级地震 震中距宜宾28公里

体育要闻

两周飞5万公里!因凡蒂诺遭环保人士猛批

娱乐要闻

曾沛慈拿下《乘风2026》年度总冠军

财经要闻

省钱,我只服梁文锋

汽车要闻

搭载华为乾崑六件套 东风奕派M8预售19.98万起

态度原创

本地
家居
艺术
公开课
军事航空

本地新闻

世界杯球迷节:比球赛更好玩的派对

家居要闻

绿意盎然 自然之境

艺术要闻

她不用笔,她用刀

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普又发文威胁:伊朗将不复存在

无障碍浏览 进入关怀版