网易首页 > 网易号 > 正文 申请入驻

OpenAI深夜上线「一句话改图」,ChatGPT免费用户也能用

0
分享至

今日凌晨,OpenAI 悄悄推出了由 GPT-4o 支持的「自由生图」功能——Images in ChatGPT。

自此,创建和定制图片就像使用 GPT-4o 聊天一样简单——你需要做的,只是描述你的需求,包括任何具体细节,如长宽比、使用十六进制代码的精确颜色或透明背景。

例如,向 GPT‑4o 输入一段描述,在描述中说明场景、主体和细节:

用手机拍摄的玻璃白板的广角图像,拍摄地点是一间俯瞰海湾大桥的房间。视野中可以看到一位女士正在写字,她身穿印有大型 OpenAI 标志的 T 恤。字迹看起来很自然,但有点凌乱,我们可以看到摄影师的倒影。

同时,GPT‑4o 还可以根据提供的文字内容,在生成图片的白板上生成相应的笔记。

在输入新的指令“摄影师的自拍照,她转身和他击掌”后,图片中的人物相应的变换动作,甚至白板上的反光都能够对应上。

目前,该功能现已面向 ChatGPT 的所有订阅层级用户开放,包括免费用户,但免费用户的使用次数有限制。由于这一模型创建的图片更详细,因此图片渲染时间更长,通常需要一分钟。

OpenAI 表示,这一功能将作为 ChatGPT 的默认图像生成器,也可以在 Sora 中使用。开发人员很快就能通过 API 使用 GPT-4o 生成图像,并在未来几周内推出访问权限。

5 大改进能力

OpenAI 表示,他们根据在线图像和文本的联合分布训练模型,学习图像与语言及彼此间关系。同时,结合后训练,使得模型具备视觉流畅性,能够生成有用、一致且具上下文感知的图像。

1.文本渲染能力

GPT-4o 现在可以将精确符号与图像融合,通过自然对话优化图像,在图像中添加文字提升含义,且能在聊天中确保图像一致性。

制作两个 20 多岁的女巫(一个是白发,一个是长波浪卷发)阅读路牌的逼真图像。 背景: 纽约州威廉斯堡的一条城市街道上,一根电线杆上挂满了许多详细的路标(如:街道清扫时间、停车许可证要求、车辆分类等)、街道清扫时间、所需停车许可证、车辆分类、拖车规则),包括中间几个可笑的标志:(为了使这些路牌合法化,请转述)“C 区不允许女巫用扫帚停车”、“魔毯只能装卸(15 分钟限制)”、“驯鹿停车只能凭许可证(12 月 24-25 日),违反者将被列入淘气名单”。路标位于街道右侧。请勿重复标志。标志必须逼真。 人物: 一个女巫拿着扫帚,另一个女巫拿着卷起来的魔毯。她们位于前景,背对镜头,头微微倾斜,仔细观察标志。 从背景到前景的构图: 街道 + 停放的汽车 + 建筑物 -> 路牌 -> 女巫。人物必须离拍摄镜头最近。

2.多轮生成

用户可以通过与 GPT-4o 的自然对话来优化图像,在聊天上下文的基础上,结合图像和文本信息,确保内容的一致性。例如,当用户设计一个电子游戏角色时,在不断优化和尝试的过程中,这个角色的外观在多次迭代中都能保持连贯。例如:

你能为我制作一个可爱的简约浣熊吃草莓贴纸吗?使用白色粗边框和透明背景。

尝试不同的简约风格和灰色浣熊图案。

哦,你能不能在草莓上加上一个咀嚼的痕迹,或者在嘴巴周围加一些红色的乱七八糟的东西?

3.指令遵循

GPT‑4o 的图像生成遵循详细的提示,注重细节。其他系统在处理约 5-8 个对象时会遇到困难,而 GPT‑4o 可以处理多达 10-20 个不同的对象。对象与其特征和关系的更紧密绑定使得对图像的控制更好。

正方形图像包含一个 4 行 4 列的网格,白色背景上有 16 个物体。从左到右,从上到下。列表如下: 蓝色星星 红色三角形 绿色正方形 粉红色圆形 橙色沙漏 紫色无穷大标志 黑白圆点领结 扎眼的 "42" 一只戴着黑色棒球帽的橙色猫 一张带宝箱的地图 一双眨巴眨巴的眼睛 一个竖起大拇指的表情符号 一把剪刀 一只蓝白相间的长颈鹿 用草书书写的单词 "OpenAI" 彩虹色的闪电

4.上下文学习能力

GPT-4o 可对用户上传的图像进行分析和学习,将图像细节与上下文无缝整合,为图像生成提供信息。

5.世界知识

GPT‑4o 可分析学习用户上传图像,将其细节融入上下文指导图像生成,原生图像生成使模型更智能高效。


照片写实主义和风格

通过对多种风格图像训练,模型能创建或转换逼真图像,可按要求生成特定场景的照片。

图|一张狗仔队风格的抓拍照片,照片中的卡尔・马克思正匆忙地走过某个地方。

图|一只猫看着街上的一滩水,但是它在水中的倒影是一只老虎,并且两个倒影都被水中的涟漪逼真地扭曲了。

图|一张 2006 年夏天一个周六多伦多农贸市场的逼真照片。那是六月下旬一个美丽的日子,人们在购物和吃三明治。焦点应该是一个年轻的亚洲女孩,她穿着牛仔背带裤,正在喝草莓香蕉冰沙,其余部分可以模糊处理。这张照片应该让人想起 2006 年的数码相机所拍摄的照片,要有像打印照片那样的时间戳。宽高比应为 3:2。

局限性

目前,模型还存在一些局限性,如裁剪较长图像时可能截不全;图像生成也可以虚构信息,特别是在低上下文提示的情况下。

当生成依赖于其知识库的图像时,它可能难以同时准确地呈现 10 到 20 多个不同的概念,例如完整的元素周期表。

该模型有时在呈现非拉丁语言时会遇到困难,并且字符可能不准确或出现幻觉,尤其是在更复杂的情况下。

对图像生成的特定部分进行编辑的请求(如纠正错别字)并不总是有效的,并且可能会以非预期的方式改变图像的其他部分或引入更多错误。OpenAI目前正在努力提高模型的编辑精度。

另外,该模型在被要求以非常小的尺寸呈现细节信息时会遇到困难。

最后,OpenAI 还强调了在新功能中实施的安全措施,以防止滥用行为。所有生成的图像都包含数字水印,标明其由 AI 生成,且用户拥有这些图像的完整使用权,但需遵守使用政策。

整理:锦鲤

如需转载或投稿,请直接在公众号内留言

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
众星悼念张雪峰,朱伟长文看哭网友!猝逝前直播画面竟成最后影像

众星悼念张雪峰,朱伟长文看哭网友!猝逝前直播画面竟成最后影像

露珠聊影视
2026-03-25 13:32:19
你知道我在床上有多厉害吗?

你知道我在床上有多厉害吗?

果粉之家
2026-03-20 12:35:16
55集谍战大剧燃情来袭!双面间谍无缝切换,谍影重重,一触即发

55集谍战大剧燃情来袭!双面间谍无缝切换,谍影重重,一触即发

阿乐乐电影v
2026-03-26 16:30:09
四川多所中学发布严正声明

四川多所中学发布严正声明

四川省教育厅
2026-03-26 10:57:12
1965年,毛主席点名让彭德怀复出,背后有人拼命阻挠,这人后来判了18年

1965年,毛主席点名让彭德怀复出,背后有人拼命阻挠,这人后来判了18年

史海孤雁
2026-03-25 18:31:11
张雪峰公司对联已拆!一个月前注册近40枚“姩菡”商标,捐款千万

张雪峰公司对联已拆!一个月前注册近40枚“姩菡”商标,捐款千万

离离言几许
2026-03-25 15:07:06
心眼坏的人,最爱问这3件事,别傻乎乎全说!

心眼坏的人,最爱问这3件事,别傻乎乎全说!

唯晨说
2026-03-25 13:12:14
面相这东西真藏不住,停播一个半月的李亚鹏,

面相这东西真藏不住,停播一个半月的李亚鹏,

小光侃娱乐
2026-03-26 16:05:08
台积电突然断供?直接甩出“稀土”,外媒:这才是真正的杀手锏!

台积电突然断供?直接甩出“稀土”,外媒:这才是真正的杀手锏!

瑛派儿老黄
2026-03-24 18:56:06
C罗儿子要加盟皇马?15岁迷你罗试训皇马,C罗的7号后继有人

C罗儿子要加盟皇马?15岁迷你罗试训皇马,C罗的7号后继有人

仰卧撑FTUer
2026-03-25 23:05:29
国产顶级神剧,只可惜,央视播完就禁了

国产顶级神剧,只可惜,央视播完就禁了

独立鱼
2026-03-23 21:22:17
张水华为赚钱拼了!7天2赛冲连冠:奖金3万+出场费10万+一辆车

张水华为赚钱拼了!7天2赛冲连冠:奖金3万+出场费10万+一辆车

念洲
2026-03-26 13:14:49
太堵了!网友盼早日修成都地铁29号线,官方回应

太堵了!网友盼早日修成都地铁29号线,官方回应

天府观察
2026-03-26 16:00:34
伊朗据悉要求希望通过霍尔木兹海峡的船舶提供船员和货物详情

伊朗据悉要求希望通过霍尔木兹海峡的船舶提供船员和货物详情

财联社
2026-03-25 18:48:03
人社部明确:事业编制改革启动,3100万人的“铁饭碗”要变了

人社部明确:事业编制改革启动,3100万人的“铁饭碗”要变了

慧眼看世界哈哈
2026-03-24 06:36:05
油价反转!95号汽油破9元后迎下调,4月7日调价最新预测

油价反转!95号汽油破9元后迎下调,4月7日调价最新预测

复转这些年
2026-03-26 09:40:14
打疯!东契奇生涯32次单节20+追平哈登 历史第三仅输库里科比

打疯!东契奇生涯32次单节20+追平哈登 历史第三仅输库里科比

醉卧浮生
2026-03-26 07:54:15
特朗普撑腰没人领情,当着全美的面,欧尔班宣告:中国不可战胜

特朗普撑腰没人领情,当着全美的面,欧尔班宣告:中国不可战胜

小童历史
2026-03-26 17:06:12
特朗普:伊朗在谈判但不敢明说,其领导人怕被自己人干掉!伊外长:与美“交流信息” ,没谈判!美媒:万斯将前往巴基斯坦讨论停战

特朗普:伊朗在谈判但不敢明说,其领导人怕被自己人干掉!伊外长:与美“交流信息” ,没谈判!美媒:万斯将前往巴基斯坦讨论停战

每日经济新闻
2026-03-26 09:53:08
俄罗斯宣传三天攻占爱沙尼亚!炮制公投,又是特别军事行动?

俄罗斯宣传三天攻占爱沙尼亚!炮制公投,又是特别军事行动?

项鹏飞
2026-03-24 20:28:43
2026-03-26 17:40:49
学术头条
学术头条
致力于学术传播和科学普及,重点关注AI4Science、大模型等前沿科学进展。
1430文章数 5081关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

男子从四家公司贷出共计356万元 实际到手却仅8万多元

头条要闻

男子从四家公司贷出共计356万元 实际到手却仅8万多元

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

长护险谁能享受?享受多少?解答来了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

教育
数码
旅游
时尚
军事航空

教育要闻

中小学家长必看数据,看与不看都会后悔

数码要闻

苹果MacBook Neo将重塑整个笔电行业!分析师纷纷强调:打不过

旅游要闻

视点|陶然亭公园海棠春花文化节,解锁春日新体验

皮衣+裙,高级到炸

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版