网易首页 > 网易号 > 正文 申请入驻

OpenAI直播狙击谷歌,奥特曼AGI梗图现场直出!GPT-4o超强原生生图来袭

0
分享至

新智元报道

编辑:Aeneas 好困

【新智元导读】刚刚,OpenAI深夜直播,GPT-4o的原生图像生成大升级!奥特曼亲自上阵组队,演示了自拍变梗图、相对论漫画等功能,不过相对隔壁谷歌发布的新模型,OpenAI的这波动作着实有点不够看。

就在谷歌刚刚扔出地表最强模型Gemini 2.5 Pro不久,OpenAI也有动作了。

奥特曼亲自带队,展示了GPT-4o图像生成技术的各种大升级,比如制作梗图、文本渲染、多轮交互生成和指令遵循等。

整个直播中最亮的演示,莫过于这张官方玩梗的表情包了。

目前,这项功能已经在ChatGPT和Sora中,向所有Plus、Pro、Team和免费用户推出。

当然,新版Sora生图的时间,也比以往更长了。但OpenAI看来,生图的质量和其具备的世界知识,让用户值得等待那多出的几秒。

GPT-4o原生图像生成来了!

在直播中,奥特曼介绍道,从今天起,ChatGPT中的原生图像生成功能正式推出!

GPT-4o的全模态能力,从此也融合进了Sora中。

OpenAI多模态研究的负责人Gabe介绍说,两年前刚开始这个项目时,他对于GPT-4这个强大的模型会怎样原生支持图像模型非常好奇。

一年后,当模型完成训练时,他看到了令人兴奋的迹象。从GPT-2以来,他已经很久没有这种感觉——这是一个疯狂时刻。

给出以下prompt,GPT-4o就生成了符合要求的图像,完全还原了要求。

接下来,三个人用手机来了张自拍,GPT-4o立刻把三人自拍转换成了动漫风格的版本。

甚至他们开始官方玩梗,让模型添加一段「Feel The AGI」在图片上,一张表情包就此诞生。

这个过程,就体现了4o作为全能模型的强大能力。

因为它不仅仅是一个语言模型,还包括图像、音频,所有输入和输出的模态。它可以理解、生成这些模态,并且无缝地在它们之间工作。

用OpenAI的话说,「我们终于迈向了这种真正集成的多模态模型」。

接下来,他们让模型画出一幅描述相对论的漫画,要求通俗易懂,还要加入一些幽默元素。

这个提示词非常模糊,因此看看模型会生成什么样的图,就格外令人期待了。果然,生成效果令人惊喜。

注意,这个过程中,模型很可能利用了自己的世界知识,对提示词进行了扩展。

然后,他们给了模型一张卡片,希望生成同样风格的图像,但要求主角不再是卡片中的巨猫国王,而是某位研究者的狗狗。

另外,卡片上还需要出现一些细节,比如模型的名字和年份,以及狗狗的体重和身高。

可以看到,生成图像在文本渲染方面非常惊艳,所有数据都准确无误。

最后一个演示,是基于此前几人生成的内容,制作一个纪念币。

而且,还要求图使用了一个特殊的十六进制代码,且加上生成图像的文本和日期。

可以看到,生成结果非常惊艳!此前曾出现的艺术熊、收音机、爱因斯坦漫画、研究者的狗狗以及模型名称和日期,全部都出现在了纪念币上。

模型之所以精准完成这样复杂的要求,是因为它是用非自回归的方式训练的,因此它能够理解上下文中的文本和多张图片,以非常和谐的方式在纪念币上呈现出来。

和GPT-4o聊天,定制各种图像

总之,现在使用这个功能,我们可以创建各种图像,或将其转换为各种风格。

从此,用GPT-4o创建和定制图像,就像聊天一样简单。

只需描述所需,就能得到想要的任何细节,比如纵横比、使用十六进制代码的精确颜色或透明背景。

我们可以让它设计一个信息图,解释牛顿的棱镜宽高比,背景为深蓝色。

一张画质高级的教学级图片,立马生成。

这个图像生成功能的特点就是,能遵循非常复杂的提示,极其注重细节。

15个非常细化的要求,它都在一张图里完美实现了。

要知道,大多数生图模型被要求渲染多个项目时,往往就会混淆颜色和形状,但新模型却能正确绑定15到20个对象的属性,还能成功理解各自的复杂需求。

在你和它的聊天上下文中,GPT-4o就能为你构建图像和文本,还能确保一致性。

主打一个实用

从最早的洞穴壁画到现代信息图表,人类一直使用视觉图像来交流、说服和分析。

如今的生成式AI模型可以创造出超现实的场景,但在处理人们用于分享和创建信息的实用图像方面仍然存在困难。

GPT‑4o的图像生成功能擅长准确渲染文本,精确遵循提示词,并利用GPT-4o固有的知识库和聊天上下文——包括转换上传的图像或将其用作视觉灵感。

这些能力让用户可以更加容易地创建想象中的画面,帮助通过视觉更有效地沟通,并将图像生成发展成为一种具有精确性和强大功能的实用工具。

毕竟,只有当图像配上指代共享语言和经验的符号时,才能传达精确的含义。

左右滑动查看

能力大幅增强

通过线上图像和文本的联合分布训练,模型不仅能学会图像如何与语言相关联,还能知道它们之间的相互关系。

结合积极的后训练优化,最终的模型展现出惊人的视觉表现力,能够生成实用、一致且具有上下文感知能力的图像。


文本渲染

一张图片胜过千言万语,但有时在正确的位置添加几个词能够大大提升图像的含义。

GPT-4o将精确的符号与图像融合的能力使图像生成成为视觉交流的有力工具。

左右滑动查看

多轮交互生成

由于图像生成现在是GPT‑4o的原生功能,用户可以通过自然对话来完善图像。

GPT‑4o能够基于聊天上下文中的图像和文本进行构建,确保始终保持一致性。

比如,一个正在设计中的游戏角色,它的外观就能在多次迭代和调整中保持连贯一致。

指令遵循

GPT‑4o的图像生成功能不仅可以遵循详细的提示词,而且还十分注重细节。

相比起其他只能处理5-8个物体的模型,GPT‑4o可以轻松搞定多达10-20个不同的物体。

并且,物体与其特征和关系的更紧密绑定使得控制更加精准。

左右滑动查看

上下文内学习

GPT‑4o能够分析并学习用户上传的图像,将图像细节无缝整合到上下文中,用于辅助图像生成。

左右滑动查看

世界知识

内置的图像生成功能使GPT‑4o能够连接文本和图像之间的知识,使模型表现得更智能、更高效。

左右滑动查看

真实照片风格

通过对反映多种多样图像风格的图像进行训练,模型能够以令人信服的方式创建或转换图像。

左右滑动查看

左右滑动查看

左右滑动查看

参考资料:

https://openai.com/index/introducing-4o-image-generation/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
楼上大爷偷我快递不认,我换地址把寄去公司,几天后物业打来电话

楼上大爷偷我快递不认,我换地址把寄去公司,几天后物业打来电话

秋风专栏
2025-10-06 11:43:21
金鸡奖成“照妖镜”,宋佳被倪萍嘲讽,饺子导演缺席,太多人破防

金鸡奖成“照妖镜”,宋佳被倪萍嘲讽,饺子导演缺席,太多人破防

叶公子
2025-11-16 22:02:12
录音终局:秦雯的无能与王家卫的选择,他们赌古二活不到胜利那天

录音终局:秦雯的无能与王家卫的选择,他们赌古二活不到胜利那天

动物奇奇怪怪
2025-11-17 13:28:57
无缘4强!辽宁18分惨负,乌戈满脸不甘,张陈治锋空砍27分23篮板

无缘4强!辽宁18分惨负,乌戈满脸不甘,张陈治锋空砍27分23篮板

萌兰聊个球
2025-11-17 16:32:06
从想再生一胎到法庭对峙,钟嘉欣的婚姻碎得太突然

从想再生一胎到法庭对峙,钟嘉欣的婚姻碎得太突然

述家娱记
2025-11-14 20:47:46
泰王不懂妻美!和苏提达王后参观北京航天城,对其使眼神表情严肃

泰王不懂妻美!和苏提达王后参观北京航天城,对其使眼神表情严肃

可乐谈情感
2025-11-17 13:44:56
十年陪练无人知!何卓佳被罚分情绪失控,万万没想到郭焱会这样说

十年陪练无人知!何卓佳被罚分情绪失控,万万没想到郭焱会这样说

揽星河的笔记
2025-11-17 15:08:10
中国为何要在老山打轮战?越南少将:太致命,直接把越南推入绝境

中国为何要在老山打轮战?越南少将:太致命,直接把越南推入绝境

顾史
2025-11-17 15:22:29
再也藏不住了,深扒之后才发现,原来陈梦和樊振东是'同病相怜'

再也藏不住了,深扒之后才发现,原来陈梦和樊振东是'同病相怜'

丁隗解说
2025-11-17 03:35:37
宋佳获金鸡影后仅一天,令人厌恶的一幕发生,孙俪章子怡都被牵连

宋佳获金鸡影后仅一天,令人厌恶的一幕发生,孙俪章子怡都被牵连

胡一舸南游y
2025-11-17 19:45:18
合肥局地此刻雪花纷飞

合肥局地此刻雪花纷飞

鲁中晨报
2025-11-17 19:06:05
1950年云南女匪首缴械投降,她从怀中掏出一物,首长看后泪流不止

1950年云南女匪首缴械投降,她从怀中掏出一物,首长看后泪流不止

萧竹轻语
2025-11-14 17:13:18
300008,股价大涨!公司称在手订单约140亿元!

300008,股价大涨!公司称在手订单约140亿元!

证券时报e公司
2025-11-17 10:40:43
著名表演艺术家在表演时突然倒地,被送医后经全力抢救无效去世

著名表演艺术家在表演时突然倒地,被送医后经全力抢救无效去世

极目新闻
2025-11-16 16:38:13
央媒发文,28岁樊振东高调官宣喜讯,全网恭喜,终于等到这一天

央媒发文,28岁樊振东高调官宣喜讯,全网恭喜,终于等到这一天

不写散文诗
2025-11-17 15:14:33
戴笠霸占胡蝶3年?胡蝶晚年坦言:戴笠对我很好,我不会忘记他的

戴笠霸占胡蝶3年?胡蝶晚年坦言:戴笠对我很好,我不会忘记他的

史之铭
2025-11-17 14:16:54
越人民军政治总部:79年重创中国9个主力军,俘260,消灭62500人

越人民军政治总部:79年重创中国9个主力军,俘260,消灭62500人

新车知多少
2025-11-16 14:52:07
爆大冷:福建女排击败天津晋级全运四强!庄宇珊表现力压李盈莹

爆大冷:福建女排击败天津晋级全运四强!庄宇珊表现力压李盈莹

金毛爱女排
2025-11-17 18:43:12
刘强东:京东正式推出京东外卖独立APP

刘强东:京东正式推出京东外卖独立APP

蓝鲸新闻
2025-11-17 19:04:03
退休金一旦超过这2个数,就属于“人上人”,晚年无忧

退休金一旦超过这2个数,就属于“人上人”,晚年无忧

有故事的人
2025-11-17 06:29:06
2025-11-17 20:36:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13890文章数 66259关注度
往期回顾 全部

科技要闻

有了通义和夸克,阿里为何再推千问App?

头条要闻

韩国向日本表示强烈抗议 中方表态

头条要闻

韩国向日本表示强烈抗议 中方表态

体育要闻

当家球星受伤后,球迷乐翻了天?

娱乐要闻

金鸡奖是“照妖镜”,揭露人情冷暖?

财经要闻

高市早苗的算计,将让日本割肉5000亿

汽车要闻

新增CDC后变化大吗? 试驾特斯拉model Y L

态度原创

手机
时尚
本地
数码
教育

手机要闻

一加Ace 6T配置曝光:首发骁龙8 Gen5处理器,本月见

秋天怎么穿出时尚感?适当露肤、不死板老气,高级又有回头率

本地新闻

这档古早综艺,怎么就成了年轻人的哆啦A梦?

数码要闻

Valve Steam Machine性能遭质疑:8GB显存能带动3A大作吗

教育要闻

疗愈躺平孩子的心,妈妈要做的出乎意料的简单!

无障碍浏览 进入关怀版