GPT-Image-2 上线,结束战斗了。
这句话看起来很标题党,但这是我过去三年来,第一次对着一个图像生成模型,说出这句话。
真的很强。拿 GPT-Image-2 跑了几个小时,生成近百张图后,我基本可以确定,它就是目前审美、文字显示、图像逻辑表现最好的模型。
OpenAI,又支棱了。
中文互联网,以假乱真
先看一个前两天就传遍朋友圈的抖音美女直播间图。
没错,这张图就出自 GPT-Image-2。提示词简单到离谱:一个美女主播在抖音直播。
![]()
除了完美复刻抖音直播间样式,最让人震惊的是这些汉字,真的,完全没蚯蚓感了❗️
![]()
我又加了个难度,让 GPT-Image-2 复刻古风美女的直播间。一般来说古风美女的直播间装扮更复杂,装饰品更多,更容易扑街。
结果图一出来,我又被它震住了。
这个古风美女直播间的页面,各种评论的汉字没问题,样式上也和真实页面分毫不差。
而且,图片审美也很在线。美女的装扮和环境、光线、色调搭配和谐,透出一种温馨雅致的感觉。
![]()
要说 Bug,我看了半天,才发现画面背景的“花”字、人物小头像,以及扇子角度有些奇怪的问题。但这种努力才能找出 AI 生图 bug 的感觉,之前哪敢想
把这几个小问题丢回 GPT-Image-2 调整。好家伙,一次性全改对了。
![]()
我又接着上难度,传了张现拍的「兰亭集序」封面,让 GPT-Image-2 生成古风美女直播卖货图。
Before
![]()
After
![]()
这次也是一次出图,啥也没改。
而且,GPT-Image-2 还读出了封面的小字,在商品链接里补上了我这是冯承素的临摹本...服了...
唯一的区别是,我线下买的时候这本只花了30块。
除了抖音,我发现 GPT-Image-2 复刻微信朋友圈也是一把好手。
输入 Prompt:生成马斯克的微信朋友圈截图,一句话说“GPT-Image-2太酷了,但不妨碍Sam Altman辣鸡”,有其他人点赞。
立刻,GPT-Image-2 徒手造就了一条当天科技圈撕B头条。
这个系列也是一个错字儿、蚯蚓字儿、蚂蚁字儿都没有。
![]()
![]()
Dario这条还出现了Ilya的点赞,合理
![]()
设计、广告,真秒出啊
拿 GPT-Image-2 做设计和广告,试下来也没压力。毕竟官方介绍,Images 2.0 是 OpenAI 首个具备“思考”能力的图像模型。
我先做了两个科技商品的拆解图,全是一次出图。
![]()
![]()
再试试“霸王茶姬”这种消费品。
一开始模型生成的伯牙绝弦制作流程有点脑补,我让它查好之后再做一遍,内容一下子靠谱很多。
![]()
再给兰州牛肉拉面、手工现包大水饺、辣条️做个商品图。
统统,一次性拿下。
![]()
*Prompt:给手工现包的大水饺,设计一张具有高级感的、时尚的宣传图。
![]()
*Prompt:给湖南经典老式传统小吃「辣条」,设计一张高级的、时尚的产品分解宣传图。
![]()
*Prompt:给经典的兰州牛肉拉面,设计一张简约的、时尚的、具有高级感的宣传图。
IP二创,GPT-Image-2也很稳。
比如这个让雪王去其他公司做奶茶和咖啡系列,我依旧一次没改。
![]()
![]()
![]()
![]()
注意一个小细节,雪王的胸牌只有在luckin时写了很幸运。
要说不足,现在 GPT-Image-2 在图像中的细节处理依然不是100%精细,对需要复杂逻辑规划的场景还不完美。
比如我让 GPT-Image-2 缓解这个世纪尴尬名场面,结果这个手是怎么都握不好了哈。
![]()
![]()
但这些问题比起之前的 AI 生图,真的是小巫见大巫。
目前这个模型已经全量了,免费用户也能使用。答应我,试试看,不会后悔
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.