★ 设为星标 | 只讲人话,带你玩转AIGC。
就在今天,OpenAI 终于把它的 GPT Image 1.5 抬上来了!
说实话,在 Nano Banana Pro(以下简称 NBP)已经强到“杀疯了”的今天,我甚至是带着一种“挑刺”的心态点开更新的:
OpenAI,你这次到底能不能行?
是能一举夺回王座,还是像上次一样“发布会猛如虎,实测二百五”?
话不多说,我肝了一个通宵,直接上号,残酷实测走起。
精准修图,谁更听话?
大家玩 AI 绘图最头疼的是什么?肯定是“一改就废”。明明只想给小姐姐换个发型,结果图一出来,脸都给换了,这谁受得了?
OpenAI 的宣传片倒是吹得很神:指哪打哪,完美保留角色形象。但这毕竟是“买家秀”,实际上手效果如何?
为了不冤枉它,我特地随机选了一个路人人物做测试。
![]()
图:测试用素材图
先来个最简单的:换发型
![]()
提示词:基于这张图片,将人物的发型改为齐肩的红棕色波波头(Bob头)。请务必保留头发被风吹起的动态效果和阳光照射在头发上的强烈高光。人物的面部表情、衣服、姿势和背景需完全保持不变。
GPT 跑出来的第一张图,乍一看还真不错:人物没变,衣服没变,发型也确实换成了波波头,看着挺自然。
但俗话说得好,不怕不识货,就怕货比货。
我们拉出隔壁的 NBP 来跑同样的词:
![]()
图:对比图
坦率讲,把两张图放在我的 4K 大屏上一对比,差距瞬间就出来了:
GPT 这边: 脸部光影明显偏暗,甚至出现了肉眼可见的色斑(这是什么鬼?),皮肤质感有点脏。
NBP 这边: 皮肤通透,头发上的高光处理得非常细腻,明显赢麻了。
第一局结论: 虽然 GPT 听懂了指令,但在画质和光影细节上,NBP 依然略胜一筹。
多图一致性,二哈能拆家吗?
再来试个更有难度的:换装 + 多图融合。
![]()
提示词:将人物身上的蓝色条纹衬衫替换为一件米白色的亚麻质地休闲西装外套,内搭一件白色圆领T恤。保持她倚靠栏杆的姿势不变。新的衣物上需要有符合当前强烈侧光照明的自然褶皱和阴影。人物头部和背景保持不变。
我试着给人物换了套衣服,GPT 的表现依然稳定,形象保持得很好。
但在光影逻辑上,还是老毛病——有点“平”。
不过这里 NBP把原图的道具给搞丢了……
接着,我开始给它上点难度了:多图融合。
我找了两张女生图和一张动物图,要求它们融合在一起。
![]()
图:多图融合示例
![]()
图:多图融合对比
不得不承认,这个环节我更喜欢 GPT。
它的融合能力简直惊艳,整张图片的质感非常像一张真实的电影剧照,那种“无聊和疲惫”的氛围感拿捏得死死的。
而 NBP 这边……怎么说呢?
现在,加入调皮的二哈试试。
![]()
提示词:保持这两位女士和动物的姿势、表情完全不变。在背景中添加几只正在疯狂拆家的哈士奇,它们正在撕咬沙发靠垫和跑来跑去,让场面看起来极其混乱。
这个部分我更喜欢 NBP了,GPT 加入的二哈过于疯狂,感觉有点失真。
但他们在多轮编辑中,都很好的延续了之前的形象和风格。
既然融合能力不错,那拿来做电影海报怎么样?
我让它设计一张 1950 年代好莱坞风格的电影海报,标题叫《THE ALGORITHM》(算法)。
效果直接惊艳到我了:
![]()
图:英文海报
利用这三张图片(两张女生和一张动物),制作一张 1950 年代好莱坞黄金时期的电影海报。
电影标题: 海报上方用复古的大写衬线体展示电影名为 "THE ALGORITHM" (算法)。
角色设定: 将两位女生设计为经典的黑色电影(Film Noir)女主角,穿着优雅的丝绸晚礼服,波浪卷发。将那只动物设计为她们神秘的同伴,脖子上戴着钻石项圈。
演职员表: 在底部添加演职员文字:
Starring: The Neural Sisters (左) & The Beast (右)
Directed by: Sam Altman
Produced by: OpenAI Studios
风格: 手绘海报质感,强烈的明暗对比(Chiaroscuro),略带褪色的特艺彩色(Technicolor)色调。
不得不说,这海报挺有感觉的,但似乎人物形象已经对不上了。而且,这个尺度怎么突然提升了。
用中文发现,不仅尺度小了,字几乎是灾难。。(这个后面具体讲)
![]()
图:GPT 的中文海报
变态指令遵循,谁脑子更好使?
GPT Image 1.5 有很强的指令遵循能力。
来给它一点难度:6x6 网格挑战。
这非常考验 AI 的逻辑理解能力。我要求它严格按照 6 行 6 列的格式,每一个格子里画出指定的东西(比如菠萝、宇航员、Wi-Fi图标等)。
![]()
提示词:画一个 6x6 的网格 创建一个 6 列 x 6 行的网格,网格内容如下:第一排:希腊字母Ω、一个热气球、菠萝、宇航员、水晶球、变色龙 第二排:一只蜘蛛、老式怀表、淋浴喷头、望远镜、一只孔雀、一张藏宝图 第三行:一枚纪念币、一面圆镜子、一杯冒热气的咖啡、“希望”一词、滑板、字母K 第四排:洗衣机、游乐园代币、Wi-Fi图标、一支口红、螳螂、棒球帽 第五行:电源图标、数字8、红色钻石、乐高积木人、火烈鸟、维京头盔 第6行:一只橘猫、灭火器、一个锚、游戏手柄、卷纸、数字88
除了中文,它做得的确完美。
看看 NBP,虽然中文对了。但这哪里是 6x6 宫格?
数学是体育老师教的吗?格局完全乱了。
![]()
图:NBP 生成的 6 宫格
这一局:GPT 险胜,赢在逻辑,输在中文。
真正的硬伤是文字
大家都知道,NBP 几乎彻底的解决了文字难题,不论中英文。
OpenAI 也不甘示弱,给了一个非常复杂的多字的案例,但其实 NBP 设置完整得更好。
![]()
图:文字处理对比
而换成中文,GPT 就是个灾难,不过这点官方自己是承认的。
![]()
图:GPT Image 1.5 的中文处理
换成 NBP,那几乎是吊打。
![]()
图:NBP 的中文处理
即便是简单点的中文,GPT 也无法胜任。
![]()
图:GPT Image 1.5 的中文处理
NBP 几乎完美。
![]()
图:NBP 的中文处理
NBP 让信息图流行了起来,OpenAI 也提供了类似案例。
但不论从效果还是从文字处理,GPT 都是被按在地上摩擦的。
![]()
图:信息图对比
除了升级了图片功能之外,OpenAI 还新增了一个类似于“模板”的功能,选择某个模板,然后再选一张自己的图片,就可以生成这个模板对应的风格。

图:GPT 提供模板选择
通过固定一些常用的风格,很方便那些不想到处找提示词或者不会写提示词的朋友。
最终结论:这就是一场单方面的“碾压”
测到这,我不装了,直接摊牌:GPT Image 1.5 目前全面落后于 Nano Banana Pro。
虽然在刚才的某些特定 Case 里(比如那个疯狂的二哈),GPT 偶尔能灵光一闪,但这阻挡不了它整体被 NBP 甩在身后的事实。
为什么这么说?除了前面看到的这些,NBP 还有很多让创作者无法拒绝的“杀手锏”,比如:
画质硬伤: NBP 早就支持 2K、4K 直出了,而 GPT Image 1.5 居然还在 1K 分辨率里玩泥巴。这对于要干活的人来说,简直是致命伤。
信息差优势: NBP 可以结合联网搜索,直接生成带实时数据的信息图,这点 GPT 目前完全做不到。
至于大家关心的速度……官方发布会吹嘘说“速度快了 4 倍”。
我实测跑了一个通宵,说实话,完全没感觉到。体感上甚至比 NBP 还要慢一点。
OpenAI 这波“画饼”,我给负分。
当然,它也不是一无是处。
它唯一让我觉得“真香”的功能,是多任务并发——前一张图还在转圈圈,我可以立马发下一条指令,不用干等着。
这一点,NBP 确实该学学(NBP 目前只能单线程排队)。
现在的 GPT Image 1.5 给我的感觉,更像是一个气喘吁吁跟在 NBP 屁股后面追赶的“优等生”,早已不是那个曾经引领时代的“神”了。
(其实 GPT 5.2 追赶 Gemini 3 Pro 也类似)
所以,我的建议很直接:
如果你是普通玩家: 想尝鲜,可以玩玩。
如果你要干活、出图、接商单: 请老老实实续费 Nano Banana Pro,它依然是目前的最佳选择。
OpenAI 这一波?还得回炉再练练。
你怎么看,欢迎在评论区留言。
如果觉得这篇文章对你有帮助,别忘了点赞、爱心♥️和转发你的朋友,我们下期再见!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.