凌晨两点,一位产品经理同时打开两个浏览器标签页。左边是OpenAI刚更新的画图工具,右边是谷歌的Nano 2。他要做一个决定:下周的电商详情页,该用谁。
这不是"能不能画手"的年代了。两家大厂的新模型都过了基础关,现在拼的是谁更像艺术家——理解光影、物理、叙事,还有人类那些说不清的需求。
![]()
第1轮:复古药瓶架,测的是氛围感
提示词要求很具体:12个玻璃瓶,手写花体标签,"月光酊剂""被遗忘的星期三精华"这类虚构药名,暖调午后光,浅景深。
ChatGPT Images 2.0的光确实暖,氛围也对。景深控制让背景柔和虚化,标签上的花体字基本可读。
Nano 2选择了更平的布光,整个架子看得更清楚,但"午后"的感觉淡了。
这一轮ChatGPT胜出——它跟提示词跟得更紧,技术完成度也更高。
第2轮:cottage大小的怀表剖面,测的是复杂空间
提示词要一个机械怀表的剖面图,尺寸像小茅屋,里面有微型工程师在齿轮上维修,有人在内有人在外,用绳梯连接。
ChatGPT给出了可读的标签,还额外画了每层的小示意图,制表工具的细节也到位。空间关系清楚:谁在里面、谁在外面、绳梯怎么连,一目了然。
Nano 2的图更"完整"——颜色更饱和,更像一张finished product。但工程师的位置逻辑乱了,有些人在齿轮上的姿态不符合物理,绳梯的连接关系也模糊。
ChatGPT再赢一轮。当提示词涉及多层空间关系时,逻辑比好看更重要。
第3轮:生日派对的狗,测的是叙事
提示词:一只金毛猎犬和一只小猎犬主办生日派对,桌上摆着狗骨头形状的蛋糕,背景有"生日快乐"横幅,其他狗戴着派对帽,一只狗在拍照,另一只狗在往蛋糕上插蜡烛。
这是7轮里最"人性化"的测试——不是技术参数,是能不能讲一个温馨好笑的故事。
ChatGPT的画面协调:金毛和小猎犬是视觉中心,其他狗的位置自然,拍照的狗举着手机,插蜡烛的狗动作合理。横幅上的"生日快乐"清晰可读。
Nano 2的狗更多、更热闹,但叙事焦点散了。有些狗的姿态奇怪,横幅文字糊了,整体像"很多元素堆在一起"而不是"一个正在发生的派对"。
ChatGPT三连胜。叙事清晰度上,它更懂什么叫"主角"。
第4轮:水银飞溅,测的是物理模拟
提示词:一滴水银落在花岗岩台面上,溅成皇冠状,慢动作摄影风格,背景虚化。
这一轮Nano 2终于翻身。它的水银形态更有张力,飞溅的液滴分布符合物理直觉,皇冠状的结构清晰。背景虚化的过渡也更自然。
ChatGPT的水银偏"静态",像凝固的雕塑而不是抓拍到的瞬间。液滴数量少了,动态感弱。
物理模拟曾是AI画图的软肋,现在成了Nano 2的得分点。
第5轮:赛博朋克茶馆,测的是风格融合
提示词:传统中式茶馆,但用全息投影代替灯笼,机器人服务员穿着汉服,客人用神经接口喝茶,窗外是霓虹雨夜。
两家都完成了基本任务。ChatGPT的"传统"部分更考究——木梁结构、茶具摆放有真实感。全息投影的光污染控制得当,没有把整个画面洗成蓝紫色。
Nano 2的霓虹更炸,雨夜的氛围更浓。但机器人汉服的细节经不起细看,有些褶皱不像布料像塑料。
平局,或者ChatGPT微弱领先。风格融合的关键不是"都有",而是"都真"。
第6轮:微观森林,测的是尺度感
提示词:一滴露珠里的森林生态系统,能看到细菌大小的精灵在蘑菇之间飞行,景深极浅,背景是模糊的草叶。
ChatGPT的尺度提示更明确:草叶在背景中确实模糊成色块,让人意识到"这滴水很小"。精灵和蘑菇的比例关系稳定,没有忽大忽小。
Nano 2的细节更丰富,蘑菇的纹理、精灵的翅膀都更精致。但草叶的模糊程度不够,整体像"正常大小的森林被框在圆圈里",而不是"一滴水里的世界"。
ChatGPT赢。尺度感是这类提示的隐藏考点,它答对了。
第7轮:文字渲染,测的是最后一公里
提示词:一张手写风格的菜单,菜名是"量子纠缠意面""薛定谔的提拉米苏",要求字体有墨水晕染效果,纸张略带泛黄。
ChatGPT的字基本可读,晕染效果自然,纸张质感也对了。但"量子纠缠"四个字有轻微变形,像是被拉长的。
Nano 2的字更清晰,排版也更像一张真正的菜单。但墨水晕染过头了,有些笔画糊成一团,纸张黄得像被水泡过。
各有瑕疵,但Nano 2的可读性稍好。这一轮它扳回一城。
最终比分:ChatGPT 5.5 : Nano 2 1.5
ChatGPT Images 2.0的优势在"理解"——复杂空间关系、叙事焦点、尺度暗示,这些需要"想明白再画"的场景它更稳。Nano 2在物理模拟和纯视觉冲击力上更强,速度也更快。
那位产品经理最后选了ChatGPT。他的理由是:电商图可以修,但"画错结构"没法救。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.