该图片可能由AI生成![]()
1927年索尔维会议的合影,是物理学史上最著名的一张照片。爱因斯坦、薛定谔、德布罗意……一群改变世界的人挤在同一个画面里。有人拿这张黑白照片做了个简单测试:让当下排名最高的几个AI图像模型给它上色。
结果很有意思,也很残酷。
该图片可能由AI生成![]()
排名第一的GPT图像模型交出的答卷最离谱。它不是在“上色”,而是在“重新画人”。爱因斯坦的脸被改了,背景的树枝被捏造了,好几个人的五官完全对不上原图。有人评论说,这哪是修复,这是AI在用自己的想象力替代历史。更荒唐的是,当你只喂给它裁剪后的小图,它反而表现正常。一旦画面里人多、细节密,它就开始胡编乱造。这说明问题不在于它“不想做好”,而是它在处理复杂场景时根本hold不住。
有人替OpenAI辩护,说这是故意的防深伪措施。系统提示词里确实写了:生成公众人物图像时,要让他们“看起来像但不能是本人”。但反驳也很有力:你用自己的照片测试,脸一样会被改得似是而非。而且脸越小、越偏离画面中心,失真越严重。这更像是模型能力的天花板,而非刻意为之的安全策略。把缺陷包装成功能,是科技公司最古老的话术之一。
真正让人眼前一亮的是Seedream。它的上色效果看起来像早期手工着色的老照片,带着一种克制的、泛黄的质感。有人嫌它“只是加了个黄色滤镜”,但仔细看,它几乎没有篡改任何一张脸。原图是模糊的,它就保留模糊;原图有颗粒感,它就不强行锐化。在所有模型里,它对原始信息的尊重程度最高。Gemini表现也不错,细节丰富,色彩自然,但它给一个本来没戴眼镜的人加了副眼镜。
这个测试揭示了一个被忽视的问题:当AI“修复”一张照片时,它填充的不是丢失的真实信息,而是训练数据里的统计平均值。皮肤变得更光滑,五官变得更对称,一切都在向某种算法认定的“正常”靠拢。修复即篡改,增强即抹杀。每一个被AI“改善”的像素,都是对真实个体的一次微小覆写。
所以最忠实的AI,反而是那个看起来最“没本事”的。不添加自己没有的信息,不用想象力填补空白,承认自己不知道原图的颜色到底是什么,只做最保守的推测。在一个所有模型都急于展示自己多能干的时代,克制本身就是一种稀缺的能力。
排行榜上的分数告诉你谁最受欢迎,但没告诉你谁最诚实。对于图像编辑来说,不胡说八道,比说得漂亮重要得多。
reddit.com/r/singularity/comments/1r1udry/comparison_in_hallucinations_by_the_top_image
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.