我最近沉迷于一个叫“AI世界时钟”的网站,它的设定很简单:让市面上所有主流AI模型画时钟,然后展示结果——而这些结果全是华丽的灾难。
![]()
数字位置永远不对,有时甚至跑到时钟外面;指针要么位置错误,要么直接飘在时钟外;哪怕看起来还行的时钟,总透着一股“不对劲”。
网站创作者、艺术家Brian Moore在采访中说:“看时间是人类与生俱来的简单技能,从小就会。现在反转局面,让人类轻松搞定的事难住AI,既有趣又好笑。”
我写这篇文章时一直开着这个网站,确实笑到停不下来。但为什么AI在这件事上这么拉胯?
首先要说明,网站限制所有模型用约2000个token生成时钟,且统一提示词。如果给足算力和极致精准的提示,AI或许能画出更好的时钟,但核心问题依然存在:为什么对AI来说,画时钟这么难?答案指向AI的底层工作逻辑。
AI不仅画不好时钟,还认不准时间
2025年,技术专家Alek Safar的研究显示:人类读取模拟时钟的准确率为89.1%,而顶尖AI的准确率仅39.4%。
研究虽未定论原因,但提出了有趣的假设:一是AI训练数据中的时钟图片数量不足,无法精准学习认时;二是时钟图像难以用语言准确描述,而大语言模型依赖语言处理视觉信息。爱丁堡大学信息学院2025年的研究也证实,所有主流大语言模型都难以通过图像识别模拟时钟的时间。
研究结论指出:“成功的时间推理需要精准视觉感知、数值计算和结构化逻辑推理的结合,而当前多模态大语言模型尚未掌握这些能力。”
当代AI(大语言模型)本质上不会“计算”,而是靠模式识别工作。比如认时钟时,人类会计算指针角度,但AI是靠匹配训练数据中的时钟图案来猜时间——这和我懒的时候看时钟的方式有点像,但AI的“猜”准确率极低,背后有更有趣的原因。
10:10魔咒:营销和痴呆测试图坑了AI
打开图片搜索输入“手表”,你会发现绝大多数模拟手表都显示10:10。这是营销套路:10:10的指针角度像微笑,且不会遮挡品牌logo或日期窗口,是手表广告的标准姿势。2017年《前沿心理学》的研究也证实,这个时间的视觉吸引力最强。
结果就是,互联网上的时钟图片大多是10:10,AI训练数据中也充斥着这个时间的样本。哪怕你明确要求AI画其他时间,它也经常默认生成10:10——这也是Moore创建网站的契机:“我让图像生成器画特定时间的时钟,它完全做不到,哪怕反复提示,出来的还是一堆10:10。”Reddit上也有用户吐槽过这个问题。
更离谱的是:画时钟是痴呆症的常见测试题,网上有大量患者画的“魔性时钟”,这些错误样本也混入了AI训练数据,进一步干扰了AI的认知。
AI开发者自己都不完全懂AI的决策逻辑,这些猜测只是冰山一角。而“AI世界时钟”网站的趣味正在于此:它像一扇窗,让我们窥见AI混乱又荒诞的工作方式。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.