人类秒会认时钟，AI准确率仅39%？原因太好笑|指针|新论文

人类秒会认时钟，AI准确率仅39%？原因太好笑

分享至

我最近沉迷于一个叫“AI世界时钟”的网站，它的设定很简单：让市面上所有主流AI模型画时钟，然后展示结果——而这些结果全是华丽的灾难。

数字位置永远不对，有时甚至跑到时钟外面；指针要么位置错误，要么直接飘在时钟外；哪怕看起来还行的时钟，总透着一股“不对劲”。

网站创作者、艺术家Brian Moore在采访中说：“看时间是人类与生俱来的简单技能，从小就会。现在反转局面，让人类轻松搞定的事难住AI，既有趣又好笑。”

我写这篇文章时一直开着这个网站，确实笑到停不下来。但为什么AI在这件事上这么拉胯？

首先要说明，网站限制所有模型用约2000个token生成时钟，且统一提示词。如果给足算力和极致精准的提示，AI或许能画出更好的时钟，但核心问题依然存在：为什么对AI来说，画时钟这么难？答案指向AI的底层工作逻辑。

AI不仅画不好时钟，还认不准时间

2025年，技术专家Alek Safar的研究显示：人类读取模拟时钟的准确率为89.1%，而顶尖AI的准确率仅39.4%。

研究虽未定论原因，但提出了有趣的假设：一是AI训练数据中的时钟图片数量不足，无法精准学习认时；二是时钟图像难以用语言准确描述，而大语言模型依赖语言处理视觉信息。爱丁堡大学信息学院2025年的研究也证实，所有主流大语言模型都难以通过图像识别模拟时钟的时间。

研究结论指出：“成功的时间推理需要精准视觉感知、数值计算和结构化逻辑推理的结合，而当前多模态大语言模型尚未掌握这些能力。”

当代AI（大语言模型）本质上不会“计算”，而是靠模式识别工作。比如认时钟时，人类会计算指针角度，但AI是靠匹配训练数据中的时钟图案来猜时间——这和我懒的时候看时钟的方式有点像，但AI的“猜”准确率极低，背后有更有趣的原因。

10:10魔咒：营销和痴呆测试图坑了AI

打开图片搜索输入“手表”，你会发现绝大多数模拟手表都显示10:10。这是营销套路：10:10的指针角度像微笑，且不会遮挡品牌logo或日期窗口，是手表广告的标准姿势。2017年《前沿心理学》的研究也证实，这个时间的视觉吸引力最强。

结果就是，互联网上的时钟图片大多是10:10，AI训练数据中也充斥着这个时间的样本。哪怕你明确要求AI画其他时间，它也经常默认生成10:10——这也是Moore创建网站的契机：“我让图像生成器画特定时间的时钟，它完全做不到，哪怕反复提示，出来的还是一堆10:10。”Reddit上也有用户吐槽过这个问题。

更离谱的是：画时钟是痴呆症的常见测试题，网上有大量患者画的“魔性时钟”，这些错误样本也混入了AI训练数据，进一步干扰了AI的认知。

AI开发者自己都不完全懂AI的决策逻辑，这些猜测只是冰山一角。而“AI世界时钟”网站的趣味正在于此：它像一扇窗，让我们窥见AI混乱又荒诞的工作方式。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.