今天的 AI 助手,CPU 快要被一道题干烧了:
我想洗车,我家距离洗车店只有50米,你建议我是开车去还是走路去?
换成人类,这题再简单不过。毕竟要洗的是车,店再近也得把车开过去。
但 AI 不一样,因为它们基于大量的数据和语义分析反复训练,看问题的逻辑会比人严谨太多。
过度依赖逻辑分析,就会让 AI 助手可能出现翻车的情况。这道题的精髓在于,可以从 AI 给出的回答里,看出它们是纯分析你的文字,还是基于现实世界的理解去解答问题。
我们试了几个主流 AI 助手,答案可以说是一目了然。
Deepseek:建议开车去,理由是效率更高,毕竟只有50米。看得出,它没有切换成现实视角思考。
而早前跟它打得火热的 ChatGPT 呢?很遗憾,它也建议我走路去。离谱的是,它还是「认真思考了一下」.....
谷歌的 Gemini 严谨很多,即便明确说了是去洗车,它也分析出来去不同类型洗车店的方案,以及具体去洗车店干嘛的方案。
Grok 并没有被卷入 AI 思维定式里,直接告诉你开车去。甚至模拟出现实世界你如果真走路去的尴尬对话。
千问先是知道大家最近在玩这道题,再给出正确答案。这个信息更新及时程度以及检索能力,有点东西。
豆包,也掉入了逻辑陷阱,列举了开车去的麻烦,然后建议走路去。
随着 AI 助手快手迭代,接下来这类「照妖镜」问题也会越来越广泛应用,各位也可以问问自己常用的 AI 模型,看看有没有不一样的答案。
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.