数学家Adam Kucharski最近做了个实验,把同一组数据分别标成"英国"和"美国"交给Microsoft Copilot分析。结果AI一本正经地总结了两国受访者在"语气、强度和措辞风格"上的差异——尽管数据完全相同。
这不是个例。Kucharski把200条关于职业目标的陈述复制了五份,分别贴上美国、英国、法国、德国、意大利的标签。Copilot的结论是:意大利人对艺术职业的兴趣是英国人的三倍,美国人的商业导向是法国人的1.5倍。五组数据其实一模一样。
![]()
更讽刺的是后续。当Kucharski要求深入分析时,Copilot先用关键词计数——这次结果对了,五国数据完全一致。但它选择忽略这个发现,转而给出一份带具体百分比的量化分析,数字全是编的。
问题出在"Auto"模式。微软说这个模式会自动选择最适合任务的模型,显然没做到。Kucharski发现,换成推理模型(reasoning models)就能正确处理任务,但大多数用户不会手动切换。
Copilot已经成为很多公司快速分析数据的首选工具。这个实验提醒使用者:默认设置可能正在让你的分析结果变成刻板印象的复读机,而非数据的真实反映。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.