网易首页 > 网易号 > 正文 申请入驻

从IMO「抢跑」到AI「幻觉」:技术狂欢下的认知陷阱

0
分享至

文|深眸财经

28日晚,许多人都在关注的第 66 届国际数学奥林匹克竞赛(IMO)公布了比赛结果。

中国队不出所料地夺得头筹,斩获6 枚金牌。其中更是有两位同学获得满分,以231分的团队总成绩碾压全场。

对于这一已经预料到的结果,网上反应比较平淡,引发热议的反倒是另一个赛道的OpenAI。

01 OpenAI"抢跑"背后的幻像

在用于评估AI大模型在数学竞赛表现的MathArena.ai平台上,对当前最顶尖的AI公开大模型进行了测试。


OpenAI的o3与o4-mini、谷歌的Gemini 2.5、马斯克家的Grok-4以及国产DeepSeek-R1等顶流AI模型全部出战。

遗憾的是,AI大模型在这届IMO上全军覆没。

在这场比拼中,得分最高的是谷歌Gemini 2.5拿到13分,也就是31%的分数,连铜牌都够不上。

就在大家纷纷认为这就是目前AI的上限时。

OpenAI团队带着最新开发的通用推理模型,抛出了一颗重磅炸弹:

在与人类完全相同的考试条件下作答,最终解出5道题,共获得35分,达到IMO金牌分数线,成功拿到了金牌。


但事实真的是这样吗?

首先引发大家争吵的就是消息发布的时间。

按照IMO的规定,所有成绩都应该在IMO闭幕的一周后再发布。

结果当地时间19日下午5点43分,闭幕式一结束,5点50分OpenAI的官方就发布了"AI刚好压过金牌线"的消息。

七分钟之差,既让OpenAI钻了规定的空子,还先其他参赛选手一步,在网络上掀起了轩然大波。

这一行为让不少网友为其他真实竞争对手打抱不平,毕竟抢跑的行为,本身就是对竞争对手的不尊重。

其次就是,金牌是谁认证的?

虽然官方一直说的都是"OpenAI压上了金牌及格线",但不少媒体为了省事,直接写成"AI夺得金牌"。

此外,OpenAI并未接收到任何参加IMO的邀请,更不用说究竟是谁给AI评出的35分好成绩。

这就相当于自己在家里做了一套高考真题,对照答案评分后,得出了一个我是高考状元,能上清华的结果。

国外有OpenAI以"夺冠"炒作,国内也有AI写高考作文吸睛。


今年高考语文考试一结束,各大AI公司迫不及待地让自己的AI助手开始考试。

豆包、腾讯元宝、天工……一共16款产品,都在网上发布了自己写的作文。

面对AI写出来的作文,不少人站出来说"我觉得AI比我强"。

每每在这种测评的关键时刻,AI都会以出色表现"出圈"。

但到了生活中,AI假大空的想法、胡乱编造的数据、古今中外虚实大乱炖的文章模板,甚至连AI造假的事也层出不穷。


就算这样,AI的使用率仍在不断增长。

从学生用AI代写论文,到上班白领依赖AI生成报告,再到媒体行业机器人撰稿占比突破40%,人类正经历一场前所未有的"思考能力危机"。

02 思维惰性引发认知陷阱

AI写高考作文、压线夺冠,每一次"出圈"都像是精心策划。

抛开网络上营销号对AI的呼声,值得让我们思考的并不是AI会不会代替人类,而是我们总是习惯把思考的机会全部甩给AI,自己坐享其成。

以Cision发布的《2025全球媒体调查报告》为例,通过对19个国家3,126名记者的调研发现,53%的记者已在工作中使用生成式AI工具。

在其他使用AI进行辅助的领域中,教育行业首当其冲:

国内的某高校调查显示,使用AI辅助学习的学生中,仅28%能独立完成复杂逻辑推导,较五年前下降45%。

神经可塑性研究表明,长期依赖AI会导致大脑神经网络重构,前额叶的决策区域活跃度下降20%,视觉皮层的信息处理区域却变得异常活跃。

换句话说,使用AI大量处理认知工作,会让工作者参与创新所需的深层分析的过程大幅减少,思维出现"断片"现象,产生认知依赖症。

还会缩小人脑思考和机器思考之间的差距,弱化原创观点和创造性方法所带来的价值。

除此之外,过度相信AI的建议,可能会失去辨别能力,导致错误信息风险增加。

AI之所以能够高效产出内容,就是因为它直接搬运或者套用海量数据库中的表面规律,但却不会主动核实事实。

2023 年,纽约市协助政府服务的AI 聊天机器人,建议企业主扣除员工消费来获利,但真实的法律却明确规定了老板不能扣取员工的小费。

再比如,政策明确规定企业必须接受现金,不得歧视没有银行账户的客户。但是AI 却说"餐厅可以不提供现金付款选择"。

在面对具有信息变量的情况下,尤其是在涉及多变量分析时,AI就可能生成看似专业但逻辑不自洽的内容。

如果不仔细甄别,这种"幻觉"现象不仅会误导用户,增加错误信息的风险,还可能引发信任危机。

所以说,AI使用率的不断提高已成必然,但我们该做的不仅是改进算法,让人工智能更好的服务人类,而是如何才能在享受便利和坚守认知之间找到平衡。

03 以AI治理AI

首先,利用AI自身的算法能力,来监管、优化和安全应用AI技术。


我们常见的AI主要分为,基于模板的自动化生成,和基于深度学习技术的自动化生成,这两种类型。

而训练AI的原材料就是数据。

以Open AI的第一个大模型GPT1为例,它有1.17亿个参数,到了GPT2,有15亿个,而GPT3则增长到了1750亿个,GPT4的参数更是达到令人震惊的1.8万亿个。

巨大的参数数量决定了AI模型如何对输入数据做出反应,从而决定模型的行为。

将AI的行为举止具象化,可以增进用户对AI技术的理解,识别其潜在的偏差,有助于平衡用户对AI的信任度和依赖度。

其次,还可以利用AI技术研究用户的心理机制,成果可以作为改进AI模式的参考,避免引发引发过度依赖。

AI技术通过自然语言处理和情感计算,能够实时分析用户的语言、语音和行为模式,识别潜在的心理健康风险。

例如养老院使用机器人,通过声波震颤识别老人的孤独指数,辅助早期筛查抑郁倾向。

在过度依赖AI的防控上,同样可以运用它的算法,通过分析用户的使用频次、情感表现、面部表情等,来提供特定的"AI戒断"方法,降低用户的依赖程度。

结语:AI的发展已成必然,频频"出圈"的背后不再只是算法的精进,还有认知主导权的易主。如何在技术狂欢与认知危机交织的时代始终保持警惕,避免沦为算法的附庸,才是人类驾驭科技的关键。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
翼展超过41米,类似轰20的无人机来了

翼展超过41米,类似轰20的无人机来了

三叔的装备空间
2025-09-19 16:27:03
周五收盘:今天A股调整到3811了,不出意外的话,下周可能这样走

周五收盘:今天A股调整到3811了,不出意外的话,下周可能这样走

寻墨阁
2025-09-19 14:51:43
马特乌斯:瓜帅带队还是10多年前的风格,太慢了其他队不再害怕

马特乌斯:瓜帅带队还是10多年前的风格,太慢了其他队不再害怕

直播吧
2025-09-19 14:04:09
袁甲评哈维尔:真是在外边找不到工作的都来咱这骗钱了

袁甲评哈维尔:真是在外边找不到工作的都来咱这骗钱了

直播吧
2025-09-19 13:56:16
辟谣!朝鲜发射舞水端中程导弹出错,在山东上空被中国拦截?

辟谣!朝鲜发射舞水端中程导弹出错,在山东上空被中国拦截?

军武次位面
2025-09-16 17:42:56
波兰关闭与白俄罗斯公路和铁路通道中欧班列中断上万集装箱滞留

波兰关闭与白俄罗斯公路和铁路通道中欧班列中断上万集装箱滞留

深度报
2025-09-18 22:47:16
确认,不用中国技术!俄罗斯将新建4000公里高铁,用“国产列车”

确认,不用中国技术!俄罗斯将新建4000公里高铁,用“国产列车”

南生今世说
2025-09-18 17:28:46
台湾回归后,第一任省长由谁担任最合适?五人上榜,一人脱颖而出

台湾回归后,第一任省长由谁担任最合适?五人上榜,一人脱颖而出

通文知史
2025-09-18 16:25:08
宋伊人新片遭抵制!长相平平却资源逆天,于正对她的评价一针见血

宋伊人新片遭抵制!长相平平却资源逆天,于正对她的评价一针见血

古希腊掌管月桂的神
2025-09-19 14:53:33
中美共存要成真?北京举办晚宴,中方75岁老将军出山

中美共存要成真?北京举办晚宴,中方75岁老将军出山

科技有趣事
2025-09-19 10:59:36
开学没几天,广东石油化工学院7名新生放弃入学资格,原因很现实

开学没几天,广东石油化工学院7名新生放弃入学资格,原因很现实

凯旋学长
2025-09-19 16:58:04
中山大学党委书记朱孔军调任武汉大学党委书记,黄泰岩卸任

中山大学党委书记朱孔军调任武汉大学党委书记,黄泰岩卸任

澎湃新闻
2025-09-19 16:18:27
男子8001元捡漏网拍劳力士手表,商家认为亏本拒绝发货,诉至法院获赔7万元

男子8001元捡漏网拍劳力士手表,商家认为亏本拒绝发货,诉至法院获赔7万元

大风新闻
2025-09-18 22:31:20
先递刀后滑跪:超级符号,超级服罗永浩

先递刀后滑跪:超级符号,超级服罗永浩

不正确
2025-09-17 14:49:59
非必要不做CT!《新英格兰医学杂志》:每10个儿童血癌就有1个与CT有关;每多做一次CT,都可能增加癌症风险

非必要不做CT!《新英格兰医学杂志》:每10个儿童血癌就有1个与CT有关;每多做一次CT,都可能增加癌症风险

医诺维
2025-09-19 11:55:55
氢氟酸新后续:受害者不是去散步,律师发声,恐难追究丢弃人刑责

氢氟酸新后续:受害者不是去散步,律师发声,恐难追究丢弃人刑责

春序娱乐
2025-09-19 14:29:12
突发!央媒官宣降温股市!9月19号,今日凌晨的四大消息全面发酵

突发!央媒官宣降温股市!9月19号,今日凌晨的四大消息全面发酵

搬砖知天下事
2025-09-19 08:40:47
新疆维吾尔自治区主席呼吁:眼见为实!欢迎大家到新疆走走看看,感受大美新疆的魅力

新疆维吾尔自治区主席呼吁:眼见为实!欢迎大家到新疆走走看看,感受大美新疆的魅力

极目新闻
2025-09-19 16:29:45
浙江省人民检察院党组副书记、常务副检察长胡东林一行来磐调研指导

浙江省人民检察院党组副书记、常务副检察长胡东林一行来磐调研指导

朗威游戏说
2025-09-19 15:21:59
收评:今天A股调整到3820,不出意外的话,下周一很有可能这样走

收评:今天A股调整到3820,不出意外的话,下周一很有可能这样走

小嵩
2025-09-19 11:55:58
2025-09-19 18:44:49
蓝鲸新闻 incentive-icons
蓝鲸新闻
财经信息服务平台
120595文章数 193265关注度
往期回顾 全部

科技要闻

直击iPhone 17开售:消费者偏爱银色橙色

头条要闻

女子误踩氢氟酸身亡 专家回应"为何遗弃10年仍致命"

头条要闻

女子误踩氢氟酸身亡 专家回应"为何遗弃10年仍致命"

体育要闻

从轮椅到铜牌 他熬了7年:下个目标唱国歌!

娱乐要闻

全智贤被全面抵制!相关代言评论区沦陷

财经要闻

"矿霸"填埋万吨危废 当地政府成立调查组

汽车要闻

对话周光:一个技术理想主义者的“蜕变”

态度原创

数码
健康
亲子
教育
军事航空

数码要闻

技术颠覆者的答卷:TCL SQD-Mini LED如何重构电视画质天花板

内分泌科专家破解身高八大谣言

亲子要闻

尊重孩子睡眠规律,任何口头猜测都不能代替你的观察

教育要闻

新航道寒假研学来了:插班世界名校、联合国认证,这届冬令营太顶了!

军事要闻

卫星图像显示以军坦克集结加沙城周围

无障碍浏览 进入关怀版