网易首页 > 网易号 > 正文 申请入驻

AI大翻车,数学大神陶哲轩的预言成真了

0
分享至

最近这几年,随着AI技术的不断迭代与发展,在鸡娃路上狂奔的家长开始陷入了更深的焦虑与迷茫,如何培养能够适应未来发展的高科技人才,不仅是每个家庭,更是当前教育和社会所共同关注的热点话题,然而最近AI却被爆出大翻车,这到底是怎么回事?一起来看看吧。

From 谷雨星球

微信号:guyujihua2021

在不少人心中数学能力快要取代人类的AI,最近却大翻车了!

起因是大型语言模型(LLM)频繁在各种数学测试中刷分,正确率动辄90%以上。60位顶尖数学家看不下去,出了一套叫作FrontierMath的全新数学推理测试,都是AI从没刷过的题库。

结果AI的正确率不到2%。

于是,数学界最高荣誉奖菲尔茨奖得主、加州洛杉矶分校教授陶哲轩说:

「靠这些题目,人类还能赢AI几年」。

作为一直走在研究前沿的数学家,他和卡内基梅隆大学的数学教授罗博深一样,一直在AI浪潮下相当冷静。

一个势必要到来的AI时代到底是什么?

这让我想起上半年两位数学大神在牛津大学的一次精彩对谈,预言了AI的本质,以及一个与孩子们息息相关的「大数学时代」和「实验数学」的到来。

01.

「飞机」的诞生

作为深谙AI背后数学核心基础的科学家,陶哲轩把人工智能的出现比作飞机的诞生。

一开始,我们有了汽车、火车和轮船,接下来,有人发明了喷气发动机,只是功能非常少,只能是玩具。

随后很多年迭代中,发动机越来越大,性能也越来越强,速度也越来越快。这个时候,我们能把这个强大的喷气发动机绑在汽车和船上,让它们跑得更吗?

显然这不是安全的选择。

「你必须彻底改变交通运输的想法,必须设计出新的运输方式,新的安全协议和仪表设备,飞机就此诞生了。」

人工智能也是一样,它不是这两年凭空出现的,它也是从最基础的软件一步步进化而来,区别就在于,以前的人工智能模型都是「汽车」,而如今的版本是「飞机」。

从1.0的汽车版本,到2.0的飞机版本,有什么不一样呢?

陶哲轩说,「汽车」版本的计算机软件,它们都很「无聊」,被程序和代码设定好了每一步的走向,一切都是可预测的。

而如今「飞机」版本人工智能模型,第一次拥有了创造力,——

你不需要严格按照既定代码输入,只需用我们日常聊天的自然语言,哪怕说得再不标准,它也能读懂你的意思,给你想要的东西。

不过,令人意外的是,陶哲轩说,「人工智能并不是最先进的数学工具,它只是一个猜谜机器」。

为什么叫做猜谜机器呢?和人工智能解决问题的方式有关系。

在数学领域,1%的AI的确非常强大,比如谷歌的AI已经达到IMO奥林匹克数学竞赛人类银牌级别的水平,但99%的情况中,依然有很多AI在小学生的数学题上出错。

同样的一个问题、一个做图需求,你查询两次,就会得到两个不同的答案,还不能保证都是正确的。

它没有一个内部计算器去解决数学问题,而是像一个只记住了部分知识的学生做题,为了尽快做出来,而凭着过去的经验和记忆来一次次猜测,去接近你想要的正确答案。

陶哲轩还发现更加好玩的是,AI还特别嘴硬。

当AI算错了题后,你说「正确答案应该是120」,它的回答却是:「你给的是个错别字,正确答案是120」。

「如果你要用AI帮助数学学习,最好不要相信它,而是准备其他的计算机软件,来验证它的正确性」。

在陶哲轩看来,正是AI的这些「缺陷」,决定了它们作为专家的可信度和安全性都不高。

这也就意味着,像财务、医疗、公共安全,以及需要精密计算的领域,精确意味着一切,完全容不得一次次猜测,AI并不能代替人类做出决定,太过依赖反而可能造成严重伤害。

02.

AI也像水龙头

从另一个角度来说,在另外一些负面风险很小的领域,AI的好处要比人类想象得多。

对于特别适合将AI利用起来的领域,陶哲轩又用了一个巧妙的比喻:「AI就像一个特殊的水龙头」。

它的特殊之处在于,出来的水虽然不是质量好的直饮水,但它一瞬间能输出的水量要比传统水龙头多100倍、1000倍,如果你有一个过滤装置,就可以获得比以前多得多的饮用水。

「这就是人工智能时代的科学和数学」。

而一旦把AI看作水龙头,就可以解决科学研究中存在已久的大瓶颈——样本人选不够多的问题。

AI&生物

在医药行业,你想治疗某种疾病,而要想合成对症的药物,必须从自然界或者人工合成中获得初始状态的原料,然后才能进行后续的合成,以及第一阶段、第二阶段的实验。只有最大的制药公司才有能力等待。

当有了AI,这些浪费或许都可以避免。

它可以为蛋白质建模,可以快速运行大量的数据,你就可以对各种药物的功能进行建模,你就可以无需等待太长,以前需要测试100个药物,如今只测试10个就行了。

AI&化学

还有AI在化学领域的应用,比如你想找到一个新的超导体。

但是传统的合成过程同样非常昂贵,也很危险。而AI可以把部分合成过程用建模的形式预测出来,缩小可选范围,将之前需要人工合成的设计实现自动化,就可以又快又好又安全。

AI&气候学

陶哲轩做了个总结:人工智能时代对于世界上各行各业的根本改变之一,在于我们必须为各种事物建立模型——

比如要想预测未来20年的地球气候,传统方法是将地球划分成非常小的网格,运用已知的数据和物理地理定律计算,超级计算机可能要花费几个月时间算出来,而AI就可以对现有的模型进行训练,输入数据预测最佳的拟合方案。

还有像飓风这种罕见极端天气的走向、登陆点,AI模型的预测功能也特别好用。

目前已经有科学家在给气候建模了,而且成功地达到了超级仿真的精确度。甚至普通的天气预报,AI的预测速度都能达到过去10000倍的速度。

但正如AI本身的不足一样,它在建模上的运用依然存在一些瓶颈,像是收集大量数据,并将其在AI之前格式化,都是科学工作人员们正在攻克的难题。

也正是这些「进行中」的科学、数学突破,让陶哲轩格外感慨地说:

「我对人工智能如何改变世界感到非常兴奋,革命已经来了」。

03.

「大数据时代」即将来临

在这场演讲中,陶哲轩还与我们也采访过的罗博深教授,来自了一次有意思的炉边谈话中。

两位数学家金句频出,让很多人一下子对AI祛了魅:

「人们通常认为,能像人类一样用自然语言聊天,就是智慧的巅峰了。人工智能虽然已经可以做到了,但它实际上并不那么智能。

AI工具的作用就是预测下一个要说的词。

就像我们用手机打字,打完一个词语,键盘上方会自动出现一些可以衔接的惯用语言。这个功能并没有多么智慧,甚至会产生语言垃圾,说一大串正确而无用的废话。

相反,人类觉得困难的事情,它却觉得容易,比如它可以自动为很多看起来复杂的数学证明填充小步骤」。

不过,对于人工智能在数学领域的未来,两位数学家的态度还是相当有信心的,就像看待一个正在成长中,一不小心就会犯错的聪明小学生一样。

陶哲轩说,「人工智能将和数学产生巨大的协同作用,未来将会出现一个大数学时代」。

就像他在今年2月份接受美国著名科学杂志Quanta Magazine时说的:

数学学科已经成熟了很多,并正在专注于互联和应用,与现实世界的联系更加紧密。像计算机科学、生命科学、社会科学等等,随着大数据的兴起,几乎任何人类学科都可以在一定程度上被数学化。

同时,有了AI以后,数学研究正在变得更加全球化。

比如过去数学家之间进行合作,共同证明一个定理,只能在小范围内协作,因为每个人都必须验证其他人的数学步骤是正确的。

数学家之间很难真正「信任」。而这个致命缺陷,真正抑制了数学领域的真正大规模合作,也把很多业余数学爱好者隔在了门外。

而有了AI以后,全球的数学家、爱好者即便不认识、不信任,也可以将自己的东西上传到某个Github存储库或其他的社区进行交流,而独立的AI辅助验证技术可以对其进行100%的验证。

「这是过去从未真正见过的合作」。

更加令人感概的是,陶哲轩还提到,我们必须改变教育学生的方式,特别是传统的作业布置方式。

「现在AI像家庭教师一样,能将每一步的证明向你阐明,并立即回答背后的原理,所以‘做得对’已经不能作为学生做作业的目标。

我们要教下一代孩子的是,如何验证AI生成的结果正确性,以及如何获得AI以外的意见。

我们会进入一个实验数学的时代,让孩子们看到,我们如何使用AI提供的大数据,和计算机形成的证明,把数学变成实验」。

对于关注数学教育的任何人来说,陶哲轩的这些分享,仿佛在迷雾一样的世界中劈开了一道口子,让人们看到了AI在数学领域的现在和未来。

更让我们明白,AI既没有像媒体夸大中的那般可怕,也没有那么傻。关键在于谁去用,以及如何使用。

这都是下一代孩子可以深度参与,并充分发挥所能的广阔领域。

本文来自:谷雨星球(ID:guyujihua2021),邀你一起做内卷下的教育长期主义者。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一条普通打底裤,撕裂了性别与时代的尊严战场?

一条普通打底裤,撕裂了性别与时代的尊严战场?

怪味历史连连看
2026-06-28 20:53:41
中国排协官宣!14人名单公布,袁志将带队,两人出局一人新入选

中国排协官宣!14人名单公布,袁志将带队,两人出局一人新入选

跑者排球视角
2026-06-28 17:03:49
终于弄明白了为什么开空调蚊子就不咬了——不是蚊子被冻着了,也不是蚊子不想咬,而是蚊子的“导航系统”失灵了

终于弄明白了为什么开空调蚊子就不咬了——不是蚊子被冻着了,也不是蚊子不想咬,而是蚊子的“导航系统”失灵了

二胡的岁月如歌
2026-06-27 15:11:11
男子健身后脸上长“脚气”,直呼太恐怖!有网友曾中招:坐了一会儿,屁股就长了一片痘痘

男子健身后脸上长“脚气”,直呼太恐怖!有网友曾中招:坐了一会儿,屁股就长了一片痘痘

环球网资讯
2026-06-28 17:01:23
世界杯死亡半区诞生!葡萄牙自食苦果,英格兰原地摆烂

世界杯死亡半区诞生!葡萄牙自食苦果,英格兰原地摆烂

新新自圆其说说体育
2026-06-28 11:13:19
高市早苗没料到,拒赴深圳APEC,想给中国甩脸色,中方根本不接招

高市早苗没料到,拒赴深圳APEC,想给中国甩脸色,中方根本不接招

离离言几许
2026-06-27 15:44:23
世界杯头号卧底!巴萨水货坑惨葡萄牙!C 罗全队被他拖后腿

世界杯头号卧底!巴萨水货坑惨葡萄牙!C 罗全队被他拖后腿

奶盖熊本熊
2026-06-28 09:53:42
上世纪80年代末台湾综艺在哈尔滨采访了一位当地美女

上世纪80年代末台湾综艺在哈尔滨采访了一位当地美女

岁月有情1314
2026-06-28 21:53:40
丰田将"价格战"打到底,曾卖20多万,现降到13.18万起,抄底?

丰田将"价格战"打到底,曾卖20多万,现降到13.18万起,抄底?

触摸史迹
2026-06-29 00:41:13
美国再次就台湾问题表态!

美国再次就台湾问题表态!

叶葉夜
2026-06-26 16:51:22
74个国家免签,唯独让中国交五倍签证费,选亚运会开幕前何意味?

74个国家免签,唯独让中国交五倍签证费,选亚运会开幕前何意味?

生活新鲜市
2026-06-28 22:00:19
世界杯小组赛,表现最差的3支球队!

世界杯小组赛,表现最差的3支球队!

体育哲人
2026-06-28 15:57:26
WTT美国大满贯:林诗栋3-0碾压韩国名将,晋级男单32强

WTT美国大满贯:林诗栋3-0碾压韩国名将,晋级男单32强

俯身冲顶
2026-06-29 03:56:07
6.29早评|形势突变!重大警告!A股要爆!

6.29早评|形势突变!重大警告!A股要爆!

龙行天下虎
2026-06-29 01:17:22
向太曝马伊琍已再婚:当年文章过不了心理那关

向太曝马伊琍已再婚:当年文章过不了心理那关

娱乐看阿敞
2025-12-12 15:50:00
贪污上亿、假慈善?网友暂停捐助只是冰山一角 韩红更多黑料被扒

贪污上亿、假慈善?网友暂停捐助只是冰山一角 韩红更多黑料被扒

陈意小可爱
2026-06-28 15:31:39
徐帆回应离婚仅10月,冯小刚近况曝光,和养女徐朵特殊关系引争议

徐帆回应离婚仅10月,冯小刚近况曝光,和养女徐朵特殊关系引争议

乡野小珥
2026-06-29 03:28:41
淘汰赛开打!德法硬碰硬,葡萄牙难进8强,阿根廷一只脚进半决赛

淘汰赛开打!德法硬碰硬,葡萄牙难进8强,阿根廷一只脚进半决赛

十点街球体育
2026-06-28 15:22:12
丢球11+送点!曼城铁卫首次世界杯之旅虎头蛇尾 新赛季或丢主力

丢球11+送点!曼城铁卫首次世界杯之旅虎头蛇尾 新赛季或丢主力

雪狼侃体育
2026-06-28 21:38:26
世界杯32强全部出炉,12个AI的第一张成绩单来了

世界杯32强全部出炉,12个AI的第一张成绩单来了

21世纪经济报道
2026-06-28 21:09:04
2026-06-29 04:32:49
常青藤家长会 incentive-icons
常青藤家长会
北美留学生家长的优质资讯平台
2165文章数 19354关注度
往期回顾 全部

科技要闻

DeepSeek最新论文:如何让大模型跑得更快

头条要闻

四川宜宾市高县发生5.5级地震 震中距宜宾28公里

头条要闻

四川宜宾市高县发生5.5级地震 震中距宜宾28公里

体育要闻

两周飞5万公里!因凡蒂诺遭环保人士猛批

娱乐要闻

曾沛慈拿下《乘风2026》年度总冠军

财经要闻

省钱,我只服梁文锋

汽车要闻

搭载华为乾崑六件套 东风奕派M8预售19.98万起

态度原创

教育
本地
游戏
公开课
军事航空

教育要闻

入学就“锁定”事业编!“振兴龙江”计划,毕业直接就业

本地新闻

世界杯球迷节:比球赛更好玩的派对

从企鹅岛到火星基地,《失控进化》带着4000万人一起刷屏

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普又发文威胁:伊朗将不复存在

无障碍浏览 进入关怀版