网易首页 > 网易号 > 正文 申请入驻

ChatGPT中国数学题挑战!它能全答对吗?

0
分享至

Hello,大家好,我是大卫呆。

上期节目我给大家介绍了一下最近极其火爆的ChatGPT,以及不久的将来可能对我们的职业造成的影响。它不仅能回答各种生活问题,还能写宣传语、写代码甚至做数学题,而且支持中文!

今天咱们来个有意思的测试,我准备了5道小学水平的数学题,咱们看看ChatGPT到底能不能都正确的解答。

你说为什么只用小学水平的数学题?那是因为初中以上的题有很多的特殊符号,很难输入到文字框中。而且,如果ChatGPT连小学数学题都做不了也就不用考虑更难的题了。所以咱们先来看看它对小学数学题的解题能力如何。

话不多说,咱们直接上题。

第一题:7年前,妈妈年龄是儿子的6倍,儿子今年12岁,妈妈今年几岁。

我们来看看标准答案:

年龄问题,7年前,儿子年龄为12-7=5岁,而妈妈年龄是儿子的6倍,所以妈妈七年前的年龄为5×6=30岁,那么妈妈今年37岁

接下来我们看看ChatGPT的回答对不对。

回答正确,而且解题思路也和标准答案几乎相同。

这是一道比较简单的数学题,但难点在于ChatGPT对于中文语义的理解。可以看到,它完全理解了中文语义并给出了正确的答案。要知道ChatGPT可是国外开发的程序,它的开发者可能都无法理解中文,但它却做到了。

当然也不排除ChatGPT背后也有中文大佬参与的可能性。

第二题:有一串彩珠,按“2红3绿4黄”的顺序依次排列。第600颗是什么颜色?

还是先看标准答案:

周期循环问题,以2+3+4=9个一循环,600÷9=66....6,余数为6,所以第600颗是黄颜色

再来看看ChatGPT的回答。

回答正确,解题思路也和标准答案相同。但注意这里ChatGPT出现了一个中文错字

这道题的难度要比第一题大,如果只看问题,各位看文章的朋友们能答出来吗?ChatGPT不但要理解中文中的“红绿黄”,还要和数学计算混在一起才能解出正确答案,但它做到了。

第三题:建筑工地有一批砖,最上层两块砖,第2层6块砖,第3层10块砖……,依次每层比其上一层多4块,已知最下层有2106块砖,这堆砖共有多少块?

这回再次加大了难度,不但要理解中文每句话的逻辑及含义,还要根据这些内容加入数学计算。

我们还是先看标准答案:

根据题意设层数为n,A1=2,An=2106,D=4,

2106=2+(n-1)×4,

2106=2+4n-4,

4n=2106+2,

4n=2108,

n=2108÷4,

n=527

(2+2106)×527÷2,

=1110916÷2,

=555458(块),

答:这堆砖共有555458块

下面有请ChatGPT作答。

ChatGPT同样给出了完整的解题步骤,不过这次结果出错了

可以看到ChatGPT在计算层数的时候就出现了错误,所以想让ChatGPT帮你做作业的朋友要小心了,答案不一定是对的。

第四题:把100根小棒分成10堆,每堆小棒根数都是单数,且一堆比一堆少2根,应如何分?

标准答案:

这是一个等差数列,Sn=nA1+[n(n-1)d]/2 ,所以100=10A1+10×9×2/2,解得A1=1

所以分成的10堆数量依次是1、3、5、7、9、11、13、15、17、19

这次ChatGPT能答对吗?

ChatGPT回答正确。

最后第五题,我们加大难度,来个中文的逻辑推理题,我们看看ChatGPT的表现如何。

警方查询了三个可疑的人,这三个人中有一个是小偷,讲的全是假话。有一个人是从犯,说起话来真真假假,还有一个人是好人,句句话都是真的,查询中问及三个人的职业,回答是:

甲:我是推销员,乙是司机,丙是美工设计师。

乙:我是医师,丙是百货公司的业务员,甲呀,你要问他,他肯定说是推员。

丙:我是百货公司的业务员,甲是美工设计师,乙是司机。

请问这三个人中说假话的小偷是谁?

这道题对于ChatGPT不仅仅是逻辑问题,而且要非常熟练的理解中文的语法等含义,对于一个人工智能来,这可以说是中文里比较难的考验,我们看看它的表现如何。

首先标准答案是:

这是个逻辑推理题,关键是找到切入点,其中乙说的第三句话一定是真的,因为问甲甲的确是说自己是推销员,所以乙一定不是小偷,那么就分乙是从犯或好人两种情况来考虑,很容易就能判断出甲是小偷

大家记住这个正确答案,下面有请ChatGPT作答。

ChatGPT的答案是甲是小偷,回答正确!而且我们仔细看它的解答也非常符合判断逻辑。说明ChatGPT不但理解逻辑,而且理解中文!

怎么样,你震惊吗?大家觉得ChatGPT的表现如何?

就我个人来评价一下,一共让ChatGPT做了5道中国小学水平的数学题,4对1错。正确率75%。由于测试样本只有5道题,所以也并不能说明什么问题,但至少能看出2点。

1. ChatGPT对于中文的理解非常让人惊叹,要知道中文在全球来讲都是非常复杂的语言系统,但一个人工智能竟然能顺利的答出中文的逻辑问题,确实让人惊讶。

2. ChatGPT真的可以用来做中国的数学题包括中文的逻辑推理题。虽然答错了一道,但可以看到ChatGPT的答题正确率很高,解题思路也基本都是对的。

但是,这里大家也不要觉得ChatGPT有多么神奇,上期节目已经让它自己解释了一下名字的由来。其中GPT缩写是来自Generative Pretrained Transformer。

而里面的“Pretrained”表示在模型被部署之前已经通过大量语料进行了预训练,以提高它的性能和泛化能力。也就是说"ChatGPT"是预先通过海量内容学习的。而我所找的小学数学题全部来自网上,所以并不排除ChatGPT的海量学习中包括我上面的几道题。而唯一答错的,可能是ChatGPT对中文支持的还不够完美或者题库中没有,当然也可能是本身算法上产生的问题。

但ChatGPT确实已经不仅仅是聊天助手这么简单了,它确实开始朝着科幻片里人工智能的方向在走,也许就在不久的将来,它就可以做到无论什么问题都能以人类的方式给你正确的答案,那必定会引起整个人类文明的巨大变化。您对此有什么看法,不妨在评论区讨论一下。

我是大卫呆,如果您觉得内容有用欢迎点赞、评论和转发,谢谢您的支持,我们下期见!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
小牌大耍?陈赫张子萱阿那亚度假,误入他人镜头却反过来呵斥路人

小牌大耍?陈赫张子萱阿那亚度假,误入他人镜头却反过来呵斥路人

仙味少女心
2026-06-27 18:41:54
韩红20年0收入!基金会工资单曝光,网友:韩红就是无私纯粹的人

韩红20年0收入!基金会工资单曝光,网友:韩红就是无私纯粹的人

火山詩话
2026-06-28 06:35:13
前田大然:维尼修斯很少参与防守,我认为巴西的防线存在漏洞

前田大然:维尼修斯很少参与防守,我认为巴西的防线存在漏洞

懂球帝
2026-06-28 16:30:16
红星观察|小组赛场均近3球,世界杯用球“三重浪”特殊设计成部分门将噩梦,名帅称其“快得像炮弹”

红星观察|小组赛场均近3球,世界杯用球“三重浪”特殊设计成部分门将噩梦,名帅称其“快得像炮弹”

红星新闻
2026-06-28 15:30:40
闲着没事,你抓什么特务,吃饱了撑的!

闲着没事,你抓什么特务,吃饱了撑的!

雨秋闲话
2026-06-26 11:28:46
官方:朝鲜被取消下一届U17亚洲杯参赛资格,并被罚款5万美元

官方:朝鲜被取消下一届U17亚洲杯参赛资格,并被罚款5万美元

懂球帝
2026-06-27 17:09:37
世界杯小组赛射手榜:梅西6球榜首,姆巴佩等四人4球并列第2

世界杯小组赛射手榜:梅西6球榜首,姆巴佩等四人4球并列第2

懂球帝
2026-06-28 12:25:21
苹果一夜蒸发18000亿:美光暴涨,美国最后一家内存公司,47年熬死所有对手 | 硬核观察

苹果一夜蒸发18000亿:美光暴涨,美国最后一家内存公司,47年熬死所有对手 | 硬核观察

一刻talks丨硬科技趣思想
2026-06-27 19:36:23
首播将至!CCTV1谍战大剧来袭,配角阵容强,谍战剧荣光要回来了

首播将至!CCTV1谍战大剧来袭,配角阵容强,谍战剧荣光要回来了

秋姐居
2026-06-28 10:03:55
他拒绝8920万肥约,如今赌到1.85亿顶薪,还创造80年NBA第一纪录

他拒绝8920万肥约,如今赌到1.85亿顶薪,还创造80年NBA第一纪录

大西体育
2026-06-28 15:49:27
没有这种食物,你的肌肉将消失!医生:55岁后恢复肌力的9种食物

没有这种食物,你的肌肉将消失!医生:55岁后恢复肌力的9种食物

王二哥老搞笑
2026-06-28 17:20:05
张子强被枪毙后,34岁妻子独自上街,没想到被4名匪徒下了手

张子强被枪毙后,34岁妻子独自上街,没想到被4名匪徒下了手

浩渺青史
2026-06-27 16:55:05
曝普京官邸被拆除!克宫10公里处增设S400防空系统

曝普京官邸被拆除!克宫10公里处增设S400防空系统

项鹏飞
2026-06-27 22:13:52
钠电池175Wh/kg上车,成本干到0.35元/Wh,长安第一个吃螃蟹

钠电池175Wh/kg上车,成本干到0.35元/Wh,长安第一个吃螃蟹

生活魔术专家
2026-06-28 14:35:00
最差战绩取消接机!韩足协官方:韩国队30日回国,不举行欢迎仪式

最差战绩取消接机!韩足协官方:韩国队30日回国,不举行欢迎仪式

兰亭墨未干
2026-06-28 12:56:04
2026年7月起死亡证明新规落地!房产存款保险全都受影响?

2026年7月起死亡证明新规落地!房产存款保险全都受影响?

老特有话说
2026-06-27 00:25:03
诋毁袁隆平成果的200万粉丝网红,账号被无限期封禁

诋毁袁隆平成果的200万粉丝网红,账号被无限期封禁

政知新媒体
2026-06-28 14:57:10
白玉兰最佳男配董勇:主动出击,争来《太平年》里的冯道

白玉兰最佳男配董勇:主动出击,争来《太平年》里的冯道

老吴教育课堂
2026-06-28 13:37:43
安徽新当选8位县委书记

安徽新当选8位县委书记

阜阳发布
2026-06-27 21:49:37
银行行长出手阔绰,4小时赌光6000万,出手66万红包,一查贪了40亿

银行行长出手阔绰,4小时赌光6000万,出手66万红包,一查贪了40亿

墨策史
2026-06-26 01:05:05
2026-06-28 19:07:00
大卫呆科技
大卫呆科技
电脑科技知识、小技巧、心得
107文章数 650关注度
往期回顾 全部

科技要闻

DeepSeek最新论文:如何让大模型跑得更快

头条要闻

中央巡视后不久副部级官员任上落马 其上任不到一年半

头条要闻

中央巡视后不久副部级官员任上落马 其上任不到一年半

体育要闻

韩国可算确定被淘汰了

娱乐要闻

曾沛慈拿下《乘风2026》年度总冠军

财经要闻

两只股票撑起的韩国股市,半年熔断 33 次

汽车要闻

搭载华为乾崑六件套 东风奕派M8预售19.98万起

态度原创

数码
游戏
艺术
健康
公开课

数码要闻

机械师“MJQ25F250P”24.5英寸2K 250Hz显示器开售,899元

《天国:拯救3》明年发售?开发商同时开发两款RPG

艺术要闻

赵孟頫比肩王羲之的一幅行书,能达到这种境界的,700年来只有他一人!

“无糖汤圆”是否隐藏着健康陷阱?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版