网易首页 > 网易号 > 正文 申请入驻

国产AI大模型高考成绩单出来了:讯飞星火获得综合第一

0
分享至

随着高考的落幕,全国各地的高三学子们终于可以卸下沉重的负担,轻松迎接假期。与往年不同的是,今年的高考战场上还有一支与众不同的队伍引人注目——国产人工智能大模型。

在这场特殊的高考中,包括搜狐科技、潇湘晨报、量子位等多家权威媒体对近10款国产人工智能大模型进行了高考作文、数学、物理三个科目的评测,并公布了成绩。我们来一起回顾一下:

首先进行的是高考作文的评测。在搜狐科技的评测中,三位资深语文教师作为权威专家为各大模型的作文打分。腾讯元宝和百度文心一言以超过50分的成绩位居前列,智谱清言、字节豆包与讯飞星火则并列第三。Kimi、阿里通义、百川、海螺排名相对靠后。

而在潇湘晨报的"AI写作"评测中,讯飞星火不仅平均分位居首位,且获得了全场最高分56分。潇湘晨报邀请湖南知名作家、编辑作为阅卷老师,对国内五大AI大模型产品——百度文心一言、讯飞星火、阿里通义千问、字节豆包、腾讯元宝的高考作文进行评分,经过四位阅卷老师的综合打分,讯飞星火以49分的平均分高居首位。

给讯飞星火打出"全场最高分"56分的阅卷老师表示:"本文观点清晰,论述集中且层层推进,很多句子都简洁有力,颇有思想性。如果是某个学生写的,无疑是难得的佳作。"另外,从网友的热门评论中也能看出讯飞星火摘得高分的原因。

网友@2024:感觉星火好点,更像作文,有些更像回答问题。

网友@烟花绽放的节日:讯飞星火更有高考味。

接下来是数学科目的较量。在搜狐科技的数学评测中,讯飞星火、文心一言、豆包均以63%的正确率位列第一梯队,智谱清言、阿里通义则以50%的正确率位居第二梯队,其他大模型相对落后。

在量子位的高考数学评测中,虽然没有给出详细成绩单,但展示了各家大模型详细的解题思路,交由网友打分,通过网友的投票打分可以看出,讯飞星火的"识图+解数学题"能力收到了最高认可,位居其后的分别是Kimi、通义千问、文心一言、豆包等。

最后是高考物理的测试。在量子位的评测中,阿里通义千问与讯飞星火以71.4%的准确率高居第一梯队,而Kimi、海螺和腾讯元宝则以42.9%的准确率位于第二梯队。百川百小应和万知答对一题位于第三梯队。

文心一言、豆包、天工、智谱清言、商量因为出现了不同程度读图失败的问题,在成功识别的题目中,商量和文心一言的正确率为2/4,即正确率为28.6%;豆包、天工、智谱清言正确率为1/2,即正确率为14.3%。

综合以上媒体在作文、数学、物理三门科目的成绩,我们得出了2024年人工智能大模型高考"成绩单"。来自科大讯飞的讯飞星火以52.49分高居第一名,通义千问、文心一言分别位列第二、第三名,而Kimi、字节豆包、海螺AI等其他大模型也有不错的表现。

第一名:52.49 讯飞星火

第二名:46.08 通义千问

第三名:37.67 文心一言

第四名:34.68 Kimi

第五名:33.57 字节豆包

第六名:31.92 海螺AI

第七名:30.61 腾讯元宝

第八名:30.28 智谱清言

第九名:21.56 百川百小应

尽管评测方式可能不够严谨科学,但这次大模型高考无疑展示了国产人工智能在多个学科的优秀表现和长足进步,尤其是讯飞星火的表现堪称"文理兼修"!期待国产大模型再接再厉,在明年的高考中取得更加出色的成绩!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
歌手吴向飞喊话李荣浩道歉:未取得授权公开演唱其歌曲;李荣浩回应:并未在个人演唱会或音乐节晚会唱过,请列明场次,若侵权一定赔偿道歉

歌手吴向飞喊话李荣浩道歉:未取得授权公开演唱其歌曲;李荣浩回应:并未在个人演唱会或音乐节晚会唱过,请列明场次,若侵权一定赔偿道歉

极目新闻
2026-03-29 18:56:41
41分16板4助3帽!就在今天,两项前无古人的NBA纪录被文班达成了

41分16板4助3帽!就在今天,两项前无古人的NBA纪录被文班达成了

世界体育圈
2026-03-31 11:32:35
泽连斯基夫人谈下届总统选举:“我们俩都累了”

泽连斯基夫人谈下届总统选举:“我们俩都累了”

参考消息
2026-03-30 21:43:31
乌克兰无人机不算创新?莱茵金属道歉:致敬伟大的“家庭主妇们”

乌克兰无人机不算创新?莱茵金属道歉:致敬伟大的“家庭主妇们”

鹰眼Defence
2026-03-30 16:10:10
“中年人的泡泡玛特”铜师傅上市首日股价开盘一度大跌超36% 创始人俞光登台敲锣

“中年人的泡泡玛特”铜师傅上市首日股价开盘一度大跌超36% 创始人俞光登台敲锣

每日经济新闻
2026-03-31 10:56:59
北京男子靠龙虾OpenClaw实现36小时买房:龙虾迅速筛出周边房源,2小时内独自对比大量中介并选定,精准摸清历史最低成交价

北京男子靠龙虾OpenClaw实现36小时买房:龙虾迅速筛出周边房源,2小时内独自对比大量中介并选定,精准摸清历史最低成交价

扬子晚报
2026-03-29 19:35:46
哈登创3大神迹,骑士力擒爵士!米切尔34+5创两纪录,莫布里34+17

哈登创3大神迹,骑士力擒爵士!米切尔34+5创两纪录,莫布里34+17

一将篮球
2026-03-31 12:07:00
喀麦隆19岁前锋科法内身价4000万欧,为国足总身价的三倍多

喀麦隆19岁前锋科法内身价4000万欧,为国足总身价的三倍多

懂球帝
2026-03-31 10:13:05
不怪郭富城忍不住跟她合照。作为一个女人,我都心动不已

不怪郭富城忍不住跟她合照。作为一个女人,我都心动不已

情感大头说说
2026-03-31 05:25:42
楼市跌、股市割、消费降,中国中产的体面,彻底碎了!

楼市跌、股市割、消费降,中国中产的体面,彻底碎了!

新浪财经
2026-03-30 13:06:32
4月1日医保新政:家有高血压、糖尿病、心脏病的,抓紧办

4月1日医保新政:家有高血压、糖尿病、心脏病的,抓紧办

江江食研社
2026-03-31 03:30:03
郑丽文随行名单出炉,连战洪秀柱马英九方面皆在列,蓝委回应来了

郑丽文随行名单出炉,连战洪秀柱马英九方面皆在列,蓝委回应来了

爱下厨的阿酾
2026-03-31 00:55:57
3月30日俄乌最新:弄巧成拙了

3月30日俄乌最新:弄巧成拙了

西楼饮月
2026-03-30 20:44:40
被骗160万,中国老板把日本公司挂闲鱼!被7万人围观后,对方慌了

被骗160万,中国老板把日本公司挂闲鱼!被7万人围观后,对方慌了

行者聊官
2026-03-30 12:46:28
不可错过!3月31日下午17:00比赛!中央5套CCTV5、CCTV5+直播表

不可错过!3月31日下午17:00比赛!中央5套CCTV5、CCTV5+直播表

皮皮观天下
2026-03-31 09:18:57
闫剑波任山东省副省长

闫剑波任山东省副省长

新京报政事儿
2026-03-31 11:13:03
疯了!24岁天才后卫被裁,直播75分钟引众怒,NBA生涯彻底凉了

疯了!24岁天才后卫被裁,直播75分钟引众怒,NBA生涯彻底凉了

球童无忌
2026-03-31 12:30:35
张雪峰继任者罕见发声,会照顾好张雪峰家人,等张雪峰女儿接班

张雪峰继任者罕见发声,会照顾好张雪峰家人,等张雪峰女儿接班

安宁007
2026-03-30 20:51:02
刺激夜:中国女足爆大冷门1-0掀翻欧洲强敌,德国2-1绝杀非洲劲旅

刺激夜:中国女足爆大冷门1-0掀翻欧洲强敌,德国2-1绝杀非洲劲旅

侧身凌空斩
2026-03-31 04:56:41
张雪:那个被踢出董事会的男人,用43800元三缸摩托干翻了杜卡迪

张雪:那个被踢出董事会的男人,用43800元三缸摩托干翻了杜卡迪

吴佩频道
2026-03-31 11:33:03
2026-03-31 12:43:00
驱动中国 incentive-icons
驱动中国
国内知名的IT专业站点
93976文章数 138613关注度
往期回顾 全部

科技要闻

尚未正式宣发,国行苹果AI半夜"意外闪现"

头条要闻

牛弹琴:中东新的大麻烦来了 特朗普又盯上了新目标

头条要闻

牛弹琴:中东新的大麻烦来了 特朗普又盯上了新目标

体育要闻

县城修车工,用20年成为世界冠军

娱乐要闻

丝芭传媒举报鞠婧祎:瞒报收入竟达85%

财经要闻

高薪内推藏陷阱!"招转培"骗局盯上求职者

汽车要闻

16万级最强2.0T 全新一代瑞虎9来了

态度原创

艺术
亲子
本地
房产
公开课

艺术要闻

石涛『野色册』

亲子要闻

胡图图早上发现自己有一只乌龟不见了,所以不太开心 杨雪呀

本地新闻

用Color Walk的方式解锁城市春日

房产要闻

14亿!电竞巨头出手,海棠湾“超级运动综合体”来了!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版