网易首页 > 网易号 > 正文 申请入驻

好未来推出千亿级数学大模型MathGPT,即日开启公测

0
分享至

界面新闻记者 | 查沁君

首个数学领域的教育垂直大模型上线。

8月24日,时值好未来(NYSE:TAL)20周年,好未来CTO田密在直播活动中宣布,该公司自研的数学领域千亿级大模型MathGPT正式上线并开启公测。

今年5月,好未来曾公布正在进行自研数学大模型的研发,由CTO田密牵头,命名为MathGPT。主要面向全球数学爱好者和科研机构,以解题和讲题算法为核心。

MathGPT官网显示,MathGPT的数学计算能力已覆盖小学、初中、高中的数学题,题型涵盖计算题、应用题、代数题等多个类型,还可以针对题目进行追问,暂未开放数学之外的问答互动。

用户使用MathGPT时,用文字或图片方式上传数学题,即可得到对话式的解答反馈,答案包含“分析”、“详解”、“点睛”三个部分;也可以通过“随机来一题”的按钮,随机生成数学题目并由系统给出解答。目前,MathGPT支持中文、英文版本的PC端和移动端。

据好未来提供的MathGPT技术报告显示,在六个公开数学评测集合CEval-Math、AGIEval-Math、APE5K、CMMLU-Math、高考数学、Math401的测试结果中,MathGPT的表现不差。

其中,以微软华人研究团队发布的基准测试AGIEval为例,Open AI推出的GPT-4、好未来的MathGPT的正确率分别为39.2%、60.34%;但在Math401评测中,GPT-4略胜一筹,正确率高出MathGPT1.5个百分点。

同时,在C-Eval的初高中的全科测试集合上,MathGPT的表现成绩也普遍高于GPT-4和清华团队推出的第二代中英双语对话模型ChatGLM2。

一个普遍共识是,通用大模型“重文轻理”,在数学问题的解决、讲解、问答和推荐方面则存在明显的短板。即使是表现优异的GPT-4也曾在鸡兔同笼的基本数学问题上“栽跟头”。相比大模型更擅长的语文、英语,数学更偏逻辑思维、推理能力,大模型研发难度也更高。

“数学光喂内容没用,因为它是原理问题,现有技术没法做到套一下就能使用(的地步)。”网易有道(NYSE:DAO)CEO近期在媒体交流时表示,相反,如果是文字语言型的应用,不需要特别强的推理。从现有时间经验来说,英语、语文比数学的评测结果更理想,速度也更快。

作为曾经数学培训的头部公司,好未来积累了大量的数学数据和生产能力。2017年,成立AI lab开启人工智能研究。之所以研发数学垂直大模型,该公司称“在通往通用人工智能的路上,数学推理能力很重要,全球有很多大型公司在做相关研究。”

“AI带来了重新定义教育行业的机会,大模型技术使得大规模的因材施教真正有了实现的可能。”田密认为,大模型的本质,是一种更高效的、从数据中学习知识并加以应用的方式。

在AI能力的加持下,“学生自学+AI答疑”的新型学习方式成为广泛的可能。学习者获得优质教学内容的门槛、成本降低,获得的教学内容个性化、精细化程度持续升高,可以实现千人千面的AI教学和答疑辅导。

好未来正与中国信通院、复旦大学、科大讯飞(002230.SZ)、百度(BIDU.US)等科研机构、高校、企业一同编制教育大模型团体标准,从覆盖场景、应用成效、服务可靠等维度全面评估教育大模型能力,为教育大模型应用落地提供参考与指导。

大模型训练、运营及维护需要大量专业人才,好未来目前还在招兵买马。

MathGPT官网显示,其招聘岗位包括大模NLP算法工程师、大模型训练&推理加速工程师、MathGPT产品经理、AI后台Golang开发工程师、资深UI设计师(AI方向),以及用户研究。其中,前两个岗位的工作地点不局限于国内,还包括美国旧金山湾区的库比蒂诺(Cupertino),被称为“硅谷的心脏”,苹果公司总部也位于此。

在MathGPT发布同时,好未来也在官网更新了一个具有代表性和挑战性的数学任务评测集,供全球人工智能专家、数学爱好者体验和测评。

据田密透露,随着公测的顺利进行,MathGPT的解题能力将得到持续提升,基于MathGPT的产品级应用也正在加速研发中,将于近期发布。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美军画的饼又被“白菜化”,解放军战士“遛狗”,让国外一片破防

美军画的饼又被“白菜化”,解放军战士“遛狗”,让国外一片破防

战域笔墨
2024-05-28 17:13:20
Alex Wang重获世界上最年轻白手起家亿万富豪称号

Alex Wang重获世界上最年轻白手起家亿万富豪称号

福布斯
2024-05-28 17:22:49
快要被北野武新片笑死了!

快要被北野武新片笑死了!

桃桃淘电影
2024-05-28 09:18:21
中国的惩罚开始了!这就是外长窜台的代价!

中国的惩罚开始了!这就是外长窜台的代价!

明日之家
2024-05-29 07:40:03
伊朗出手了,5连杀!

伊朗出手了,5连杀!

奇名呀
2024-05-28 13:00:08
10万亿转移支付,凭什么四川拿得最多?看完这些数据沉默了

10万亿转移支付,凭什么四川拿得最多?看完这些数据沉默了

财话连篇
2024-05-28 17:45:06
记者扮男客潜入采耳店,偷拍服务全过程:女技师、柔式按摩别有洞天

记者扮男客潜入采耳店,偷拍服务全过程:女技师、柔式按摩别有洞天

古今档案
2024-05-07 13:04:58
这里,才是中美博弈的最终战场!

这里,才是中美博弈的最终战场!

一个坏土豆
2024-05-26 20:11:09
沙特逆转局势!有史以来最大订单狠狠打脸,美国谎言大白天下

沙特逆转局势!有史以来最大订单狠狠打脸,美国谎言大白天下

大国观察眼
2024-05-28 21:35:03
赖清德实在扛不住了,对美国提个请求,美方一句话回复,岛内炸锅

赖清德实在扛不住了,对美国提个请求,美方一句话回复,岛内炸锅

千里持剑
2024-05-28 15:22:52
从朝鲜归来,有些大实话不得不讲!

从朝鲜归来,有些大实话不得不讲!

李砍柴
2024-04-21 23:53:00
上海的楼市大招,给我看乐了

上海的楼市大招,给我看乐了

中产先生
2024-05-28 13:38:57
我们家目前的收入状态。我每个月退休金1670元,老公每月3800元。

我们家目前的收入状态。我每个月退休金1670元,老公每月3800元。

知秋侃史
2024-05-27 01:18:46
无缘横扫!欧文致命失误+东契奇丢关键加罚 紧咬球衣沮丧空砍三双

无缘横扫!欧文致命失误+东契奇丢关键加罚 紧咬球衣沮丧空砍三双

颜小白的篮球梦
2024-05-29 11:11:55
保时捷只卖44万了

保时捷只卖44万了

华尔街见闻官方
2024-05-28 19:05:38
刹车失灵?“魏忠贤”们倒戈!

刹车失灵?“魏忠贤”们倒戈!

车轱辘话V
2024-05-28 20:44:10
坐标京藏高速辅路,市民出三招破解拥堵……交管局:将采纳!

坐标京藏高速辅路,市民出三招破解拥堵……交管局:将采纳!

呼呼历史论
2024-05-29 06:27:01
耶伦承认,美国消费者顶不住了,美元只懂收割,如今反噬来了

耶伦承认,美国消费者顶不住了,美元只懂收割,如今反噬来了

关权教授聊经济
2024-05-28 12:15:03
孩子画鸡“不及格”,爸爸晒真鸡照片质问老师:画得不够像吗?

孩子画鸡“不及格”,爸爸晒真鸡照片质问老师:画得不够像吗?

新时代的两性情感
2024-05-22 11:01:46
威武!老太太摆摊,被两个城管放倒在地!解放台湾指日可待!

威武!老太太摆摊,被两个城管放倒在地!解放台湾指日可待!

我觉得我
2024-05-27 18:05:59
2024-05-29 11:38:44
界面新闻
界面新闻
只服务于独立思考的人群
589294文章数 1291108关注度
往期回顾 全部

科技要闻

比亚迪重磅发布:最高续航2500KM

头条要闻

官员"信口开河"拿茅台比方污水 简历从官网撤下

头条要闻

官员"信口开河"拿茅台比方污水 简历从官网撤下

体育要闻

阿根廷一代神锋,击碎了沙特的金元足球梦

娱乐要闻

张若昀怎么剧外比剧内更惨兮兮…

财经要闻

东方通收购藏雷 花6亿买来"业绩变脸"

汽车要闻

新哈弗H6苦练内功 向燃油车绝缘智能SAY NO

态度原创

家居
房产
本地
游戏
军事航空

家居要闻

与美共生 空间线条勾勒生活风雅

房产要闻

有点猛!最新房价:海南每㎡跌了2000多!

本地新闻

食味印象|歙县限定!枇杷味儿的清甜初夏

仅正式上线一天:《多元宇宙大乱斗》玩家峰值超11万!

军事要闻

以军装甲部队进入加沙地带南部城市拉法市中心

无障碍浏览 进入关怀版