网易首页 > 网易号 > 正文 申请入驻

科大讯飞首推深度推理模型 深度思考成为模型发展决胜关键?

0
分享至

AI界掀起的“推理潮”正在成为大模型发展的又一竞争领域。

1月15日,科大讯飞(002230.SZ,股价46.49元,市值1074.73亿元)发布国内首个基于全国产算力平台训练的具备深度思考和推理能力的大模型——讯飞星火深度推理模型X1(以下简称X1模型)。

深度推理模型,即拥有更长链条的逻辑思考和推理能力。和基础模型最直观的区别,便是在解决复杂问题上更具有优势,在回答问题之前模型会形成一段较长的思维链条,使得答题能力和准确度大幅提升。例如在解决高考数学题或者是奥赛题上,效率与准确率得到大幅提升。

《每日经济新闻》记者从科大讯飞方面获悉,X1模型具备3个典型特点。首先,可以化繁为简,将复杂问题拆解成多个步骤进行思考和推理。其次可以进行自我反思和验证,第三是由于人类标注数据难度极大,X1模型会根据答案的正确与否进行强化训练。

推理模型:一条全新的技术路线

不同于此前生成式AI通过大规模预训练来进行下一个词的预测,并将重心放置于语义理解、文本生成上,推理模型的工作思路更接近于像人一样思考。

2024年9月,OpenAI率先推出了其最强的推理模型o1,并称o1在测试化学、物理和生物学专业知识的基准GPQA-diamond上,全面超过了人类博士专家,OpenAI曾宣称“通用人工智能之路,已经没有任何阻碍”。

OpenAI所推出的o1背后的训练方式与之前的模型有着根本不同。它使用了一种全新的优化算法和专门为其量身定制的新训练数据集进行训练,这个数据集中包含“推理数据”和专门为其量身定制的科学文献。并采用“强化学习”的方式,通过奖励和惩罚来教导模型自行解决问题,再通过“思路链”(chain of thoughts)来处理用户查询的问题,给出思路链的总结摘要版,类似于人类一步步来处理问题的方式。

X1模型的训练亦是采用了一条全新的技术路线。据科大讯飞研究院的研究员介绍,X1模型训练和推理需要高强度的交互,并且涉及到跨任务的数据传输。这种新的技术路线带来了任务优化目标的转变,从以往追求高在线响应速度,转变为追求高的离线吞吐任务处理能力。

科大讯飞研究院的研究员在1月15日的直播中演示了X1模型如何解答高考题、AIME竞赛题以及高中奥赛题。X1模型不仅准确给出了这些题目的答案,还对解题思路和步骤进行了详细拆解。与通用大模型相比,其解题过程更接近人类的“慢思考”方式,并且用更少的算力,实现了更好的效果,这是推理模型的优势。

根据科大讯飞方面提供的数据,讯飞星火X1在近期参加的小初高(含竞赛)、大学(含竞赛)、AIME、MATH 500等多项“考试”中,与OpenAI o1 Preview、OpenAI o1、DS-R1-Lite-Preview、QwQ 32B-Preview、k1-math、InternThinker(均为当前先进的推理模型)等测试成绩相比分数排名靠前。

深度思考成模型发展决胜关键?

从当前看,模型学会深度思考与逻辑推理,能够有效解决训练成本高攀、缺乏逻辑推理导致乱答题的现象,从一个使用工具变成一个自动化的“劳动力”。基于输入数据,通过逻辑推理和概率计算,得出更加准确和可靠的预测结果,能够让大模型在应用场景中获得更多的竞争优势,成为未来竞争的决胜关键。

在o1发布后,国产大模型厂商深度求索、阿里通义、月之暗面、智谱GLM、昆仑万维等也在去年11月到今年1月迅速跟进,先后推出了自己的深度推理模型。

DeepSeek在去年11月发布DeepSeek 推理模型预览版时称:“‘深度思考’ 模式专门针对数学、代码等各类复杂逻辑推理问题而设计,相比于普通的简单问题,能够提供更加全面、清晰、思路严谨的优质解答,充分展现出较长思维链的更多优势。”

智谱微信公众号在2024年最后一天发布其深度推理模型GLM-Zero预览版并称:“我们探索并验证了强化学习在增强模型深度推理能力方面不可取代的作用。随着强化学习训练量的增加,模型在深度推理等方面的效果稳步提升。”

科大讯飞方面称,在o1发布之后,科大讯飞在一个月之内迅速跑通了关键算法。尽管在全国产算力平台上训练深度推理模型遭遇了诸多挑战,但最终攻克了训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题。

目前,推理模型在具有高度确定性答案的数学、医疗、代码等领域已经有了出色的表现,不断改进的工作在适应日益复杂的应用落地上已经有了初步验证。在应用上,科大讯飞方面称,X1已经在应用领域产生了真实价值。

教育业务上,科大讯飞称,随着相关技术融入,AI学习机学习推荐和诊断将变得更加精准,解题思路和知识链条将更加清晰。医疗领域,X1模型策略可使得专科辅助诊断和复杂病历内涵质控的准确率均达90%。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
OpenAI宣布关闭Sora视频应用,终止与迪士尼10亿美元合作

OpenAI宣布关闭Sora视频应用,终止与迪士尼10亿美元合作

澎湃新闻
2026-03-25 09:38:08
先被里瓦尔多全面逆袭,后遭齐达内强势碾压,全能战士时运不济

先被里瓦尔多全面逆袭,后遭齐达内强势碾压,全能战士时运不济

足篮大世界
2026-03-26 10:52:09
程潇不愧是“奶潇”

程潇不愧是“奶潇”

情感大头说说
2026-03-16 00:19:50
最高奖10万!虹口这波拆迁户,赚翻了!

最高奖10万!虹口这波拆迁户,赚翻了!

新浪财经
2026-03-26 13:07:51
德云社上海开业三天遭抵制,郭德纲押宝失误引担忧

德云社上海开业三天遭抵制,郭德纲押宝失误引担忧

史鹷的生活科普
2026-03-24 22:55:38
李连杰当面一句“我刚换了心脏”,谢苗脸唰一下白了,气都不敢喘

李连杰当面一句“我刚换了心脏”,谢苗脸唰一下白了,气都不敢喘

西楼知趣杂谈
2026-02-28 21:36:48
陈熠又输了,王艺迪女单夺冠直通伦敦?世乒赛国乒女队5人名单出炉!

陈熠又输了,王艺迪女单夺冠直通伦敦?世乒赛国乒女队5人名单出炉!

乒乓助手
2026-03-27 00:05:01
全球污染最严重30城市:印度上榜14座、巴基斯坦10座,那我国呢?

全球污染最严重30城市:印度上榜14座、巴基斯坦10座,那我国呢?

南生今世说
2026-03-26 10:37:09
“老师最烦这种现眼包家长”,宝妈运动会穿紧身裙,被嘲故作娇弱

“老师最烦这种现眼包家长”,宝妈运动会穿紧身裙,被嘲故作娇弱

妍妍教育日记
2026-03-17 20:29:16
京华城案一审宣判不只柯文哲,应晓薇被判15年半,沈庆京10年

京华城案一审宣判不只柯文哲,应晓薇被判15年半,沈庆京10年

海峡导报社
2026-03-26 15:29:03
AI冲击来得太快!加州大学系统面临史上最大挑战

AI冲击来得太快!加州大学系统面临史上最大挑战

留学咖啡馆
2026-03-25 08:33:07
身中29枪!台“百亿赌王”遛狗遇伏,在柬埔寨遭枪杀

身中29枪!台“百亿赌王”遛狗遇伏,在柬埔寨遭枪杀

元宝课堂
2026-03-25 20:40:59
2026新门澳今晚最新内幕特马精选一肖一码一特码资料三中三

2026新门澳今晚最新内幕特马精选一肖一码一特码资料三中三

寰域展览
2026-03-26 22:11:26
“住宅禁放骨灰盒”新规出炉,引争议!网友:可以去化房地产库存

“住宅禁放骨灰盒”新规出炉,引争议!网友:可以去化房地产库存

火山詩话
2026-03-26 11:11:22
干翻埃尔法?尊界MPV实车曝光,前脸照搬S800

干翻埃尔法?尊界MPV实车曝光,前脸照搬S800

泡泡网
2026-03-26 11:21:11
这才叫杀疯了!烂番茄100%动作神片,这不直接碾压《镖人》?

这才叫杀疯了!烂番茄100%动作神片,这不直接碾压《镖人》?

动物奇奇怪怪
2026-03-26 17:48:01
油价反转!95号汽油破9元后迎下调,4月7日调价最新预测

油价反转!95号汽油破9元后迎下调,4月7日调价最新预测

复转这些年
2026-03-26 09:40:14
记者:利物浦把40万镑周薪给错了人,他们本应该留下阿诺德

记者:利物浦把40万镑周薪给错了人,他们本应该留下阿诺德

懂球帝
2026-03-26 15:47:08
马卡:马竞计划将阿尔瓦雷斯的年薪提高至1000万欧

马卡:马竞计划将阿尔瓦雷斯的年薪提高至1000万欧

懂球帝
2026-03-26 20:46:05
小小的但有硬派味,丰田酷路泽 FJ 正式发售,约 26.7 万元

小小的但有硬派味,丰田酷路泽 FJ 正式发售,约 26.7 万元

爱范儿
2026-03-26 15:27:20
2026-03-27 02:12:49
每日经济新闻 incentive-icons
每日经济新闻
中国主流财经全媒体平台。
1519792文章数 2724761关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

亲子
本地
家居
公开课
军事航空

亲子要闻

看看把孩子吓得哈哈哈

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

家居要闻

傍海而居 静观蝴蝶海

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版