网易首页 > 网易科技 > 网易科技 > 正文

讯飞星火X1升级突破:推理性能比肩全球一流水平

0
分享至

4月20日,科大讯飞深度推理大模型——讯飞星火X1迎来全新升级;讯飞方面表示,升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上效果显著提升,在模型参数比业界同类模型小一个数量级的情况下,整体效果对标OpenAI o1和DeepSeek R1。

讯飞方面表示,星火X1除了在常见通用任务取得显著进步之外,由于融入了更多场景复杂类型数据,模型的泛化性也取得了进步,在教育、医疗、司法等领域表现明显。

面向企业和广大开发者,讯飞星火X1首发“快思考、慢思考统一模型”,全新升级模型定制优化工具链,进一步降低大模型私有化部署和定制门槛;同时,讯飞星火X1 API已上线讯飞开放平台开放服务,作为首个支持全国产算力微调的推理大模型,讯飞星辰MaaS平台同步上线了星火X1微调服务。

据讯飞方面表示,升级后的星火X1在多个任务上效果继续突破,展现出优异的性能,根据最新测试集评测结果,星火X1在通用任务效果评测中全面对标OpenAI o1和DeepSeek R1,在数学、知识问答等方面表现突出。

数学答题和复杂的数理逻辑推理方面,星火X1能够准确识别出复杂的数学公式,不仅给出完整的解题思路,输出结果也严谨清晰;在逻辑推理时全方位思考,思考可能出现的每一种假设,表现出更强的严谨性和准确性。代码能力上,星火X1不仅提高了代码生成的准确率,对生成代码逻辑理解也进一步提升,能够应对更复杂的编程需求,思考问题的多种可能性,帮助开发者快速实现功能。在语言理解方面,模型输出内容、格式更加符合用户指令要求,能够给到更加准确且深度思考的结果,生成内容更加连贯、准确。

此外,星火X1的长思维链能力支持图像输入,可以对输入的图像进行关联思考,对于图像中的多种复杂元素,探究可能的含义和目的,进行更深层次的信息整合和推理。

本次星火X1升级不仅提升了通用能力,也同步增强了面向行业的解决方案能力;以司法行业为例,对于行业专业需求,例如根据材料总结案件事实以及判决理由,升级后的星火X1能够精准把握用户指令,详细分析争议点,快速定位关键信息,并输出准确内容,为行业用户提供专业、可靠的智能支持。

在技术创新和模型部署方面,星火X1首发“快思考、慢思考统一模型”,由一个模型同时支持两种思考模式,提升了模型处理不同复杂度任务的能力,满血版星火X1仅需4张卡(华为910B)即可部署,简化了私有化部署流程。

同时,星火X1还全新升级了模型定制优化工具链,支持SFT(监督微调)、强化学习两种模型定制优化方案,只需16张卡(华为910B)即可完成行业定制优化,有效降低了企业AI的定制门槛。

讯飞星火X1的全新升级背后,是一系列独特的技术创新与理念突破。

首先,提出基于问题难度的大规模多阶段强化学习方法,在复杂推理、数学、代码、语言理解等场景全面提升模型效果及泛化性;同时提出强化学习动态更新算法,基于样本采样长度动态调整强化学习更新速度,进一步提升深度思考强化学习效率及效果。

其次,统一模型下的快慢思考混合训练方法,充分发挥快慢思考数据相互促进作用,实现基于系统指令控制模型是否深度思考,支撑下游更高效便捷地部署使用;

第三,实现多项工程技术创新,显存动态卸载技术大幅提升长文本推理并发、训推共卡协同实现高效训推资源转换、推理引擎冬眠机制实现快速拉起和恢复,实现国产算力平台上高效和稳定的强化学习训练全流程。

讯飞表示,在中美科技竞争日趋激烈的背景下,星火X1选择的全国产化技术路径更具深远意义。最近,科大讯飞与华为昇腾联合团队在前期工作基础上再获突破,升级MoE模型的PD分离+大规模专家并行系统方案,实现了集群推理性能翻番,包括PD分离部署提升20%+性能、MTP多token预测技术提升30%+整体性能、专家负载均衡算法优化使集群吞吐提升30%+,以及异步双发射技术降低服务请求调度耗时提升10%系统性能。(平章)

延伸阅读
相关推荐
热点推荐
冬天第一大补,不是牛羊鸡鸭肉,而是它,1元一斤,常吃身体棒

冬天第一大补,不是牛羊鸡鸭肉,而是它,1元一斤,常吃身体棒

江江食研社
2025-12-14 08:30:10
脑梗“偏爱”中国人?80%患者都缺一种维生素!

脑梗“偏爱”中国人?80%患者都缺一种维生素!

孟大夫之家1
2025-12-02 19:46:07
暴风眼中的张水华|在场

暴风眼中的张水华|在场

红星新闻
2025-12-14 16:42:26
川普:肢解欧盟

川普:肢解欧盟

西楼饮月
2025-12-14 20:50:27
12记三分!库里30岁后第45次得分40+超越乔丹历史第一

12记三分!库里30岁后第45次得分40+超越乔丹历史第一

北青网-北京青年报
2025-12-15 15:20:24
“平均年薪40万!”西工大毕业生采访走红,网友:还可以再假一点

“平均年薪40万!”西工大毕业生采访走红,网友:还可以再假一点

知晓科普
2025-12-14 13:30:05
分析100个出轨案例发现,50岁后频繁出轨的女人,有3个共性

分析100个出轨案例发现,50岁后频繁出轨的女人,有3个共性

我的琪琪美玉
2024-02-23 13:04:06
日元加息撞上美元降息,全球近20万亿美元的平仓风暴!

日元加息撞上美元降息,全球近20万亿美元的平仓风暴!

城事堂
2025-12-14 15:40:01
40岁后才懂:这些年瞎花的钱,全是交了智商税!

40岁后才懂:这些年瞎花的钱,全是交了智商税!

一桶浆糊要一统江湖
2025-10-27 17:35:07
被网友家的“暖气片用法”惊到了!打开思路后,比地暖还要香

被网友家的“暖气片用法”惊到了!打开思路后,比地暖还要香

装修秀
2025-12-08 11:35:03
不要忙着打日本,中国应该去全国各地的武器仓库突击大检查!

不要忙着打日本,中国应该去全国各地的武器仓库突击大检查!

时分秒说
2025-12-09 12:11:20
无业男戏瘾上身扮民警12年,高升至公安局副局长,因百万借款露馅

无业男戏瘾上身扮民警12年,高升至公安局副局长,因百万借款露馅

历史品鉴仓
2025-12-12 17:02:56
库里复出前勇士连胜!复出后连败!他关键时刻各种拉胯!

库里复出前勇士连胜!复出后连败!他关键时刻各种拉胯!

氧气是个地铁
2025-12-15 14:45:16
医生:希望你的血液检查报告里,永远不要出现这几项异常

医生:希望你的血液检查报告里,永远不要出现这几项异常

全球军事记
2025-11-25 13:59:34
北京四中家长会刷屏!背后的原因令人深思

北京四中家长会刷屏!背后的原因令人深思

京城教育圈
2025-12-12 22:13:25
警告!那些你为减肥而少吃的碳水,正以最危险的方式补回来……

警告!那些你为减肥而少吃的碳水,正以最危险的方式补回来……

猫大夫医学科普
2025-12-14 06:49:36
洪森老实了,不再上蹿下跳,柬埔寨恳请泰国立即停止军事行动

洪森老实了,不再上蹿下跳,柬埔寨恳请泰国立即停止军事行动

万国明信片
2025-12-14 12:27:53
以德报怨!罗德里戈连场进球拯救阿隆索 生死关头才知谁最可信赖

以德报怨!罗德里戈连场进球拯救阿隆索 生死关头才知谁最可信赖

雪狼侃体育
2025-12-15 14:16:16
深夜爆胎?特斯拉客服教科书式售后:秒响应,自带备胎到现场

深夜爆胎?特斯拉客服教科书式售后:秒响应,自带备胎到现场

特空间
2025-12-15 12:49:41
杀回来了!保罗重返火箭救主:欠我的季后赛,这次亲手夺回来!

杀回来了!保罗重返火箭救主:欠我的季后赛,这次亲手夺回来!

海阔山遥YAO
2025-12-14 15:53:24
2025-12-15 15:36:49

科技要闻

平价数码产品,要和我们说再见了?

头条要闻

极右翼候选人卡斯特当选智利总统 其父亲被指曾是纳粹

头条要闻

极右翼候选人卡斯特当选智利总统 其父亲被指曾是纳粹

体育要闻

战胜完全体雷霆,马刺“疯狂动物城”只是半成品

娱乐要闻

黄绮珊在何晴去世首发,10年悄悄祈福

财经要闻

新会陈皮乱象曝光:产地造假、年份速成

汽车要闻

二排有大屏还有高阶辅助驾驶 风云T9L明年一季度上市

态度原创

数码
艺术
房产
教育
军事航空

数码要闻

999元:漫步者N500桌面音箱开售,100W额定功率+蓝牙6.0

艺术要闻

369米!中国第三大民企的全球运营总部,网传三个设计方案

房产要闻

6.66亿摘地,海南封关大动作,千亩海澄新城震撼登场

教育要闻

讲真,初三家长只需做好一件事

军事要闻

泽连斯基称乌方已妥协不加入北约 俄方发声

无障碍浏览 进入关怀版
×