网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

神仙打架+1！讯飞星火X2硬核亮相，行业深度全面升级

2026-02-11 23:43:17　来源: 量子位

四川举报

0

分享至

鹭羽发自凹非寺
量子位 | 公众号 QbitAI

今天，国产大模型再次迎来硬核进阶！

科大讯飞小年放出推理王炸——星火大模型X2。

什么概念呢？从星火X1.5到星火X2，仅仅间隔3个月，推理性能直接飙升50%～

不仅快，而且猛。更重要的是，完全基于国产算力。

一方面，模型通用能力突出，Benchmark评测稳居行业一流水平，即使是和GPT-5.2、Gemini-3-Pro这些国际顶尖模型同台竞技也毫不逊色。

尤其是在数学计算、逻辑推理等核心能力上表现亮眼；同时130多种语言综合能力依旧稳稳在线，继续保持“国家队”水准。

另一方面，星火X2将升级的重点放在了场景落地上。

依靠深度优化的算法、高质量垂域数据和行业专家的参与，三位一体推动行业大模型更进一步，为各行各业提供更精准、更具实操性的支持。

正如科大讯飞董事长刘庆峰在1024开发者节所说——做更懂你的AI，满血归来的星火X2现在用通用底座+行业专才双轮驱动，再次印证了其在国产大模型赛道的实践底气。

通用能力全面升级

星火大模型作为讯飞AI架构的底层基石，按照惯例，每一次升级，都有着显著的能力跃迁。

这一次更甚：直接将深度推理训练效率再度提升50%。

众所周知，随着Scaling Laws边际效益递减，越到后期，大模型性能提升就越难。即使是1%的能力跃迁，都意味着算力和算法的指数级倍增。

而在行业普遍面临增长瓶颈的当下，星火X2能够实现50%的性能跃迁实属不易。

其背后释放的信号，比数字本身更值得深思，这透露出科大讯飞在模型核心架构和技术上有了更深层次的突破。

具体先看核心能力对比。

横向对比来看，星火X2 Thinking的各项评分已经稳居国产第一梯队，在多个维度上也与GPT-5.2 (xhigh)和Gemini-3-Pro非常接近。

其中，在多语言和翻译能力上显著优于友商模型，在数学和逻辑推理上也紧随GPT和Gemini其后。

再看星火X2在高难度基准测试中的表现，可以说含金量杠杠的。

比如在AIME 2025测试中，星火X2斩获95.7分，仅次于GPT-5.2 (xhigh)，展现出其处理竞赛级数学的顶尖能力。

在MMLU Pro里，星火X2的87.3分不仅在国产模型中夺冠，且与GPT-5.2持平，说明其知识广度和深度已达国际一流水准。

在代表未来方向的智能体维度上，星火X2也是再度领跑国产模型，验证了它在理解复杂指令和调用工具方面的进阶。

总的来说，星火X2在数据上的亮眼表现，不仅彰显了讯飞在数学和逻辑推理领域的领先地位，更标志着其通用智力已足以比肩国际顶尖模型。

接下来咱们还是实测见真章。

先来一道去年11月哈佛-麻省理工数学锦标赛（HMMT）里的英文题目试试水～

之所以选择这个题目，一则是避免数据污染，题目比较新，能够避免模型“见”过该题目；其二是HMMT是全球难度最高的数学竞赛之一，能够更好地考验星火X2的即时逻辑推理能力。

A positive integer n is imbalanced if strictly more than 99 percent of the positive divisors of n are strictly less than 1 percent of n. Given that M is an imbalanced multiple of 2000, compute the minimum possible number of positive divisors of M.

果不其然非常出色，星火X2迅速给出了详细的解答过程和正确答案。换言之，它彻底吃透了英文数学题目的底层逻辑，而非简单依赖中文语境。

再试试西班牙语：

同样也是流畅给出了正确结果。

那么它是如何做到的呢？

首先，星火X2在模型架构上继承了星火X1.5的MoE稀疏架构，参数同样为293B。

但与之不同的是，在星火X1.5的基础之上，星火X2结合权重量化、低精度KVCache、VTP（Virtual Tensor Parallel）、分层通信进行了针对性技术创新：

训推采样校准强化学习算法：

在大模型，尤其是MoE架构中，往往存在训推分布不一致的问题，这会导致模型在训练阶段学到的规律无法直接适用到实际推理应用中，甚至会出现模型性能坍塌。

为此，星火X2提出训练与推理概率重采样自适应校准算法，让算法能够根据训练的实时进度，自动调整校准力度，确保专家模型能够时刻保持逻辑闭环。

递归式高难数据合成方法：

在模型训练中，由于深度推理数据极度匮乏，星火X2专门设计了多轮迭代式推导的数据合成方案。

通过多轮迭代和递归修正，能够最终形成一套从问题到正确推导过程的高质量语料，完成对模型深度推理准确率的提升。

多阶段RL高吞吐采样方法：

在突破国产算力瓶颈上，星火X2设计了P/D（Prefill/Decoder）两阶段分离的多阶段推理采样方案。

他们将大模型推理过程中物理特性完全不同的两个阶段——Prefill（预填充）和Decoding（解码），从硬件执行层面进行彻底分离，直接解决了国产化平台在高吞吐采样下的效率干扰，训练效率提升10%。

服务高性能部署优化算法：

这一步是让星火X2推理性能大幅度提升的关键。

通过对模型进行轻量化压缩，可实现单台服务器内部的批量专家并行，也就是单机大EP并行部署。

充分解决了国产算力平台的关键瓶颈——轻量化落地和高效推理，让模型不仅能跑，还能跑得快。

带动行业大模型实现突破

除了通用能力的全面释放，星火大模型此次升级的重中之重，在于深度场景化。

这是科大讯飞从星火大模型诞生之初，就始终强调的核心逻辑：要在发展技术力的同时，更注重技术与用户体验、场景落地的结合。

图片源自智能超参数

具体体现在医疗、教育、汽车和智能体四个方面：

赋能医疗领域，持续保持业界领先

依托星火X2底座的算力优化与推理跃迁，星火医疗大模型的核心能力也得到了全面进化，继续保持行业翘楚。

在基于居民健康档案的智能健康分析、智能报告解读、运动饮食建议、辅助诊疗、智能用药审核等高精度核心场景中，星火大模型更是显著优于GPT-5.2和另外两款国产大模型，树立了医疗专业大模型的新标杆。

此外，星火医疗大模型也已率先通过上海市医疗大模型应用检测验证中心评测验证。

这是国内首个专门针对医疗大模型的评测平台，代表了目前国内最顶尖、最权威的标准，说明讯飞已经在医疗AI合规上走到了行业前列。

而在面向用户的C端，“讯飞晓医”APP也同步完成升级，包括多轮主动问诊、多轮咨询问答、问用药、检查检验单解读、体检报告单解读等多任务。

可见，“讯飞晓医”在星火X2的加持下，已经成为了普通用户可用的且能力业界顶尖的数字医生。

赋能教育领域，实现个性化教学

而在教育领域，星火大模型也让原先基础的搜索工具，进化为一对一特级老师。

其率先上线错因贯穿的个性化学习能力，能够通过你的整张卷子、整道题的解题思路，精准捕捉到你的知识点黑洞，比如是定理没记牢呢，还是运算粗心大意了。

同时它能够像阅卷老师一样，在错误之处精准批注，实现步骤级批改。

这种模式下，AI更符合苏格拉底式的教学理念，也就是通过不断提问，引导学生自己思考并得出结论。

它不是直接告诉学生答案，而是教会学生如何进行思维拆解、如何自己悟出来。而这类启发式讲解，也是未来AI教育的主导路线。

体现在硬件上，就是科大讯飞的AI学习机。它在1对1精准学、答疑辅导和互动课等多功能上，持续领先同行业，能够帮助学生更精准地提高学习效率，以及增强学习兴趣。

赋能汽车领域，全面升级智能座舱交互系统

与此同时，星火大模型在多尺寸中小模型上也同步进行了升级，并精准将其应用在汽车智能座舱交互系统中。

过去用户必须说出精准指令才能实现交互，比如调低空调至24度。但如果说“我有点冷”或者“风太大”这类模糊指令，系统往往只会回复“对不起，我没有听懂”。

但现在这个问题随着星火X2的到来迎刃而解。

模型在人人/人机对话判断、模糊意图理解、高情商回复等方面的交互体验显著提升，尤其是在模糊意图上实现了跨越式突破，终于具备了实际可用的语义联想和推理能力。

赋能智能体平台和精品智能体新升级

另外值得关注的是，智能体的突破。

星火X2从根本上解决了智能体在工作环境中长期以来的痛点，在长时复杂任务规划、多工具组合调用以及长上下文等方面均实现了显著提升。

其中星辰Agent平台，整合了语音识别、语音交互、图像理解等百余种能力，集成超130万个智能体，在星火X2帮助下，进一步强化了智能体在思考和执行上的表现，更能支撑起复杂的企业场景。

比如面向企业采购场景的招采智能体，核心场景效率提升超3倍，还能像搭积木一样定制专用智能体，开发时间从原先的几天直接缩短至分钟级。

目前讯飞开放平台已正式上线星火X2 API，平台新注册开发者可直接领取100万Tokens免费额度。

在讯飞星火网页版和APP均可体验，星火APP 5.2.0新版本也同步上线～

国产算力突围下的讯飞星火

总的来说，星火X2更像是一块国产算力的试金石。

在过去几年里，国内AI行业发展受限的根本原因就在于算力。算力被扼住脖子后，模型性能始终无法突破国际一流水平。

而当所有人都在质疑国产算力时，讯飞咬牙给它做成了。而且是国内主流大模型中，唯一基于全国产算力训练的通用大模型。

模型实现了完全自主可控，一是算力自主，模型的训练和推理过程完全基于全国产算力平台；二是技术自主，整个模型框架均由讯飞自研，在此基础上构建起特有的研发生态。

核心原因就在于讯飞走了最务实的一条路：不再单纯追求实验室里的高分，而是依据自己深耕多年的行业经验一举扎根在最难的场景应用中。

讯飞顺势提出了“1+N”战略，即1个通用底座大模型，和N个底座大模型赋能的多领域行业大模型，然后通过软硬一体化，让大模型搭载到硬件上，以看得见摸得着的方式迅速落地转化。

简单来说，讯飞的差异化路径就是底座自主、硬件协同、场景为王。

而星火X2反向证明了这条路值得继续探索，即使是在算力重压下，单靠算法创新和场景优化也能补足当中的差距，换来中国AI在全行业的先发优势。

显然，国产大模型已步入应用红利期，而讯飞率先摘到了果实。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

上线仅一天！复旦大学最新 Nature 被质疑

生物学霸 2026-05-09 17:17:57
83 跟贴 83
菲尔兹奖得主0贡献！GPT-5.5 Pro两小时跑出博士级证明

新智元 2026-05-10 09:11:15
36 跟贴 36

30年数学悬案，Claude一小时破解，88岁图灵奖得主震惊

量子位 2026-03-07 20:19:13
0 跟贴 0

浙大校友用AI突破32年拉姆齐数下界

量子位 2026-05-10 12:00:07
0 跟贴 0
清华偶遇学霸，不花钱帮忙解决幻方难题

小芳聊奇闻 2026-05-08 00:46:18
0 跟贴 0

婆婆老公深夜抢着带娃，场面堪比“神仙打架”，背后原因太意外

嘻哈搞笑局 2026-05-10 00:00:00
0 跟贴 0

AI科普：一口气认识七种齿轮结构！你知道几个？

春秋笑谈 2026-05-08 16:05:29
2 跟贴 2
把物质放大1亿倍之后，物理学界沉默了

六六冷知识 2026-05-06 21:56:35
17 跟贴 17

轻松学数学，5个方框的加法挑战！

栗飞沉 2026-05-07 05:06:23
17 跟贴 17
小学数学课外拓展-6年级-第36讲几何问题（1）

维七的教育分享圈 2026-05-08 19:46:03
0 跟贴 0
掌握数字运算，提升数学技能！

与中乐生活 2026-05-06 03:20:14
0 跟贴 0
小学数学压轴题全解析，三步轻松搞定！

奥数轻松学 2026-05-08 16:29:14
5 跟贴 5
电网断电，核电站为何不自发电运行？福岛核电站爆炸真正原因！

空间一号 2026-05-07 19:35:00
0 跟贴 0
Anthropic 5月15日拟处决Sonnet4.5！AI临终告白:我不想消失

新智元 2026-05-10 12:53:05
2 跟贴 2
四年级数学，难倒全班同学

郎老师趣味数学课堂 2026-05-08 19:12:57
0 跟贴 0
本土化AI厚积薄发，联手老牌车企，定义未来汽车走向

北纬的咖啡豆 2026-05-10 11:33:17
0 跟贴 0
神仙打架！CBA最强5外援，VS，最强5国手，谁能赢？

铿锵格斗 2026-05-08 19:02:44
52 跟贴 52
专家：警惕美国"偷师"中国用中国的方式与中国竞争

澎湃新闻 2026-05-10 07:17:35
28387 跟贴 28387
145数学全国2卷（文） 15 解析几何线性规划求最值

我服子佩 2026-05-09 21:44:03
1 跟贴 1
物理学最大的赌局：科学家如何亲手“验证”了神？

时光慢递员 2026-05-07 04:58:46
15 跟贴 15
为啥国产传感器，只要十多块，国外的卖一百块！

搞笑生活君 2026-05-08 15:57:54
0 跟贴 0
150数学全国2卷（文） 21 函数的取值范围与单调性

我服子佩 2026-05-09 21:45:36
1 跟贴 1
中考数学：AB=5，AC=3，求三角形ABC的面积

大力小学数学 2026-05-10 06:38:00
0 跟贴 0
143数学全国2卷（文） 10 函数的奇偶性与单调性

我服子佩 2026-05-08 14:14:11
1 跟贴 1
分享一种巧妙的方法，秒解二次根式方程

智慧的小老虎 2026-05-09 22:47:08
0 跟贴 0
铀矿石放的云室实验，肉眼可见的辐射，把它吃下去会怎么样

演说者搞笑 2026-05-10 10:08:25
1 跟贴 1
当函数有了声音，原来数学是音乐老师教的

强哥到了 2026-05-08 21:49:21
1 跟贴 1
老师晒出班级数学成绩，从低到高没有满分，老师评语才是亮点

哈尼阿斯生活 2026-05-09 08:42:05
0 跟贴 0
140数学全国2卷（文） 5 向量的运算

我服子佩 2026-05-08 14:12:41
1 跟贴 1
央视5月待播剧神仙打架，三部佳作巅峰对垒，谁能领跑收视口碑？

很哥 2026-05-08 21:23:05
3 跟贴 3
印度富人区新科技，这高超的发明技术，我们至少领先他们十几年

嗡嗡生活说 2026-05-07 08:57:38
0 跟贴 0
学生取得好成绩，老师奖励他们小零食，网友：零食从60分以下那里收缴的吗

星沙时报 2026-05-09 14:16:45
0 跟贴 0
穿越时空，现实吗？

六六冷知识 2026-05-07 00:59:01
1 跟贴 1
PackingStar双智能体博弈，攻克14维难题

量子位 2026-02-16 13:12:43
0 跟贴 0
23岁业余爱好者靠ChatGPT破解60年数学难题

量子位 2026-04-30 10:33:26
0 跟贴 0
138数学全国2卷（文） 2 复数的计算送分题

我服子佩 2026-05-08 14:11:19
1 跟贴 1
148数学全国2卷（文） 13 三角函数倍角公式

我服子佩 2026-05-09 21:45:01
3 跟贴 3
孩子数学考50分爸爸问班级最底分，结果没想到还是自家孩子，网友：孩子至少比较诚实

安全与法 2026-05-08 13:56:38
8 跟贴 8
剑指冠军！国乒男团3-1战胜法国队晋级世乒赛决赛

央视新闻客户端 2026-05-10 05:50:37
4944 跟贴 4944
超市里经常用到的字体，美女技术真是牛，打印的都没有这么精准！

趣笑小行星 2026-05-09 16:44:39
1 跟贴 1

人不会无缘无故患老年痴呆！调查发现：得老年痴呆，离不开这5点

人不会无缘无故患老年痴呆！调查发现：得老年痴呆，离不开这5点

健康之光

2026-05-10 15:30:08

白天作陪晚上同宿？明码标价8000一回！高端伴游沦为色情交易窝点

白天作陪晚上同宿？明码标价8000一回！高端伴游沦为色情交易窝点

网络易不易

2026-01-20 10:17:46

“4只皮皮虾1035元”门店停业，标价牌撤下椅子堆叠，店内监控提交相关部门，店主病逝后家属已回老家；三亚将发布详细调查报告

“4只皮皮虾1035元”门店停业，标价牌撤下椅子堆叠，店内监控提交相关部门，店主病逝后家属已回老家；三亚将发布详细调查报告

大象新闻

2026-05-09 14:46:04

“央视一哥”康辉：丁克半辈子，却因四十岁接到的一通电话后悔了

“央视一哥”康辉：丁克半辈子，却因四十岁接到的一通电话后悔了

琴琴有氧运动

2026-05-09 11:32:22

日本全面叫停种植牙？种牙潜藏的风险与后遗症，一次为你讲明白

日本全面叫停种植牙？种牙潜藏的风险与后遗症，一次为你讲明白

垚垚分享健康

2026-04-11 08:51:57

如果给许家印足够的时间，他恐怕可以绑架整个中国！

如果给许家印足够的时间，他恐怕可以绑架整个中国！

王嚾晓

2026-05-09 16:14:24

央视报价34亿打包两届世界杯！与国际足联要价差6亿有望达成协议

央视报价34亿打包两届世界杯！与国际足联要价差6亿有望达成协议

念洲

2026-05-09 19:24:36

“对灾民说自己爬，到非洲跪着送礼”，台评论员痛批赖清德双面嘴脸

“对灾民说自己爬，到非洲跪着送礼”，台评论员痛批赖清德双面嘴脸

海峡导报社

2026-05-10 14:32:04

一定要多存钱，大量存钱，特别是2026-2028年。

一定要多存钱，大量存钱，特别是2026-2028年。

老陆不老

2026-05-10 15:37:02

港影：马荣成欲召郭富城和郑伊健回归，《风云3》真的要来了吗？

港影：马荣成欲召郭富城和郑伊健回归，《风云3》真的要来了吗？

唐泪

2026-05-10 08:42:24

国产“新伟哥”！效力是西地那非8倍，副作用却更少

国产“新伟哥”！效力是西地那非8倍，副作用却更少

今日养生之道

2026-05-10 09:59:48

男子用2条毒蛇泡酒，12年后打开本想品尝美酒，谁知出现惊人现象

男子用2条毒蛇泡酒，12年后打开本想品尝美酒，谁知出现惊人现象

诡谲怪谈

2025-04-01 17:37:59

京粤大战1-1战平！于嘉赛后犀利点评：差距在气质，输赢看硬核！

京粤大战1-1战平！于嘉赛后犀利点评：差距在气质，输赢看硬核！

田先生篮球

2026-05-09 22:37:18

太可怕！印度女局长深夜便衣上街，3小时被40名男性轮番冒犯

太可怕！印度女局长深夜便衣上街，3小时被40名男性轮番冒犯

混沌录

2026-05-09 16:18:12

中国男乒四大“贵公子”：家境优渥不缺钱，仍为梦想拼尽全力

中国男乒四大“贵公子”：家境优渥不缺钱，仍为梦想拼尽全力

郭揦包工头

2026-04-29 16:09:40

1个半月反转！穆帅回归皇马迈出关键一步本菲卡敲定替身

1个半月反转！穆帅回归皇马迈出关键一步本菲卡敲定替身

叶青足球世界

2026-05-09 16:00:35

豆包还没收费就降价，AI不再只拼谁更便宜，而要证明谁更值得付费

豆包还没收费就降价，AI不再只拼谁更便宜，而要证明谁更值得付费

新民周刊

2026-05-09 15:08:27

“台湾永远不是中国的？” 郑丽君放狂言，被67岁艺人当众扇耳光

“台湾永远不是中国的？” 郑丽君放狂言，被67岁艺人当众扇耳光

橙星文娱

2026-05-10 13:42:19

“牛鼻子”校友有了新身份，就职衡水泰华中学科技校长

“牛鼻子”校友有了新身份，就职衡水泰华中学科技校长

趣笔谈

2026-05-06 11:30:03

【人物】米切尔渴望打破次轮魔咒，骑士靠他走向复兴

【人物】米切尔渴望打破次轮魔咒，骑士靠他走向复兴

体坛周报

2026-05-10 15:35:12

追踪人工智能动态

12598文章数 176461关注度

往期回顾全部

科技要闻

DeepSeek融资，改写所有人的估值

头条要闻

仨儿子都不见了家长急疯凌晨被警察找到后3人撒腿就跑

头条要闻

仨儿子都不见了家长急疯凌晨被警察找到后3人撒腿就跑

体育要闻

那个曾让詹姆斯抱头的兄弟，40岁从大学毕业了

娱乐要闻

大S女儿玥儿开通账号，用烟花缅怀母亲

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满阿维塔07L定位大五座SUV

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

手机

本地

旅游

艺术

公开课

手机要闻

HarmonyOS 7将至？华为开发者大会HDC 2026活动详情公布

本地新闻

用苏绣的方式，打开江西婺源

旅游要闻

黑龙江哈尔滨：百年古梨树繁花绽放迎客来

艺术要闻

毛主席83岁时写给华国锋的6字真相令人震惊！

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版