网易首页 > 网易号 > 正文 申请入驻

单台昇腾服务器可跑!国产算力加持大模型升级,推理性能提升50%

0
分享至


智东西
作者 程茜
编辑 李水青

智东西2月11日报道,今日,科大讯飞基于全国产算力训练的星火X2大模型正式发布。

星火X2通用能力实现提升,在其公布的数学、推理、语言理解、智能体等能力测评上可以媲美GPT-5.2、Gemini-3-Pro等模型。星火X1.5于2025年11月6日发布,仅三个月后星火系列新旗舰模型就上线了。


科大讯飞官方公众号显示,星火X2通过量化单台昇腾服务器即可运行,其采用293B MoE稀疏架构,结合权重量化、低精度KVCache、VTP(Virtual Tensor Parallel)、分层通信等多种工程化创新,实现了国产大EP并行部署,推理性能相比X1.5提升50%。

除通用能力升级外,星火X2还在医疗、教育、汽车、智能体等领域针对讯飞的产品实现了升级。

目前,星火X2的最新能力可直接在讯飞星火网页版和APP体验,全新API也已上线讯飞开放平台。

一、能解超难推理题,多项测试可媲美GPT-5.2、Gemini-3-Pro

智东西实测了一波星火X2发现,新模型在回答数学、推理难题时,拆解问题、规划步骤的思路清晰。

首先,智东西上传了一道设计概率难题,提示词为“某工厂生产的产品次品率为5%,随机抽取200件产品进行检验。求恰好有10件次品的概率,若要保证95%的把握认为次品率不超过5%,至少需要抽取多少件产品?”

星火X2先拆解了一共有几个问题以及要选择哪一种方式求解,最后给出了恰好有10件次品的概率为12.8%,至少需要抽取59件产品,才能有95%的把握认为次品率不超过5%。


然后,智东西上传了一道推理难题,提示词为“有两座城:真城人永远说真话,假城人永远说假话。一个人来自其中一城,你只能问一个问题,让他回答是 / 否,就能判断他来自真城还是假城。你该问什么问题?”

星火X2在回答时分析了问题可以利用的条件,并列出了几种可能的情况,然后一步步找到最清晰、简洁的问法。


在讯飞公布的多项基准测试成绩中,星火X2在语言理解、逻辑推理、数学、翻译、多语言等方面,均超过了DeepSeek V3.2和Qwen3 Max,且与GPT-5.2和Gemini 3 Pro相比得分差距较小。

外部公开高难任务效果对比上,星火X2在数学领域整体表现较好,仅次于GPT-5.2,在综合知识和复杂问答上,星火X2与GPT-5.2、Gemini-3-Pro、Qwen3-Max差距不大。星火X2的代码和推理能比,相比GPT-5.2、Gemini-3-Pro有一定差距。


二、讯飞晓医解答率均超80%,能同时对比两张检查单

面向垂直领域,星火行业大模型在教育、医疗、司法、汽车交互、企业智能体应用等场景的效果也实现了升级。

在医疗领域,星火医疗大模型X2在智能健康分析、智能报告解读、运动饮食建议、辅助诊疗、智能用药审核等关键任务上,表现均超越DeepSeek V3.2、GPT-5.2和Qwen3-Max。


在此基础上,讯飞晓医App在多轮主动问诊、多轮咨询问答、问用药、检查检验单解读、体检报告单解读等健康咨询任务上的表现升级,解答率均超过80%。


科大讯飞官方放出了讯飞晓医解读检验单的案例,其上传了两份患儿不同时期的血常规结果,讯飞晓医会进行联合解读,动态分析关键指标的变化趋势,结合患儿年龄对检验报告中的不正常数据进行解读。


不过当智东西更新了讯飞晓医App后,发现其下方显示的是“深度思考(X1)”。

三、教育汽车智能体平台均升级

基于星火X2的汽车智能座舱交互系统、科大讯飞AI学习机、星辰Agent平台均实现了升级。

在教育领域,星火教育大模型X2数学步骤级批改、错因定位等能力升级。面向学生自主学习场景,科大讯飞AI学习机在1对1精准学、答疑辅导和互动课等效果持续提升。


基于星火X2,在汽车领域的2B、7B、30B-A3等多尺寸中小模型同步升级,使得汽车智能座舱交互系统在人人/人机对话判断、模糊意图理解、高情商回复等方面交互体验显著提升。


星辰Agent平台进一步强化了“会思考能执行”的精品智能体构建能力。当前该平台的智能体数量已经超过130万,已整合语音交互、语音识别、图像理解等百余种精品开放平台能力。

四、4大技术升级,涵盖算法、数据集、专业思维链强化学习

星火X2的升级得益于其背后的四项工程级技术:

训推采样校准强化学习算法:针对MoE大模型RL训练中的训推分布不一致问题,提出训练与推理概率重采样自适应校准算法,提升强化学习训练准确率和稳定性。

递归式高难数据合成方法:针对高难任务数据稀缺问题,设计多轮迭代式推导的数据合成方案,实现推理错误逐步纠正与收敛,持续构建稀缺型高质量数据,提升模型深度推理准确率。

多阶段RL高吞吐采样方法:设计P/D(Prefill/Decoder)两阶段分离的多阶段推理采样方案,解决国产化平台强化学习高吞吐采样情况下的效率干扰问题,训练效率提升10%。

服务高性能部署优化算法:通过模型轻量化压缩,完成国产机器的单机大EP并行部署,推理性能相比星火X1.5提升50%。

结语:行业高专业场景需求凸显,大模型解决方案逐渐成熟

此次科大讯飞星火X2及其多个行业大模型升级,是面向关键行业落地的实用化升级,其面向教育、医疗、汽车、智能体等高专业性、高体验性场景的升级,或意味着,可以为行业刚需问题提供可行的技术方案。

从长远和产业发展的宏观视角来看,如何让大模型深度嵌入千行百业,切实解决行业痛点、赋能业务流程,才是决定其真正价值与发展潜力的核心命题。科大讯飞此前的技术积累以及与产业客户的结合,或称为率先兑现AI红利的关键。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
海外推特已夸爆,冯骥都吓一跳,“庆幸Seedance是中国的AI”

海外推特已夸爆,冯骥都吓一跳,“庆幸Seedance是中国的AI”

观察者网
2026-02-10 13:08:17
1-2惜败,莱巴金娜赛后4字评价郑钦文,中国一姐下站比赛揭晓

1-2惜败,莱巴金娜赛后4字评价郑钦文,中国一姐下站比赛揭晓

大秦壁虎白话体育
2026-02-12 07:19:52
刘芳菲身高174,王治郅214,虽然身高差距悬殊,但是刘芳菲真不低

刘芳菲身高174,王治郅214,虽然身高差距悬殊,但是刘芳菲真不低

科学发掘
2026-02-12 00:41:34
商务部回应加拿大油菜籽问题:将在规则框架内充分考虑加方合理诉求

商务部回应加拿大油菜籽问题:将在规则框架内充分考虑加方合理诉求

澎湃新闻
2026-02-12 15:56:26
1958年,张国焘请求中央给予他补助,毛主席同意,但提出一个条件

1958年,张国焘请求中央给予他补助,毛主席同意,但提出一个条件

帝哥说史
2026-01-17 06:40:03
眼镜妹为何是花探系列里面人气第一女主?敬业并把工作当爱好

眼镜妹为何是花探系列里面人气第一女主?敬业并把工作当爱好

挪威森林
2026-02-11 12:09:26
卡戴珊&汉密尔顿?达妹换新欢?范宁的富商男友来头不小

卡戴珊&汉密尔顿?达妹换新欢?范宁的富商男友来头不小

喜欢历史的阿繁
2026-02-12 09:36:13
美国记者惊呼:中国已成全球顶流!美国青年正经历中国化转变?

美国记者惊呼:中国已成全球顶流!美国青年正经历中国化转变?

百科密码
2026-02-11 16:09:07
廉子文谈犯规被取消成绩:对手下来打了我一下,我跟他说了对不起

廉子文谈犯规被取消成绩:对手下来打了我一下,我跟他说了对不起

澎湃新闻
2026-02-12 10:01:45
世界杯梦碎?33岁日本队长被担架抬下+掩面落泪 重伤后仍起身防守

世界杯梦碎?33岁日本队长被担架抬下+掩面落泪 重伤后仍起身防守

我爱英超
2026-02-12 06:16:35
去掉滤镜后,秦海璐太秃然,殷桃像隔壁大婶子,宋祖英差点没认出

去掉滤镜后,秦海璐太秃然,殷桃像隔壁大婶子,宋祖英差点没认出

法老不说教
2026-02-11 21:14:46
2026春节最"旺"生肖TOP3:马上有钱、虎虎生威、龙光焕发!

2026春节最"旺"生肖TOP3:马上有钱、虎虎生威、龙光焕发!

星缘生肖
2026-02-12 15:18:00
曼联夏窗头号目标遭遇耻辱,22分钟被换下!曝曼城1亿抢安德森

曼联夏窗头号目标遭遇耻辱,22分钟被换下!曝曼城1亿抢安德森

罗米的曼联博客
2026-02-12 09:44:29
教过很多孩子,回头看才敢告诉你:小学差的,到初中大概率还是差

教过很多孩子,回头看才敢告诉你:小学差的,到初中大概率还是差

好爸育儿
2026-02-11 20:45:27
3个亿砸给一个网红,换来14年牢饭,这个富二代到底哪儿疯了?

3个亿砸给一个网红,换来14年牢饭,这个富二代到底哪儿疯了?

流云随风去远方
2026-01-25 08:49:43
最新!最全!浙江春节假期天气来了!冲顶!降温!中到大雨!

最新!最全!浙江春节假期天气来了!冲顶!降温!中到大雨!

浙江天气
2026-02-12 11:41:39
国防部强硬表态:警告美国高机动火箭系统企图部署澎湖和东引岛

国防部强硬表态:警告美国高机动火箭系统企图部署澎湖和东引岛

百态人间
2026-02-12 15:21:36
不到24小时,巴拿马果然扛不住了!可以还港口,却有一个前提条件

不到24小时,巴拿马果然扛不住了!可以还港口,却有一个前提条件

科学发掘
2026-02-11 11:26:53
触目惊心!麻雀数量暴跌90%,中国人不吃它,为啥快见不到了?

触目惊心!麻雀数量暴跌90%,中国人不吃它,为啥快见不到了?

老特有话说
2026-02-04 23:42:16
东方卫视播出!46集谍战剧来袭,谍战教父打响潜伏之战!

东方卫视播出!46集谍战剧来袭,谍战教父打响潜伏之战!

乐枫电影
2026-02-12 14:26:35
2026-02-12 16:32:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11222文章数 116968关注度
往期回顾 全部

科技要闻

10倍速的一夜:三大模型春节前的暗战

头条要闻

王莉霞被"双开":曾是"救火队长" 不到49岁就任副省长

头条要闻

王莉霞被"双开":曾是"救火队长" 不到49岁就任副省长

体育要闻

31岁首次参加冬奥,10年前她是个水管工

娱乐要闻

体操运动员坠楼涉事教练被立案调查

财经要闻

“影子万科”如何掘金万科?

汽车要闻

宝马全球大召回 起火隐患涉及多款热门车型

态度原创

手机
艺术
数码
亲子
教育

手机要闻

史诗级更新!iPhone18 Pro首发C2基带,苹果终于告别高通

艺术要闻

这幅草书14个字,您能认全吗?颜柳欧赵品析,唯钟欧体气节

数码要闻

颜值性能双巅峰!蓝宝石NITRO+氮动极光RX 9070 XT显卡

亲子要闻

媳妇说丈母娘要来,老公联合闺女睡地板,媳妇懵了

教育要闻

志愿填报行业“大洗牌”!当信息差消失,我们凭什么让家长买单?

无障碍浏览 进入关怀版