网易首页 > 网易号 > 正文 申请入驻

科大讯飞发布星火X2大模型:基于全国产算力训练

0
分享至

IT之家 2 月 11 日消息,据科大讯飞官方微信公众号消息,今天该公司发布了基于全国产算力训练的星火 X2 大模型。

据介绍,从 X1.5 到 X2,升级有两大亮点:

1、通用能力全面升级,星火 X2 整体能力对标国际顶尖模型水平,在数学、推理、语言理解、智能体等能力上媲美国际最优;130+ 多语言综合能力继续提升,拉美、东盟等地区重点语种效果保持业界领先水平。

2、依托星火 X2 的算法突破、行业高质量数据集以及专业思维链的强化学习,星火行业大模型持续升级,产品应用方案取得显著进步。

官方称,星火 X2 在实现通用能力全面升级的同时,更加专注于教育、医疗、汽车、智能体等高专业性、高体验性场景,致力于为这些领域提供领先、可靠的技术方案与支撑。

  • 赋能医疗,专业能力持续提升并保持业界领先,个人健康助手各项能力在业界率先通过权威评测验证,“讯飞晓医”App 全面升级;
  • 赋能教育,步骤级批改、错因定位等技术进一步扩大全球领先优势,业界首发错因贯穿的个性化学习能力,让启发式讲解更契合学生思路,推动 AI 学习机等产品实现更精准的自主学习闭环,进一步提升孩子学习兴趣与学习效率;
  • 面向汽车智能座舱的星火中小尺寸模型同步升级,智能交互实车评测行业全面领先,模糊意图效果从完全不可用达到基本好用,让汽车像老朋友聊天一样精准听懂你的“潜台词”;
  • 星辰 Agent 平台全新升级,进一步强化了“会思考能执行”的精品智能体构建能力。智能体数量已经超过 130 万,作为企业级智能体平台,在复杂行业场景任务上进一步解决用户关键刚需。

即日起,星火 X2 的最新能力可直接在讯飞星火网页版和 App 体验,全新 API 也已上线讯飞开放平台,持续解放生产力;星火 App 5.2.0 新版本同步上线,进一步强化了 AI 助手。

IT之家附官方详细介绍如下:

此次星火 X2 通用能力全面升级,整体能力对标国际顶尖模型水平,在数学、推理、语言理解、智能体等能力上媲美国际最优;同时,星火 X2 的 130+ 多语言综合能力继续提升,拉美、东盟等地区重点语种效果保持业界领先水平,为跨语言教育、医疗与产业应用提供可靠支撑。

星火 X2 通过量化单台昇腾服务器即可运行。星火 X2 采用 293B MoE 稀疏架构,结合权重量化、低精度 KVCache、VTP(Virtual Tensor Parallel)、分层通信等多种工程化创新,实现了国产大 EP 并行部署,推理性能相比 X1.5 提升 50%。

星火大模型多尺寸中小模型同步升级,在办公本、翻译机、汽车座舱交互等场景的核心效果显著提升。

通用大模型核心能力效果对比:


外部公开高难任务效果对比:


* 测试集合来源:基础能力测试集(滚动刷新),来自海量真实大模型请求任务脱敏数据,包括讯飞星火 APP、API 真实开发者场景、以及教育、医疗等行业核心任务。公开测试集以数学、答题、推理、代码、智能体等外部典型 Benchmarks 为主。

还是用一道题来试试效果:



这是 2025 年 11 月哈佛-麻省理工数学锦标赛(HMMT)里的一道英文题目,难倒国内主流模型,但星火 X2 在分析思考后,不仅给出了正确答案,还给出了详尽的解题过程✅。

再来看看星火 X2 能不能解答西班牙语数学题:



依旧是快速给出详细解题过程以及正确答案 ~

星火 X2 能力的显著升级离不开技术的持续创新突破,典型工作包括:

训推采样校准强化学习算法

针对 MoE 大模型 RL 训练中的训推分布不一致问题,提出训练与推理概率重采样自适应校准算法,大幅提升强化学习训练准确率和稳定性。

递归式高难数据合成方法

针对高难任务数据稀缺问题,设计多轮迭代式推导的数据合成方案,实现推理错误逐步纠正与收敛,持续构建稀缺型高质量数据,提升模型深度推理准确率。

多阶段 RL 高吞吐采样方法

设计 P/D(Prefill / Decoder)两阶段分离的多阶段推理采样方案,解决国产化平台强化学习高吞吐采样情况下的效率干扰问题,训练效率提升 10%。

服务高性能部署优化算法

通过模型轻量化压缩,完成国产机器的单机大 EP 并行部署,推理性能相比星火 X1.5 提升 50%,实现大模型在国产平台的轻量化落地与高效推理双重突破。

实用性是检验大模型能力的硬标准。依托星火 X2 的算法突破、行业高质量数据集以及专业思维链的强化学习,星火行业大模型持续升级,在教育、医疗、司法、汽车交互、企业智能体应用等关键场景表现一新,在功能和效果层面实现全面升级,“更懂你的 AI”再进一步。

赋能医疗,各项能力持续保持显著领先

星火 X2 底座赋能医疗,助力星火医疗大模型核心能力全面提升并持续保持业界领先。基于居民健康档案的智能健康分析、智能报告解读、运动饮食建议、辅助诊疗、智能用药审核等关键任务上,模型能力均显著超越 DeepSeek V3.2、GPT-5.2 和 Qwen3-Max。


* 测试集合来源:按照《医疗健康行业大模型应用技术要求》,基于脱敏真实用户数据及居民健康档案,构建全新测试集合 MedLLM-EHR-EVAL-V2。

星火医疗大模型围绕个人健康助手的各项能力已率先通过上海市医疗大模型应用检测验证中心评测验证。(备注:上海市医疗大模型应用检测验证中心为国内首个面向医疗大模型应用评测和验证的平台,由上海 AI 实验室牵头打造,华山医院、中山医院、瑞金医院等 12 所医疗机构成为中心首批验证单位。)

在此基础上,“讯飞晓医”App 各项能力全面升级,多轮主动问诊、多轮咨询问答、问用药、检查检验单解读、体检报告单解读等健康咨询任务在业界持续保持显著领先。


* 测试集合来源:测试集合基于线上个人健康咨询的真实场景脱敏数据随机抽样。

另外,讯飞晓医的语音交互对话能力也是本次升级的一个重要特色,欢迎大家体验。

赋能教育,率先实现错因贯穿个性化学习能力

新版本的星火 X2 底座全面赋能教育,步骤级批改、错因定位等技术进一步扩大全球领先优势。结合领先的多学科答题及推理能力,业界率先发布错因贯穿的个性化学习能力。数学步骤级批改效果进一步提升,同时支持更精准的错因定位,在答疑上实现契合学生本人思路的启发式讲解,相关技术持续保持业界领先,并推动应用成效显著提升。


* 测试集合来源:测试集合基于备授课、考试、作业、学习等真实场景脱敏数据随机抽样。

面向学生自主学习场景,科大讯飞 AI 学习机在 1 对 1 精准学、答疑辅导和互动课等效果持续提升。依托更精准的步骤级批改能力,诊断精准率、规划合理率和辅学启发性效果领先行业,实现个性化、启发式、规划性教学,进一步提升孩子学习兴趣与学习效率。


赋能汽车,智能座舱交互系统全面升级

基于星火 X2 升级,在汽车领域,2B、7B、30B-A3 等多尺寸中小模型同步升级,助力汽车智能座舱交互系统全面提升,在人人 / 人机对话判断、模糊意图理解、高情商回复等方面交互体验显著提升。特别是模糊意图交互效果实现跨越式突破,从完全不可用提升至基本好用水平,实车评测业内全面领先,结合星火多模态大模型感知理解能力,真正实现座舱内自由、自然的人机交互体验。


星辰 Agent 平台和精品智能体,效果全新升级

星火 X2 的智能体能力,在长时复杂任务规划、多工具组合调用以及长上下文等方面均实现了显著提升。

星辰 Agent 平台全新升级,进一步强化了“会思考能执行”的精品智能体构建能力。当前智能体数量已经超过 130 万,作为企业级智能体平台,已整合语音交互、语音识别、图像理解等百余种精品开放平台能力,丰富企业级场景应用工具生态,支撑快速构建企业场景中的更复杂、更实用的精品智能体。

面向企业采购场景的招采智能体,在招标文件合规检测、供应商资质核验、投标异常行为检测等核心场景,效率提升超 3 倍。同时,支持企业像搭积木一样极速定制专属招采专家,专用智能体开发从原来的几天压缩至分钟级,助力企业精准风控、高效降本。

面向行业深度分析的星火行业大师产品,针对能源、农粮等行业的专业商情分析领域进行深度融合,结合产业图谱推理和分析,显著降低幻觉。商情信息洞察及辅助决策时间从“周”降低到“天”,为客户快速决策提供及时的技术支撑。

讯飞星火已上线最新的星火 X2,持续打造更懂你的 AI 助手。一键开启语音对话,快速响应你的需求。特别是面向年轻人求职和学习提升需求,本次重点升级了科研助手和求职助手,全流程辅助用户找工作和写论文。

讯飞开放平台已正式上线星火 X2 API。讯飞开放平台新注册开发者可以领取最多 100 万 Tokens 免费额度,让模型能力以更低成本进入真实开发与规模化验证。从模型进化到 API 规模化开放,再到真实场景的持续落地,星火 X2 面向全球超 1000 万开发者共享更强理解力与执行力的深度推理能力。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
有人预测:若不出意外,春节以后,国内将迎来3个变化,很真实!

有人预测:若不出意外,春节以后,国内将迎来3个变化,很真实!

趣味萌宠的日常
2026-02-11 06:19:53
一定要记住:无论走到哪里,都不要话多,也不要和任何人吐露太多

一定要记住:无论走到哪里,都不要话多,也不要和任何人吐露太多

木言观
2026-02-02 09:05:51
出大事了,被俘乌克兰特工终于开口,曝光两大秘密,普京很生气!

出大事了,被俘乌克兰特工终于开口,曝光两大秘密,普京很生气!

东极妙严
2026-02-11 12:52:16
岛内两党争相祝贺高市,郑丽文2句话点出关键,大陆已不用再说啥

岛内两党争相祝贺高市,郑丽文2句话点出关键,大陆已不用再说啥

兵器海陆空视频
2026-02-10 19:25:12
直线拉升!黄金、白银,再度爆发!

直线拉升!黄金、白银,再度爆发!

证券时报
2026-02-11 21:03:07
美国从巅峰滑落,最大的祸首已经出现,不是奥巴马,不是特朗普

美国从巅峰滑落,最大的祸首已经出现,不是奥巴马,不是特朗普

混沌录
2026-02-11 21:41:52
退休夫妇花10万“邮轮养老”:船上住15年,包吃包打扫,环游世界4圈,比房租便宜得多!

退休夫妇花10万“邮轮养老”:船上住15年,包吃包打扫,环游世界4圈,比房租便宜得多!

背包旅行
2026-01-23 10:33:42
福建省委书记、省长率团赴东部战区走访慰问

福建省委书记、省长率团赴东部战区走访慰问

上观新闻
2026-02-11 15:49:05
西安一景区现“旋转真马”,6匹马被固定并反复转圈,遭质疑“虐待动物”;景区回应:速度很慢,已暂停该项目

西安一景区现“旋转真马”,6匹马被固定并反复转圈,遭质疑“虐待动物”;景区回应:速度很慢,已暂停该项目

极目新闻
2026-02-10 20:42:53
吓到了!上海一套88平米的小二房售价达718万,人均工资才1万多啊

吓到了!上海一套88平米的小二房售价达718万,人均工资才1万多啊

火山詩话
2026-02-10 07:14:47
钱再多有啥用?这次,陈数的现状,给所有已婚未育的人提了个醒

钱再多有啥用?这次,陈数的现状,给所有已婚未育的人提了个醒

观察者海风
2026-02-07 22:35:50
主力资金 | 尾盘主力重点抢筹8股

主力资金 | 尾盘主力重点抢筹8股

数据宝
2026-02-11 21:06:49
蒙古国首都骚乱再起,社会矛盾愈发尖锐,反华到底图啥

蒙古国首都骚乱再起,社会矛盾愈发尖锐,反华到底图啥

素衣读史
2026-01-24 17:12:53
TOP14位身高170以上的女神,有颜有灯有演技

TOP14位身高170以上的女神,有颜有灯有演技

素然追光
2026-01-02 02:45:02
山东内线终获补强!琼斯首秀统治防守与篮板,能终结,即战力蓝领

山东内线终获补强!琼斯首秀统治防守与篮板,能终结,即战力蓝领

篮球资讯达人
2026-02-11 21:44:54
正常的乳房到底长什么样?(内附图解)

正常的乳房到底长什么样?(内附图解)

第十一诊室
2026-01-31 11:36:21
郭老终于可以睡个好觉了,央视通报:徐湖平违规拍卖只是冰山一角

郭老终于可以睡个好觉了,央视通报:徐湖平违规拍卖只是冰山一角

王晓爱体彩
2026-02-11 10:54:54
当你接触的人多了,你会明白:如果一个人还在穿5年前的衣服,只说明3个问题

当你接触的人多了,你会明白:如果一个人还在穿5年前的衣服,只说明3个问题

二胡的岁月如歌
2026-01-16 18:51:52
74岁“肥猫”郑则仕回应加入周润发跑团:一年前膝盖痛,医生建议注射药物,师傅周润发让我跑步;此前暴瘦70斤,跑马引热议

74岁“肥猫”郑则仕回应加入周润发跑团:一年前膝盖痛,医生建议注射药物,师傅周润发让我跑步;此前暴瘦70斤,跑马引热议

极目新闻
2026-02-11 11:36:07
王皓家族接力赛:7岁大儿子夺高尔夫冠军,小儿子热爱乒乓追梦偶像

王皓家族接力赛:7岁大儿子夺高尔夫冠军,小儿子热爱乒乓追梦偶像

科学发掘
2026-02-11 18:41:23
2026-02-11 22:28:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
329321文章数 606993关注度
往期回顾 全部

科技要闻

V4来了?DeepSeek 灰度测试新版本

头条要闻

前美国财长顾问:我刚从中国回来 美国没赢

头条要闻

前美国财长顾问:我刚从中国回来 美国没赢

体育要闻

搞垮一个冬奥选手,只需要一首歌?

娱乐要闻

大孤山风波愈演愈烈 超50位明星扎堆

财经要闻

广州前首富被判无期 200亿集资窟窿何偿

汽车要闻

比亚迪最美B级SUV? 宋Ultra这腰线美翻了

态度原创

游戏
房产
亲子
艺术
公开课

曝圣莫尼卡或发布会亮剑!战神续作、科幻新ip二选一

房产要闻

177亿元,砸向超级城更!海南这座城,正式起飞!

亲子要闻

同时拍手挑战,亲子互动游戏

艺术要闻

南京人吵起来了:到底谁才算第一高楼?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版