网易首页 > 网易号 > 正文 申请入驻

多个领域突破!科大讯飞深度推理大模型讯飞星火X1全新升级

0
分享至

4月20日,科大讯飞深度推理大模型——讯飞星火X1迎来全新升级。作为当前业界唯一基于全国产算力训练的深度推理大模型,升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上效果显著提升,在模型参数比业界同类模型小一个数量级的情况下,整体效果对标OpenAI o1和DeepSeek R1,再次证明了基于国产算力训练的全栈自主可控大模型具备登顶业界最高水平的实力和持续创新的潜力。

星火X1除了在常见通用任务取得显著进步之外,由于融入了更多场景复杂类型数据,模型的泛化性也取得了进步,多个行业任务上展现出了业界领先的能力。在重点行业如教育、医疗、司法等进一步扩大了领先优势。

面向企业和广大开发者,讯飞星火X1首发“快思考、慢思考统一模型”,全新升级模型定制优化工具链,进一步降低大模型私有化部署和定制门槛;同时,讯飞星火X1 API已上线讯飞开放平台开放服务,作为首个支持全国产算力微调的推理大模型,讯飞星辰MaaS平台同步上线了星火X1微调服务。

讯飞星火X1全面升级,通用能力比肩国际顶尖模型水平

升级后的星火X1在多个任务上效果继续突破,展现出优异的性能。根据最新测试集评测结果,星火X1在通用任务效果评测中全面对标OpenAI o1和DeepSeek R1,在数学、知识问答等方面表现突出。

※测试集合来源:自建测试集主要来自真实的大模型请求任务数据,来源分布包括讯飞星火APP、星火大模型API、业界主流任务数据等;公开测试集主要以数学、答题、推理、代码等外部典型测试集为主。

数学答题和复杂的数理逻辑推理方面,星火X1能够准确识别出复杂的数学公式,不仅给出完整的解题思路,输出结果也严谨清晰;在逻辑推理时全方位思考,思考可能出现的每一种假设,表现出更强的严谨性和准确性。代码能力上,星火X1不仅提高了代码生成的准确率,对生成代码逻辑理解也进一步提升,能够应对更复杂的编程需求,思考问题的多种可能性,帮助开发者快速实现功能。在语言理解方面,模型输出内容、格式更加符合用户指令要求,能够给到更加准确且深度思考的结果,生成内容更加连贯、准确。

此外,星火X1的长思维链能力支持图像输入,可以对输入的图像进行关联思考,对于图像中的多种复杂元素,探究可能的含义和目的,进行更深层次的信息整合和推理。

多个行业任务业界领先,讯飞星火X1部署更简便,定制门槛更低

本次星火X1升级不仅提升了通用能力,也同步增强了面向行业的解决方案能力,助力产业智能化转型。由于融入了更多场景复杂类型数据,模型的泛化性也取得了进步,多个行业任务上展现出了业界领先的能力。在重点行业,如教育、医疗、司法等进一步扩大了领先优势。以司法行业为例,对于行业专业需求,例如根据材料总结案件事实以及判决理由,升级后的星火X1能够精准把握用户指令,详细分析争议点,快速定位关键信息,并输出准确内容,为行业用户提供专业、可靠的智能支持。

※测试集合来源:真实场景测试集。

值得一提的是,全新升级的讯飞星火X1在行业实际应用中具有显著优势。

在技术创新和模型部署方面,星火X1首发“快思考、慢思考统一模型”,由一个模型同时支持两种思考模式,提升了模型处理不同复杂度任务的能力,满血版星火X1仅需4张卡(华为910B)即可部署,简化了私有化部署流程。

同时,星火X1还全新升级了模型定制优化工具链,支持SFT(监督微调)、强化学习两种模型定制优化方案,只需16张卡(华为910B)即可完成行业定制优化,有效降低了企业AI的定制门槛,使各行业能更便捷地落地AI应用价值。

三大核心技术突破,国产AI迈向自主可控新阶段

讯飞星火X1的全新升级背后,是一系列独特的技术创新与理念突破。

首先,提出基于问题难度的大规模多阶段强化学习方法,在复杂推理、数学、代码、语言理解等场景全面提升模型效果及泛化性;同时提出强化学习动态更新算法,基于样本采样长度动态调整强化学习更新速度,进一步提升深度思考强化学习效率及效果。

其次,统一模型下的快慢思考混合训练方法,充分发挥快慢思考数据相互促进作用,实现基于系统指令控制模型是否深度思考,支撑下游更高效便捷地部署使用;

第三,实现多项工程技术创新,显存动态卸载技术大幅提升长文本推理并发、训推共卡协同实现高效训推资源转换、推理引擎冬眠机制实现快速拉起和恢复,实现国产算力平台上高效和稳定的强化学习训练全流程。

在中美科技竞争日趋激烈的背景下,星火X1选择的全国产化技术路径更具深远意义。最近,科大讯飞与华为昇腾联合团队在前期工作基础上再获突破,升级MoE模型的PD分离+大规模专家并行系统方案,实现了集群推理性能翻番,包括PD分离部署提升20%+性能、MTP多token预测技术提升30%+整体性能、专家负载均衡算法优化使集群吞吐提升30%+,以及异步双发射技术降低服务请求调度耗时提升10%系统性能。坚定自主可控算法创新和系统工程创新,使得基于国产算力的星火大模型能够快速迭代进步,在实际应用场景取得显著效能优势,在当前国际形势下也更具战略韧性。

此次讯飞星火X1的全面升级,不仅展示了中国人工智能技术在国产算力平台上的创新突破,也为各行各业数字化转型提供了新的可能。作为基于国产算力训练的大模型代表作,星火X1的表现证明,在技术自主可控的道路上,中国AI已具备与国际顶尖模型同台竞技的实力。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
4.2万股民嗨了:锂电池龙头“603026”,又爆了!

4.2万股民嗨了:锂电池龙头“603026”,又爆了!

看财经show
2026-03-26 17:17:48
李金羽:邦本打替补纯是战术考量,我们很坦诚但外界过分解读

李金羽:邦本打替补纯是战术考量,我们很坦诚但外界过分解读

懂球帝
2026-03-26 21:28:17
伊朗挂断王毅电话后发全球照会,萨勒曼震怒

伊朗挂断王毅电话后发全球照会,萨勒曼震怒

空间展示知识
2026-03-26 07:06:58
中方拒收道歉,日本自卫官被转移,小泉进次郎24小时后发声

中方拒收道歉,日本自卫官被转移,小泉进次郎24小时后发声

究竟谁主沉浮
2026-03-27 02:50:14
迟迟等不到中企复工,巴拿马强援出山!已正式介入?中方要警惕

迟迟等不到中企复工,巴拿马强援出山!已正式介入?中方要警惕

小冠说娱
2026-03-25 22:54:52
“勾引”女人最狠的一招:主动戳中她这3个崩溃的秘密

“勾引”女人最狠的一招:主动戳中她这3个崩溃的秘密

娱乐洞察点点
2026-03-27 00:09:32
广东:力争到2026年底 建成50个以上特色鲜明、功能突出的生产性服务业集聚区

广东:力争到2026年底 建成50个以上特色鲜明、功能突出的生产性服务业集聚区

财联社
2026-03-26 10:15:09
德转列世预赛附加赛球队身价排行:意大利8.39亿欧居首

德转列世预赛附加赛球队身价排行:意大利8.39亿欧居首

懂球帝
2026-03-26 15:59:41
尴尬 22岁夏思凝社媒晒性感视频 网友留言:吴艳妮我好爱你,真的

尴尬 22岁夏思凝社媒晒性感视频 网友留言:吴艳妮我好爱你,真的

风过乡
2026-03-25 10:56:58
越扒越有!张雪峰去世早有预兆,他的3个不良爱好,或成催命符

越扒越有!张雪峰去世早有预兆,他的3个不良爱好,或成催命符

潮鹿逐梦
2026-03-26 11:24:44
我在西藏旅游,一个喇嘛见我后突然跪下:活佛,我们等了您百年

我在西藏旅游,一个喇嘛见我后突然跪下:活佛,我们等了您百年

千秋文化
2026-01-29 21:35:02
曝张雪峰去年3月已立遗嘱,遗产由女儿单独继承,他真的很爱女儿

曝张雪峰去年3月已立遗嘱,遗产由女儿单独继承,他真的很爱女儿

观鱼听雨
2026-03-26 10:43:02
演员朱珠疑似塌房?照片流出,惊呆网友!

演员朱珠疑似塌房?照片流出,惊呆网友!

大眼妹妹
2025-12-15 10:39:19
1965年,毛主席点名让彭德怀复出,背后有人拼命阻挠,这人后来判了18年

1965年,毛主席点名让彭德怀复出,背后有人拼命阻挠,这人后来判了18年

史海孤雁
2026-03-25 18:31:11
太心酸了!42岁著名女歌手江苏走穴,宾客只顾吃席没人搭理

太心酸了!42岁著名女歌手江苏走穴,宾客只顾吃席没人搭理

小徐讲八卦
2026-02-12 12:13:20
吃“人血馒头”?以为能蹭张雪峰热度,没成想自己先被扒个底朝天

吃“人血馒头”?以为能蹭张雪峰热度,没成想自己先被扒个底朝天

麦芽是个小趴菜
2026-03-27 01:41:01
3.73-1.79!国足传来好消息,2-1爆冷世界杯鱼腩队?比赛时间如下

3.73-1.79!国足传来好消息,2-1爆冷世界杯鱼腩队?比赛时间如下

侃球熊弟
2026-03-26 21:09:11
罕见!97岁老人头顶长出4厘米恶臭树桩 五年前曾做手术仍复发

罕见!97岁老人头顶长出4厘米恶臭树桩 五年前曾做手术仍复发

快科技
2026-03-25 09:53:08
全线控四轮转向+超级智能体!智己LS8开启预售,25.98万起

全线控四轮转向+超级智能体!智己LS8开启预售,25.98万起

汽车消费网
2026-03-26 23:09:34
致命围堵!7500人强攻哈尔克岛计划曝光,伊朗的生死线要被掐断了

致命围堵!7500人强攻哈尔克岛计划曝光,伊朗的生死线要被掐断了

闻香阁
2026-03-25 22:07:27
2026-03-27 03:44:49
互联网那些事 incentive-icons
互联网那些事
深挖品牌故事,探寻商业逻辑
1957文章数 6058关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

家居
健康
游戏
艺术
军事航空

家居要闻

傍海而居 静观蝴蝶海

转头就晕的耳石症,能开车上班吗?

PS1大IP游戏藏私货!成人手绘与盗版马里奥ROM塞满

艺术要闻

北京大兴机场和青岛胶东机场“撞脸”,长得像就是抄袭?

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版