网易首页 > 网易号 > 正文 申请入驻

首发“快思考、慢思考统一模型”,讯飞星火X1提供高效低门槛方案

0
分享至

4月20日,科大讯飞深度推理大模型——讯飞星火X1迎来全新升级。作为当前业界唯一基于全国产算力训练的深度推理大模型,升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上效果显著提升,在模型参数比业界同类模型小一个数量级的情况下,整体效果对标OpenAI o1和DeepSeek R1,再次证明了基于国产算力训练的全栈自主可控大模型具备登顶业界最高水平的实力和持续创新的潜力。

星火X1除了在常见通用任务取得显著进步之外,由于融入了更多场景复杂类型数据,模型的泛化性也取得了进步,多个行业任务上展现出了业界领先的能力。在重点行业如教育、医疗、司法等进一步扩大了领先优势。

面向企业和广大开发者,讯飞星火X1首发“快思考、慢思考统一模型”,全新升级模型定制优化工具链,进一步降低大模型私有化部署和定制门槛;同时,讯飞星火X1 API已上线讯飞开放平台开放服务,作为首个支持全国产算力微调的推理大模型,讯飞星辰MaaS平台同步上线了星火X1微调服务。

讯飞星火X1全面升级,通用能力比肩国际顶尖模型水平

升级后的星火X1在多个任务上效果继续突破,展现出优异的性能。根据最新测试集评测结果,星火X1在通用任务效果评测中全面对标OpenAI o1和DeepSeek R1,在数学、知识问答等方面表现突出。

※测试集合来源:自建测试集主要来自真实的大模型请求任务数据,来源分布包括讯飞星火APP、星火大模型API、业界主流任务数据等;公开测试集主要以数学、答题、推理、代码等外部典型测试集为主。

数学答题和复杂的数理逻辑推理方面,星火X1能够准确识别出复杂的数学公式,不仅给出完整的解题思路,输出结果也严谨清晰;在逻辑推理时全方位思考,思考可能出现的每一种假设,表现出更强的严谨性和准确性。代码能力上,星火X1不仅提高了代码生成的准确率,对生成代码逻辑理解也进一步提升,能够应对更复杂的编程需求,思考问题的多种可能性,帮助开发者快速实现功能。在语言理解方面,模型输出内容、格式更加符合用户指令要求,能够给到更加准确且深度思考的结果,生成内容更加连贯、准确。

此外,星火X1的长思维链能力支持图像输入,可以对输入的图像进行关联思考,对于图像中的多种复杂元素,探究可能的含义和目的,进行更深层次的信息整合和推理。

多个行业任务业界领先,讯飞星火X1部署更简便,定制门槛更低

本次星火X1升级不仅提升了通用能力,也同步增强了面向行业的解决方案能力,助力产业智能化转型。由于融入了更多场景复杂类型数据,模型的泛化性也取得了进步,多个行业任务上展现出了业界领先的能力。在重点行业,如教育、医疗、司法等进一步扩大了领先优势。以司法行业为例,对于行业专业需求,例如根据材料总结案件事实以及判决理由,升级后的星火X1能够精准把握用户指令,详细分析争议点,快速定位关键信息,并输出准确内容,为行业用户提供专业、可靠的智能支持。

※测试集合来源:真实场景测试集。

值得一提的是,全新升级的讯飞星火X1在行业实际应用中具有显著优势。

在技术创新和模型部署方面,星火X1首发“快思考、慢思考统一模型”,由一个模型同时支持两种思考模式,提升了模型处理不同复杂度任务的能力,满血版星火X1仅需4张卡(华为910B)即可部署,简化了私有化部署流程。

同时,星火X1还全新升级了模型定制优化工具链,支持SFT(监督微调)、强化学习两种模型定制优化方案,只需16张卡(华为910B)即可完成行业定制优化,有效降低了企业AI的定制门槛,使各行业能更便捷地落地AI应用价值。

三大核心技术突破,国产AI迈向自主可控新阶段

讯飞星火X1的全新升级背后,是一系列独特的技术创新与理念突破。

首先,提出基于问题难度的大规模多阶段强化学习方法,在复杂推理、数学、代码、语言理解等场景全面提升模型效果及泛化性;同时提出强化学习动态更新算法,基于样本采样长度动态调整强化学习更新速度,进一步提升深度思考强化学习效率及效果。

其次,统一模型下的快慢思考混合训练方法,充分发挥快慢思考数据相互促进作用,实现基于系统指令控制模型是否深度思考,支撑下游更高效便捷地部署使用;

第三,实现多项工程技术创新,显存动态卸载技术大幅提升长文本推理并发、训推共卡协同实现高效训推资源转换、推理引擎冬眠机制实现快速拉起和恢复,实现国产算力平台上高效和稳定的强化学习训练全流程。

在中美科技竞争日趋激烈的背景下,星火X1选择的全国产化技术路径更具深远意义。最近,科大讯飞与华为昇腾联合团队在前期工作基础上再获突破,升级MoE模型的PD分离+大规模专家并行系统方案,实现了集群推理性能翻番,包括PD分离部署提升20%+性能、MTP多token预测技术提升30%+整体性能、专家负载均衡算法优化使集群吞吐提升30%+,以及异步双发射技术降低服务请求调度耗时提升10%系统性能。坚定自主可控算法创新和系统工程创新,使得基于国产算力的星火大模型能够快速迭代进步,在实际应用场景取得显著效能优势,在当前国际形势下也更具战略韧性。

此次讯飞星火X1的全面升级,不仅展示了中国人工智能技术在国产算力平台上的创新突破,也为各行各业数字化转型提供了新的可能。作为基于国产算力训练的大模型代表作,星火X1的表现证明,在技术自主可控的道路上,中国AI已具备与国际顶尖模型同台竞技的实力。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
官宣!辽足名宿之子,18岁1米9前锋,离开辽宁铁人,加盟伯恩利

官宣!辽足名宿之子,18岁1米9前锋,离开辽宁铁人,加盟伯恩利

小金体坛大视野
2026-02-25 15:02:59
平顶山事件升级!被打女孩伤情鉴定出炉,家属明确表示只关心刑责

平顶山事件升级!被打女孩伤情鉴定出炉,家属明确表示只关心刑责

火山詩话
2026-02-24 17:11:44
伊朗外长:希望在最短时间内与美国达成公平协议

伊朗外长:希望在最短时间内与美国达成公平协议

每日经济新闻
2026-02-25 07:26:59
中国军舰已奔赴伊朗?要访华的特朗普,余下攻打伊朗的时间不多了

中国军舰已奔赴伊朗?要访华的特朗普,余下攻打伊朗的时间不多了

现代小青青慕慕
2026-02-25 11:35:25
“00后”陈某某被押赴刑场 执行死刑

“00后”陈某某被押赴刑场 执行死刑

闪电新闻
2026-02-07 16:53:35
小卧室不要再放“双人床”了,学年轻人的做法,美观又实用!

小卧室不要再放“双人床”了,学年轻人的做法,美观又实用!

室内设计师有料儿
2026-02-24 21:03:27
前脚帮美害华为,后脚港口送印度,伊朗还敢要钱?中方忍无可忍!

前脚帮美害华为,后脚港口送印度,伊朗还敢要钱?中方忍无可忍!

闻识
2026-02-25 19:04:26
韩红减了四十斤,53岁的她确实帅气很多,网友:姐更慈祥了!

韩红减了四十斤,53岁的她确实帅气很多,网友:姐更慈祥了!

陈意小可爱
2026-02-23 18:40:18
甘肃省城乡发展投资集团有限公司原董事长陈策被“双开”

甘肃省城乡发展投资集团有限公司原董事长陈策被“双开”

界面新闻
2026-02-25 15:59:30
今晚首播!40集年代大剧来袭,主演阵容强大,这剧收视要爆

今晚首播!40集年代大剧来袭,主演阵容强大,这剧收视要爆

小椰的奶奶
2026-02-25 17:24:44
打伊朗前,美国找到中国,特朗普知道:他错一步,中国就不战而胜

打伊朗前,美国找到中国,特朗普知道:他错一步,中国就不战而胜

王姐懒人家常菜
2026-02-24 20:10:45
母亲是短跑强国的黑人,父亲是中国人,混血球员朱正现状如何?

母亲是短跑强国的黑人,父亲是中国人,混血球员朱正现状如何?

窥史
2026-02-25 15:49:11
12岁孩子千元红包掉在服务区,被一男子迅速捡走,车身摄像头拍下全程,家属报警

12岁孩子千元红包掉在服务区,被一男子迅速捡走,车身摄像头拍下全程,家属报警

环球网资讯
2026-02-25 14:49:46
68岁赵本山蹲炕头吃酸菜炖鹅,那双掉漆筷子比好多人朋友圈还真实

68岁赵本山蹲炕头吃酸菜炖鹅,那双掉漆筷子比好多人朋友圈还真实

喜欢历史的阿繁
2026-02-17 23:12:52
张冬云任四川省副省长

张冬云任四川省副省长

极目新闻
2026-02-25 15:51:38
中国重建供销社,不是经济倒退,而是一心帮老百姓脱贫

中国重建供销社,不是经济倒退,而是一心帮老百姓脱贫

Hi科普啦
2026-02-24 14:50:33
朱珠回天津婆家过年,干休所探望100岁奶奶,小珠宝长得真像太奶

朱珠回天津婆家过年,干休所探望100岁奶奶,小珠宝长得真像太奶

科学发掘
2026-02-23 18:37:37
韩国教授:汉朝前中国一直归属韩国统治,外国网友评论出奇一致

韩国教授:汉朝前中国一直归属韩国统治,外国网友评论出奇一致

谈史论天地
2026-02-24 12:51:25
落槌!全部划归国资!追随许家印6年,江苏第一包工头赔得精光

落槌!全部划归国资!追随许家印6年,江苏第一包工头赔得精光

凡知
2026-02-24 12:16:24
我嫁全村最穷懒汉,新婚夜刚要打地铺,他开口:转穷17年终于等到你

我嫁全村最穷懒汉,新婚夜刚要打地铺,他开口:转穷17年终于等到你

奶茶麦子
2026-02-25 11:05:22
2026-02-25 20:15:03
天方燕谈
天方燕谈
互联网科技和媒体的行业观察
948文章数 3796关注度
往期回顾 全部

科技要闻

“机器人只跳舞,没什么用”

头条要闻

新房被淹男子12年未交物业费 春节前后家中停水超50天

头条要闻

新房被淹男子12年未交物业费 春节前后家中停水超50天

体育要闻

曝雄鹿计划今夏追小卡 字母哥渴望与其并肩作战

娱乐要闻

撒贝宁到沈阳跑亲戚 老婆李白模特身材

财经要闻

上海楼市放大招,地产预期别太大

汽车要闻

750km超长续航 2026款小鹏X9纯电版将于3月2日上市

态度原创

旅游
手机
亲子
家居
公开课

旅游要闻

马年首艘国际访问港邮轮抵沪 外籍旅客比例超95%

手机要闻

消息称魅族手机业务已经实质性停摆,追觅曾谈判收购

亲子要闻

总想把世界上最好的都给你 但却发现世界上最好的就是你!

家居要闻

艺居办公 温度与效率

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版