网易首页 > 网易号 > 正文 申请入驻

印奇挂帅后,阶跃星辰最强开源模型登场!六大国产AI芯片已适配

0
分享至

来源:市场资讯

(来源:智东西)


智东西

作者 王涵

编辑 心缘

智东西2月2日报道,今日,阶跃星辰Step 3.5 Flash开源并上线,该模型在Agent场景和数学任务上能力逼近闭源模型,能够胜任复杂、长链条任务,是阶跃星辰迄今最强的开源基座模型。


▲Step 3.5 Flash开源页面(来源:Hugging Face)

就在上周,阶跃星辰宣布由旷视科技联合创始人、千里科技董事长印奇正式出任董事长,并完成华勤、腾讯等参投的超50亿元B+轮融资。这也是印奇履新后,阶跃星辰在开源模型领域的首个大动作。

在智能密度对比图中可以看出,Step 3.5 Flash以约200B的参数量,取得了81.0的分数,在所有模型中智能密度最高。在单请求代码类任务中,Step 3.5 Flash的推理速度最高可达到350TPS。


▲智能密度对比图

Step 3.5 Flash采用稀疏MoE架构,每个token仅激活约110亿个参数(总计1960亿参数),在保证模型能力的同时提升推理效率。

包括华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥在内的多家芯片厂商,已率先完成对Step 3.5 Flash的适配。

开源地址:

GitHub:

https://github.com/stepfun-ai/Step-3.5-Flash/tree/main

Hugging Face:

https://huggingface.co/stepfun-ai/Step-3.5-Flash

一、性能全面逼近闭源大模型,最高推理速度达350TPS

在基准测试成绩上,推理能力方面,Step 3.5 Flash在AIME 2025、IMOAnswerBench、HMMT 2025等数学竞赛级任务中分别取得了97.3、88.8、96.2的分数,均排名第二,Step 3.5 Flash开启Parallel Thinking后的增强性能排名第一。

在编码能力上,Step 3.5 Flash在LiveCodeBench-V6测试中得分86.4,排名第三,开启Parallel Thinking后,其仅次于Gemini 3.0 Pro。

在智能Agent能力上,Step 3.5 Flash在BrowseComp测试中得分69.0,仅次于kimi K2.5;在xbench-DeepSearch测试得分54.0,仅次于GPT-5.2 xhigh。


▲基准测试成绩

该模型采用稀疏混合专家(MoE)架构,总参数量达1960亿,单个token仅需激活约110亿参数。

针对长文本处理场景,Step 3.5 Flash三路多Token预测(MTP-3)技术,Step 3.5 Flash在典型使用场景中实现了每秒100-300个token的生成吞吐量,在单请求代码类任务中峰值可达350TPS。

在长上下文任务中,模型仅聚焦关键信息区域,降低冗余计算开销,可支撑256K长度的长文本理解与生成。

据官方介绍,Step 3.5 Flash专为智能体任务构建,集成了可扩展的强化学习框架以实现持续的自我改进。

该模型通过采用3:1滑动窗口注意力(SWA)比例,即每层全注意力层配以三层SWA层。这种混合方法确保模型在处理海量数据或长代码库时性能稳定,同时降低了标准长上下文模型通常所需的计算开销。

针对可访问性优化,Step 3.5 Flash可以在高端消费级硬件,如Mac Studio M4 Max、NVIDIA DGX Spark等上安全运行,确保数据私密性的同时不牺牲性能。

二、几秒算出等差数列,还能一句话搭建可视化平台

智东西第一时间上手体验,首先数学方面,我们先考考Step 3.5 Flash一个把很多大模型都难倒了的问题:9.9和9.11谁大?Step 3.5 Flash几乎立刻就给出了思考过程和正确答案,但是在回答中出现了将9.9误输出为99.9的错误。


▲9.9和9.11比大小

那再复杂一些的数学题呢?阶跃星辰官方给出案例,Step 3.5 Flash可以快速计算复杂数学题并输出正确答案。

Prompt:请在不使用外部工具的情况下,依次计算并列出以下等差数列的和:从第1项开始,首项为100,公差为-3的前50项和;1³+2³+…+10³的和;1!+2!+3!+4!+5!的和;2^10+3^5的和;√144+∛125+⁴√16的和。

▲快速计算复杂数学题

在智能体编程方面,Step 3.5 Flash可以基于一段文字prompt自动编程输出可视化平台结果。

我们让Step 3.5 Flash生成一个模拟海浪平台,可以看到,其生成的可视化平台可以调节海浪的频率和形态,还可以调整摄像头的位置,生成效果基本符合要求。

▲生成模拟海浪平台

官方给出了一个生成气象情报仪表盘的例子:

Prompt:气象情报仪表盘——一款受飞行驾驶舱启发的三维地球可视化平台,专为高密度数据环境设计。其搭载的定制WebGL 2.0引擎,可实时处理超过15000个动态节点及WebSocket遥测数据流。

生成结果显示,Step 3.5 Flash展现出了构建低延迟数据管道与高性能地理空间可视化系统的能力。

▲生成气象情报仪表盘

Step 3.5 Flash也原生支持多智能体架构,其中一个主智能体通过自主规划和动态路由来协调复杂任务。

这个分层框架会派遣专门的“搜索”和“验证”智能体,通过并行工具调用循环来处理信息检索和事实核查。为确保精确性,一个“总结”智能体会将每个子智能体的执行轨迹整合为结构化反馈,使主智能体能够综合生成最终连贯的响应。


▲多智能体深度研究

Step 3.5 Flash还可以端云结合,简化本地端执行流程。例如,用户提出对比Mac Mini M4在各平台的价格。

Step 3.5 Flash作为“云端大脑”,将这一复杂需求拆解为针对淘宝、京东和拼多多的具体子任务。随后Step 3.5 Flash汇总结果,识别出拼多多为最低价平台,并提供购买指南。

这种云端规划显著降低了本地Step-GUI的执行难度,使其在从各应用抓取实时数据时获得更高成功率。

▲对比Mac Mini M4在各平台的价格

结语:Agent能力成为新战场

无论是阶跃星辰Step 3.5 Flash的开源,还是此前月之暗面Kimi K2.5的发布,都指向了Agent的能力,阶跃星辰官方还透露已经开启Step 4模型的训练,同样是Agent基础模型。

Agent要求模型具备深度的逻辑推理、任务拆解、规划执行和工具调用能力,对模型“大脑”的性能要求更高。

模型大脑的技术迭代加速了AI技术的实用化进程,或将催生更强大的生产力工具,并可能围绕智能体形成新的竞争格局。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
你什么状元我什么状元!华子胖虎关键时刻表现根本不在一个级别!

你什么状元我什么状元!华子胖虎关键时刻表现根本不在一个级别!

田先生篮球
2026-02-07 12:25:57
85年我去相亲,丈母娘让我和大姐睡一屋,那晚我目睹了难忘一幕

85年我去相亲,丈母娘让我和大姐睡一屋,那晚我目睹了难忘一幕

奶茶麦子
2026-02-07 17:06:25
22投狂砍48分11助!超级外援向全联盟正式摊牌,王博争冠再添法宝

22投狂砍48分11助!超级外援向全联盟正式摊牌,王博争冠再添法宝

老叶评球
2026-02-08 09:36:11
5年前,他靠核酸检测设备2年狂入222亿,扬言活120岁,如今咋样

5年前,他靠核酸检测设备2年狂入222亿,扬言活120岁,如今咋样

芳芳历史烩
2026-01-25 10:06:32
哈佛跟踪32年发现扎心真相:你能活多久,很大程度取决于你老婆!

哈佛跟踪32年发现扎心真相:你能活多久,很大程度取决于你老婆!

徐德文科学频道
2026-02-06 21:31:27
善恶终有报!88岁瘫坐在轮椅上的谢贤,已活成了一个“笑话”

善恶终有报!88岁瘫坐在轮椅上的谢贤,已活成了一个“笑话”

人间无味啊
2026-01-14 19:49:15
中国崛起,三场对美博弈彻底终结霸权

中国崛起,三场对美博弈彻底终结霸权

小莜读史
2026-02-08 10:29:29
大快人心!乌情报总局官宣:俄军战犯佐托夫被击毙,血债终须血偿

大快人心!乌情报总局官宣:俄军战犯佐托夫被击毙,血债终须血偿

老马拉车莫少装
2026-02-03 23:23:30
假房假妻假儿女,他布局4年骗走香港明星4亿巨款,至今下落不明

假房假妻假儿女,他布局4年骗走香港明星4亿巨款,至今下落不明

不似少年游
2026-02-07 09:33:17
蓝正龙曾爆料:吴佩慈就是所有男生都想踹她的那种女生

蓝正龙曾爆料:吴佩慈就是所有男生都想踹她的那种女生

追影客栈
2026-02-05 17:08:07
为什么全国人民都在拒接电话?连10086打来也是瞄一眼就挂掉了!

为什么全国人民都在拒接电话?连10086打来也是瞄一眼就挂掉了!

今朝牛马
2026-01-08 16:05:10
冰心为什么讨厌林徽因?网友:最可恨的是,林的主业还不是文学

冰心为什么讨厌林徽因?网友:最可恨的是,林的主业还不是文学

夜深爱杂谈
2026-02-05 18:04:39
惊艳世界波!亚马尔25米石破天惊,巴萨大胜:又一18岁天才归来

惊艳世界波!亚马尔25米石破天惊,巴萨大胜:又一18岁天才归来

话体坛
2026-02-08 02:14:23
警告!队歌≠圣旨,应景≠认证!请停止吃央妈的流量!

警告!队歌≠圣旨,应景≠认证!请停止吃央妈的流量!

狗哥是一名内拉
2026-02-07 23:36:36
超雄真的有那么可怕吗?网友的分享,一看一个不吱声

超雄真的有那么可怕吗?网友的分享,一看一个不吱声

另子维爱读史
2026-02-01 20:30:29
带状疱疹为何今年特别多?医生调查:这6类人最容易中招

带状疱疹为何今年特别多?医生调查:这6类人最容易中招

荆医生科普
2026-02-07 15:18:31
美媒:埃及求购歼20谈判有新进展,单价1亿美元?

美媒:埃及求购歼20谈判有新进展,单价1亿美元?

兵国大事
2026-02-07 18:11:44
外卖“碰一下开门”服务已覆盖全国200多城 免登记为城市骑士单均节省1分钟

外卖“碰一下开门”服务已覆盖全国200多城 免登记为城市骑士单均节省1分钟

封面新闻
2026-02-07 16:43:03
1992年,刘强东680分考中国人大,1994年,伍继红692分考中国人大

1992年,刘强东680分考中国人大,1994年,伍继红692分考中国人大

南权先生
2026-02-03 15:52:30
蔬菜水稻大片枯死!河道水体“清而不洁”影响农业生产,3名市人大代表发声

蔬菜水稻大片枯死!河道水体“清而不洁”影响农业生产,3名市人大代表发声

新民晚报
2026-02-06 16:13:03
2026-02-08 11:35:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2142556文章数 5395关注度
往期回顾 全部

科技要闻

欧盟认定存在"上瘾"设计 TikTok:结论错误

头条要闻

媒体:特朗普发奥巴马视频 美国"欣赏"该视频的人不少

头条要闻

媒体:特朗普发奥巴马视频 美国"欣赏"该视频的人不少

体育要闻

铜牌与苏翊鸣的这四年,他说:我对得起自己

娱乐要闻

金晨处罚结果曝光!肇事逃逸被罚款

财经要闻

金银震荡144小时 大爷大妈排队「抄底」

汽车要闻

工信部公告落地 全新腾势Z9GT焕新升级

态度原创

手机
亲子
艺术
游戏
公开课

手机要闻

苹果iOS 26被吐槽的不只是动画,还有这些不统一的交互细节

亲子要闻

外婆为了让宝宝穿罩衣拿舅舅现场示范

艺术要闻

10秒内认全狂草的人只有1%,你敢挑战吗?

《宣誓》PS5版容量与售价公布!2月17日正式解锁

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版