网易首页 > 网易号 > 正文 申请入驻

印奇挂帅后,阶跃星辰最强开源模型登场!六大国产AI芯片已适配

0
分享至


智东西
作者 王涵
编辑 心缘

智东西2月2日报道,今日,阶跃星辰Step 3.5 Flash开源并上线,该模型在Agent场景和数学任务上能力逼近闭源模型,能够胜任复杂、长链条任务,是阶跃星辰迄今最强的开源基座模型


▲Step 3.5 Flash开源页面(来源:Hugging Face)

就在上周,阶跃星辰宣布由旷视科技联合创始人、千里科技董事长印奇正式出任董事长,并完成华勤、腾讯等参投的超50亿元B+轮融资。这也是印奇履新后,阶跃星辰在开源模型领域的首个大动作。

在智能密度对比图中可以看出,Step 3.5 Flash以约200B的参数量,取得了81.0的分数,在所有模型中智能密度最高。在单请求代码类任务中,Step 3.5 Flash的推理速度最高可达到350TPS。


▲智能密度对比图

Step 3.5 Flash采用稀疏MoE架构,每个token仅激活约110亿个参数(总计1960亿参数),在保证模型能力的同时提升推理效率。

包括华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥在内的多家芯片厂商,已率先完成对Step 3.5 Flash的适配。

开源地址:

GitHub:

https://github.com/stepfun-ai/Step-3.5-Flash/tree/main

Hugging Face:

https://huggingface.co/stepfun-ai/Step-3.5-Flash

一、性能全面逼近闭源大模型,最高推理速度达350TPS

在基准测试成绩上,推理能力方面,Step 3.5 Flash在AIME 2025、IMOAnswerBench、HMMT 2025等数学竞赛级任务中分别取得了97.3、88.8、96.2的分数,均排名第二,Step 3.5 Flash开启Parallel Thinking后的增强性能排名第一

在编码能力上,Step 3.5 Flash在LiveCodeBench-V6测试中得分86.4,排名第三,开启Parallel Thinking后,其仅次于Gemini 3.0 Pro。

在智能Agent能力上,Step 3.5 Flash在BrowseComp测试中得分69.0,仅次于kimi K2.5;在xbench-DeepSearch测试得分54.0,仅次于GPT-5.2 xhigh


▲基准测试成绩

该模型采用稀疏混合专家(MoE)架构,总参数量达1960亿,单个token仅需激活约110亿参数

针对长文本处理场景,Step 3.5 Flash三路多Token预测(MTP-3)技术,Step 3.5 Flash在典型使用场景中实现了每秒100-300个token的生成吞吐量,在单请求代码类任务中峰值可达350TPS

在长上下文任务中,模型仅聚焦关键信息区域,降低冗余计算开销,可支撑256K长度的长文本理解与生成。

据官方介绍,Step 3.5 Flash专为智能体任务构建,集成了可扩展的强化学习框架以实现持续的自我改进。

该模型通过采用3:1滑动窗口注意力(SWA)比例,即每层全注意力层配以三层SWA层。这种混合方法确保模型在处理海量数据或长代码库时性能稳定,同时降低了标准长上下文模型通常所需的计算开销

针对可访问性优化,Step 3.5 Flash可以在高端消费级硬件,如Mac Studio M4 Max、NVIDIA DGX Spark等上安全运行,确保数据私密性的同时不牺牲性能。

二、几秒算出等差数列,还能一句话搭建可视化平台

智东西第一时间上手体验,首先数学方面,我们先考考Step 3.5 Flash一个把很多大模型都难倒了的问题:9.9和9.11谁大?Step 3.5 Flash几乎立刻就给出了思考过程和正确答案,但是在回答中出现了将9.9误输出为99.9的错误。


▲9.9和9.11比大小

那再复杂一些的数学题呢?阶跃星辰官方给出案例,Step 3.5 Flash可以快速计算复杂数学题并输出正确答案。

Prompt:请在不使用外部工具的情况下,依次计算并列出以下等差数列的和:从第1项开始,首项为100,公差为-3的前50项和;1³+2³+…+10³的和;1!+2!+3!+4!+5!的和;2^10+3^5的和;√144+∛125+⁴√16的和。

▲快速计算复杂数学题

在智能体编程方面,Step 3.5 Flash可以基于一段文字prompt自动编程输出可视化平台结果。

我们让Step 3.5 Flash生成一个模拟海浪平台,可以看到,其生成的可视化平台可以调节海浪的频率和形态,还可以调整摄像头的位置,生成效果基本符合要求。

▲生成模拟海浪平台

官方给出了一个生成气象情报仪表盘的例子:

Prompt:气象情报仪表盘——一款受飞行驾驶舱启发的三维地球可视化平台,专为高密度数据环境设计。其搭载的定制WebGL 2.0引擎,可实时处理超过15000个动态节点及WebSocket遥测数据流。

生成结果显示,Step 3.5 Flash展现出了构建低延迟数据管道与高性能地理空间可视化系统的能力

▲生成气象情报仪表盘

Step 3.5 Flash也原生支持多智能体架构,其中一个主智能体通过自主规划和动态路由来协调复杂任务。

这个分层框架会派遣专门的“搜索”和“验证”智能体,通过并行工具调用循环来处理信息检索和事实核查。为确保精确性,一个“总结”智能体会将每个子智能体的执行轨迹整合为结构化反馈,使主智能体能够综合生成最终连贯的响应。


▲多智能体深度研究

Step 3.5 Flash还可以端云结合,简化本地端执行流程。例如,用户提出对比Mac Mini M4在各平台的价格。

Step 3.5 Flash作为“云端大脑”,将这一复杂需求拆解为针对淘宝、京东和拼多多的具体子任务。随后Step 3.5 Flash汇总结果,识别出拼多多为最低价平台,并提供购买指南。

这种云端规划显著降低了本地Step-GUI的执行难度,使其在从各应用抓取实时数据时获得更高成功率。

▲对比Mac Mini M4在各平台的价格

结语:Agent能力成为新战场

无论是阶跃星辰Step 3.5 Flash的开源,还是此前月之暗面Kimi K2.5的发布,都指向了Agent的能力,阶跃星辰官方还透露已经开启Step 4模型的训练,同样是Agent基础模型。

Agent要求模型具备深度的逻辑推理、任务拆解、规划执行和工具调用能力,对模型“大脑”的性能要求更高。

模型大脑的技术迭代加速了AI技术的实用化进程,或将催生更强大的生产力工具,并可能围绕智能体形成新的竞争格局。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
36年前陈宝国主演的盗墓恐怖片!尺度大到少儿不宜

36年前陈宝国主演的盗墓恐怖片!尺度大到少儿不宜

释凡电影
2025-08-14 09:33:19
安徽一男子参加公司年会,先后抽中10万元彩票和苹果17ProMax,公司人士:纯运气,无暗箱操作

安徽一男子参加公司年会,先后抽中10万元彩票和苹果17ProMax,公司人士:纯运气,无暗箱操作

极目新闻
2026-02-01 13:10:29
毛雷尔:徐彬的攻防有欧洲球员的潜质,见到他第一天就很喜欢

毛雷尔:徐彬的攻防有欧洲球员的潜质,见到他第一天就很喜欢

懂球帝
2026-02-02 22:06:12
A股:已经接近尾声了!明天(2月3日)的市场会这样走

A股:已经接近尾声了!明天(2月3日)的市场会这样走

风风顺
2026-02-03 02:00:03
男人切记:搞定女人的“千古定律”,只有一条,屡试不爽!

男人切记:搞定女人的“千古定律”,只有一条,屡试不爽!

云端小院
2026-01-31 08:59:12
一丹麦航运公司将暂时接管长和巴拿马港口运营权,外交部回应

一丹麦航运公司将暂时接管长和巴拿马港口运营权,外交部回应

澎湃新闻
2026-02-02 15:59:10
马斯克彻底搞定大圆柱电池!发布五年终落地,独家专利破解量产难题

马斯克彻底搞定大圆柱电池!发布五年终落地,独家专利破解量产难题

车东西
2026-02-02 18:52:55
广东一高中生体育课上心跳骤停,抢救20天后苏醒,医生提醒:感冒、发烧后别觉得“扛一扛就好”

广东一高中生体育课上心跳骤停,抢救20天后苏醒,医生提醒:感冒、发烧后别觉得“扛一扛就好”

环球网资讯
2026-02-02 16:40:07
金价暴跌!做好准备,黄金大风暴马上就到,谁都躲不开

金价暴跌!做好准备,黄金大风暴马上就到,谁都躲不开

户外钓鱼哥阿旱
2026-02-02 15:54:50
1-2!2-0!U17国足大爆冷,掀翻亚洲杯冠军,冲击世界杯稳了?

1-2!2-0!U17国足大爆冷,掀翻亚洲杯冠军,冲击世界杯稳了?

兰亭墨未干
2026-02-03 01:50:19
30岁男子如厕时猝死,妻子回忆事发前5天,那些被掩盖的生命求救信号

30岁男子如厕时猝死,妻子回忆事发前5天,那些被掩盖的生命求救信号

红星新闻
2026-02-01 23:06:17
今天起,上海人别开窗!这波影响已到!

今天起,上海人别开窗!这波影响已到!

上海约饭局
2026-02-02 20:10:55
英媒:访华后,斯塔默谈中国基建等领域行动速度,称“英国太慢了”

英媒:访华后,斯塔默谈中国基建等领域行动速度,称“英国太慢了”

环球网资讯
2026-02-02 17:27:12
得分能力相当不错,可惜活塞后场新星还是很难争取到出场时间?

得分能力相当不错,可惜活塞后场新星还是很难争取到出场时间?

稻谷与小麦
2026-02-03 01:14:56
个人增值税起征点提高至1000元

个人增值税起征点提高至1000元

南方都市报
2026-02-02 07:05:17
“全面拆迁”来了?2026年住建部已明确,这两类房子或将统通拆迁

“全面拆迁”来了?2026年住建部已明确,这两类房子或将统通拆迁

趣文说娱
2026-01-31 19:23:15
领导是如何看待不卑不亢下属的?网友:太监遇到完整男人的感觉

领导是如何看待不卑不亢下属的?网友:太监遇到完整男人的感觉

带你感受人间冷暖
2026-02-01 06:20:47
袁惟仁去世,抢救照曝光,晚年生活凄凉,曾出轨校花前妻记恨多年

袁惟仁去世,抢救照曝光,晚年生活凄凉,曾出轨校花前妻记恨多年

李健政观察
2026-02-02 20:47:13
2026福布斯中国富豪榜大洗牌:4人上桌、3人下桌,雷军让人太意外

2026福布斯中国富豪榜大洗牌:4人上桌、3人下桌,雷军让人太意外

以茶带书
2026-02-02 17:04:45
悲催!深圳又一大厂倒闭,足额支付工资,按N+1标准支付经济补偿

悲催!深圳又一大厂倒闭,足额支付工资,按N+1标准支付经济补偿

火山诗话
2026-02-02 07:08:07
2026-02-03 03:11:00
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11167文章数 116947关注度
往期回顾 全部

科技要闻

阿里筑墙,腾讯寄生,字节偷家

头条要闻

周生生足金挂坠戴1天被刮花 检测后发现含铁、银、钯

头条要闻

周生生足金挂坠戴1天被刮花 检测后发现含铁、银、钯

体育要闻

澳网男单决赛,属于阿尔卡拉斯的加冕仪式

娱乐要闻

57岁音乐人袁惟仁去世,家属发文悼念

财经要闻

金银暴跌 全球股市遭遇“黑色星期一”

汽车要闻

雷克萨斯LC500将于今年底停产 "最美雷克萨斯"谢幕

态度原创

家居
游戏
教育
健康
公开课

家居要闻

现代几何彩拼 智焕童梦居

涨价后没人买了!Xbox在日本崩盘:年销仅3万台

教育要闻

俞敏洪说“一大半老师不合格”?别急着骂,先听他说完

耳石症分类型,症状大不同

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版