网易首页 > 网易号 > 正文 申请入驻

印奇挂帅后,阶跃星辰最强开源模型登场!六大AI芯片已适配

0
分享至



智东西

作者 | 王涵

编辑 | 心缘

智东西2月2日报道,今日,阶跃星辰Step 3.5 Flash开源并上线,该模型在Agent场景和数学任务上能力逼近闭源模型,能够胜任复杂、长链条任务,是阶跃星辰迄今最强的开源基座模型



Step 3.5 Flash开源页面(来源:Hugging Face)

就在上周,阶跃星辰宣布由旷视科技联合创始人、千里科技董事长印奇正式出任董事长,并完成华勤、腾讯等参投的超50亿元B+轮融资。这也是印奇履新后,阶跃星辰在开源模型领域的首个大动作。

在智能密度对比图中可以看出,Step 3.5 Flash以约200B的参数量,取得了81.0的分数,在所有模型中智能密度最高。在单请求代码类任务中,Step 3.5 Flash的推理速度最高可达到350TPS。



智能密度对比图

Step 3.5 Flash采用稀疏MoE架构,每个token仅激活约110亿个参数(总计1960亿参数),在保证模型能力的同时提升推理效率。

包括华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥在内的多家芯片厂商,已率先完成对Step 3.5 Flash的适配。

开源地址:

GitHub:

https://github.com/stepfun-ai/Step-3.5-Flash/tree/main

Hugging Face:

https://huggingface.co/stepfun-ai/Step-3.5-Flash

一、性能全面逼近闭源大模型,最高推理速度达350TPS

在基准测试成绩上,推理能力方面,Step 3.5 Flash在AIME 2025、IMOAnswerBench、HMMT 2025等数学竞赛级任务中分别取得了97.3、88.8、96.2的分数,均排名第二,Step 3.5 Flash开启Parallel Thinking后的增强性能排名第一

在编码能力上,Step 3.5 Flash在LiveCodeBench-V6测试中得分86.4,排名第三,开启Parallel Thinking后,其仅次于Gemini 3.0 Pro。

在智能Agent能力上,Step 3.5 Flash在BrowseComp测试中得分69.0,仅次于kimi K2.5;在xbench-DeepSearch测试得分54.0,仅次于GPT-5.2 xhigh



基准测试成绩

该模型采用稀疏混合专家(MoE)架构,总参数量达1960亿,单个token仅需激活约110亿参数

针对长文本处理场景,Step 3.5 Flash三路多Token预测(MTP-3)技术,Step 3.5 Flash在典型使用场景中实现了每秒100-300个token的生成吞吐量,在单请求代码类任务中峰值可达350TPS

在长上下文任务中,模型仅聚焦关键信息区域,降低冗余计算开销,可支撑256K长度的长文本理解与生成。

据官方介绍,Step 3.5 Flash专为智能体任务构建,集成了可扩展的强化学习框架以实现持续的自我改进。

该模型通过采用3:1滑动窗口注意力(SWA)比例,即每层全注意力层配以三层SWA层。这种混合方法确保模型在处理海量数据或长代码库时性能稳定,同时降低了标准长上下文模型通常所需的计算开销

针对可访问性优化,Step 3.5 Flash可以在高端消费级硬件,如Mac Studio M4 Max、NVIDIA DGX Spark等上安全运行,确保数据私密性的同时不牺牲性能。

二、几秒算出等差数列,还能一句话搭建可视化平台

智东西第一时间上手体验,首先数学方面,我们先考考Step 3.5 Flash一个把很多大模型都难倒了的问题:9.9和9.11谁大?Step 3.5 Flash几乎立刻就给出了思考过程和正确答案。

那再复杂一些的数学题呢?阶跃星辰官方给出案例,Step 3.5 Flash可以快速计算复杂数学题并输出正确答案。

Prompt:请在不使用外部工具的情况下,依次计算并列出以下等差数列的和:从第1项开始,首项为100,公差为-3的前50项和;1³+2³+…+10³的和;1!+2!+3!+4!+5!的和;2^10+3^5的和;√144+∛125+⁴√16的和。

快速计算复杂数学题

在智能体编程方面,Step 3.5 Flash可以基于一段文字prompt自动编程输出可视化平台结果。

我们让Step 3.5 Flash生成一个模拟海浪平台,可以看到,其生成的可视化平台可以调节海浪的频率和形态,还可以调整摄像头的位置,生成效果基本符合要求。

生成模拟海浪平台

官方给出了一个生成气象情报仪表盘的例子:

Prompt:气象情报仪表盘——一款受飞行驾驶舱启发的三维地球可视化平台,专为高密度数据环境设计。其搭载的定制WebGL 2.0引擎,可实时处理超过15000个动态节点及WebSocket遥测数据流。

生成结果显示,Step 3.5 Flash展现出了构建低延迟数据管道与高性能地理空间可视化系统的能力

生成气象情报仪表盘

Step 3.5 Flash也原生支持多智能体架构,其中一个主智能体通过自主规划和动态路由来协调复杂任务。

这个分层框架会派遣专门的“搜索”和“验证”智能体,通过并行工具调用循环来处理信息检索和事实核查。为确保精确性,一个“总结”智能体会将每个子智能体的执行轨迹整合为结构化反馈,使主智能体能够综合生成最终连贯的响应。



多智能体深度研究

Step 3.5 Flash还可以端云结合,简化本地端执行流程。例如,用户提出对比Mac Mini M4在各平台的价格。

Step 3.5 Flash作为“云端大脑”,将这一复杂需求拆解为针对淘宝、京东和拼多多的具体子任务。随后Step 3.5 Flash汇总结果,识别出拼多多为最低价平台,并提供购买指南。

这种云端规划显著降低了本地Step-GUI的执行难度,使其在从各应用抓取实时数据时获得更高成功率。

对比Mac Mini M4在各平台的价格

结语:Agent能力成为新战场

无论是阶跃星辰Step 3.5 Flash的开源,还是此前月之暗面Kimi K2.5的发布,都指向了Agent的能力,阶跃星辰官方还透露已经开启Step 4模型的训练,同样是Agent基础模型。

Agent要求模型具备深度的逻辑推理、任务拆解、规划执行和工具调用能力,对模型“大脑”的性能要求更高。

模型大脑的技术迭代加速了AI技术的实用化进程,或将催生更强大的生产力工具,并可能围绕智能体形成新的竞争格局。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
为了郑丽文专机能顺利落地,解放军果断亮出底牌,痛击台独要害

为了郑丽文专机能顺利落地,解放军果断亮出底牌,痛击台独要害

共工之锚
2026-04-08 00:37:29
如果没有扣分,这才是真实的中超积分榜排名

如果没有扣分,这才是真实的中超积分榜排名

足球大腕
2026-04-08 21:53:28
金主爱相关文章被下架

金主爱相关文章被下架

周边问题研究所
2026-04-07 21:35:39
日本要求伊朗尽快放人

日本要求伊朗尽快放人

环球时报国际
2026-04-07 22:35:35
谢娜浪姐的瓜,朋友圈都炸了

谢娜浪姐的瓜,朋友圈都炸了

黎兜兜
2026-04-07 21:19:58
陈光标变现大劳捐千万后续!曝嫣然已退款,原因炸裂,果然有猫腻

陈光标变现大劳捐千万后续!曝嫣然已退款,原因炸裂,果然有猫腻

阿凫爱吐槽
2026-04-08 01:06:52
大学生,谈不动恋爱了

大学生,谈不动恋爱了

果壳
2026-04-07 20:17:46
一场战争彻底把中国打醒!美军作战最毒的是什么?中国用30年看清

一场战争彻底把中国打醒!美军作战最毒的是什么?中国用30年看清

小兰聊历史
2026-04-08 01:20:00
看到了鲁比奥的对华发言,才愕然发现,原来中国已经这么牛了

看到了鲁比奥的对华发言,才愕然发现,原来中国已经这么牛了

娱乐小可爱蛙
2026-04-08 03:05:57
东风导弹泄密案!间谍郭万钧一家三口,全部被处以死刑

东风导弹泄密案!间谍郭万钧一家三口,全部被处以死刑

番外行
2026-03-31 08:28:28
警惕:上了年纪再过性生活,最怕这2点!保护男性精气,做好4点

警惕:上了年纪再过性生活,最怕这2点!保护男性精气,做好4点

周哥一影视
2026-04-08 12:20:15
研究表明:性生活越频繁,射精和勃起问题越少!

研究表明:性生活越频繁,射精和勃起问题越少!

黯泉
2026-04-05 20:40:12
年纪大了,就爱这种软乎乎的美,不扎眼,谁看了都得偷偷多瞅两眼

年纪大了,就爱这种软乎乎的美,不扎眼,谁看了都得偷偷多瞅两眼

飛娱日记
2026-03-26 09:00:26
不打伊朗了?特朗普通告全球,战争费由22国买单,中方亮明态度

不打伊朗了?特朗普通告全球,战争费由22国买单,中方亮明态度

百科密码
2026-04-08 17:03:31
河北三男子营救落水女子四人均遇难,事发地被市民摆满献花,当地多方回应

河北三男子营救落水女子四人均遇难,事发地被市民摆满献花,当地多方回应

潇湘晨报
2026-04-08 17:53:24
5-2逆转澳大利亚,日本3连胜,以小组头名晋级女足亚洲杯八强

5-2逆转澳大利亚,日本3连胜,以小组头名晋级女足亚洲杯八强

侧身凌空斩
2026-04-08 18:55:20
万斯在布达佩斯发表重磅演讲,国际关系将发生苏联解体以来最大变化

万斯在布达佩斯发表重磅演讲,国际关系将发生苏联解体以来最大变化

码头青年
2026-04-08 15:06:20
张水华新代言彻底黄了!全网视频紧急删除,网友:早有预兆

张水华新代言彻底黄了!全网视频紧急删除,网友:早有预兆

马拉松跑步健身
2026-04-07 20:20:26
俄罗斯摄影师为出片将一只老象全身涂成粉色,3个月后大象死亡,摄影师被骂惨...

俄罗斯摄影师为出片将一只老象全身涂成粉色,3个月后大象死亡,摄影师被骂惨...

英国那些事儿
2026-04-07 23:21:59
“地方附加税”呼之欲出,预计收税规模达万亿!

“地方附加税”呼之欲出,预计收税规模达万亿!

黯泉
2026-04-08 15:01:10
2026-04-08 23:35:00
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11534文章数 117025关注度
往期回顾 全部

科技要闻

造出地表最强AI,却死活不给你用!

头条要闻

无法说话、四肢瘫痪女孩误购演唱会门票 申请退票遭拒

头条要闻

无法说话、四肢瘫痪女孩误购演唱会门票 申请退票遭拒

体育要闻

40岁,但实力倒退12年

娱乐要闻

侯佩岑全家悉尼度假,一家四口幸福满溢

财经要闻

天津海河乳业回应直播间涉黄

汽车要闻

20万级满配华为全家桶 华境S是懂家庭的大六座

态度原创

游戏
健康
艺术
亲子
公开课

《极限竞速:地平线6》试玩报告:带点刻板印象的东京漂移"/> 主站 商城 论坛 自运营 登录 注册 《极限竞速:地平线6》试玩报告:带点刻板印象的东京漂...

干细胞抗衰4大误区,90%的人都中招

艺术要闻

齐白石『凌波仙子』

亲子要闻

胡图图说他差几分就能兑换发卡

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版