网易首页 > 网易科技 > 网易科技 > 正文

阶跃星辰姜大昕:Step 3是推理时代最适合应用的模型

0
分享至
目前,华为昇腾芯片已首先实现Step 3的搭载和运行。沐曦、天数智芯和燧原科技等也已初步实现运行Step 3。其它联盟厂商的适配工作正在开展。

7月25日消息,在2025世界人工智能大会前夕,阶跃星辰在上海发布了新一代基础大模型——Step 3。据介绍,作为阶跃的主力基座模型,Step 3兼顾智能与效率,旨在面向推理时代打造最适合应用的模型。Step 3将于7月31日面向全球企业和开发者开源,为开源世界贡献最强多模态推理模型。

同时,阶跃星辰还宣布联合多家国内领先的芯片、平台厂商发起成立“模芯生态创新联盟”,将通过推动模型和芯片产业链联合创新,加速大模型应用的落地。此外,阶跃星辰与上海国有资本投资有限公司达成深度战略合作,将围绕加强资本链接、生态业务合作等方面进行全面的深度合作。

现场,阶跃星辰创始人、CEO姜大昕表示:“从Step 1到Step 2两代基模的快速迭代,促使我们深入思考什么才是最适合应用的模型。随着大模型进入到强化学习发展阶段,新一代推理模型成为主流,模型性能的提升固然显著,但这是否完全等同于模型价值?面对这一产业之问,我们必须回归客户需求,立足真实应用场景,探索模型创新落地的可行路径。这是我们研发新一代Step 3基础模型的出发点。”

具体来看,新一代基模 Step 3号称是推理时代最适合应用的模型。阶跃星辰提出,最适合实际应用的大模型需要满足强智能、低成本、可开源和多模态四个特征。唯有模型全面发展,才能让模型真正用起来。

首先,不妥协的性能,Step 3是阶跃星辰首个全尺寸、原生多模态推理模型,兼顾模型效果与推理成本,是在模型架构创新、算法工程协同设计上的一次大胆尝试与Scale Up。Step 3采用 MoE 架构,总参数量321B,激活参数量38B。

与此同时,Step 3拥有强大的视觉感知和复杂推理能力,可准确完成跨领域的复杂知识理解、数学与视觉信息的交叉分析,以及日常生活中的各类视觉分析问题。Step 3在MMMU、MathVision、SimpleVQA、AIME 2025、LiveCodeBench (2024.08-2025.05) 等榜单上取得了开源多模态推理模型的SOTA成绩。

其次,极致成本,据介绍,在确保性能的前提下,阶跃星辰持续推进模型成本优化。目前,主流开源模型虽然针对解码进行了大量优化,但其优化方案主要适配国际高端芯片,在中端及国产芯片上的解码效率仍有提升空间。

据了解,在架构设计阶段,Step 3便充分考量系统与硬件的特性,实现广泛硬件平台上的高效推理。根据原理分析,Step 3在国产芯片上的推理效率最高可达DeepSeek-R1的300%,且对所有芯片友好。在基于 NVIDIA Hopper 架构的芯片进行分布式推理时,实测Step 3相较于 DeepSeek-R1的吞吐量提升超70%。这些都是在不牺牲激活参数量、不降低注意力容量的条件下实现的。这些结果充分验证了 Step 3具备广泛的普适性,在多种硬件环境下部署,均能显著地降低推理成本。

据悉,阶跃星辰宣布联合近10家芯片及基础设施厂商,共同发起“模芯生态创新联盟”。该联盟的首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等。目前,华为昇腾芯片已首先实现Step 3的搭载和运行。沐曦、天数智芯和燧原科技等也已初步实现运行Step 3。其它联盟厂商的适配工作正在开展。

资料显示,阶跃星辰战略性聚焦智能终端Agent的方向,重点布局汽车、手机、IoT设备等关键应用场景。

相关推荐
热点推荐
“肮脏的中国人”骂声中20岁小伙被打进医院,西西里发生仇恨袭击

“肮脏的中国人”骂声中20岁小伙被打进医院,西西里发生仇恨袭击

意大利华人网0039
2025-12-17 00:12:41
中方精准反制后,高市回应2句话,当着14国的面,傅聪发出通牒

中方精准反制后,高市回应2句话,当着14国的面,傅聪发出通牒

南宫一二
2025-12-17 07:16:03
官宣!2025式警服正式列装!9大升级戳中基层痛点,经费反降2.36%

官宣!2025式警服正式列装!9大升级戳中基层痛点,经费反降2.36%

娱乐八卦木木子
2025-12-16 11:51:07
410次开房记录流出:央企“女老虎”陶荔芳,背后还有多少同伙

410次开房记录流出:央企“女老虎”陶荔芳,背后还有多少同伙

深度报
2025-12-14 22:36:54
上海独身女子去世,留下的遗产被收走,还不能好好地用在自己身上

上海独身女子去世,留下的遗产被收走,还不能好好地用在自己身上

巴城的城
2025-12-17 00:26:26
你见过最清闲的事业编是啥?网友:还有一个供销社,闲出病来

你见过最清闲的事业编是啥?网友:还有一个供销社,闲出病来

带你感受人间冷暖
2025-12-16 00:20:09
央企“最牛女副处长”落马:两年与上司开房410次,细节曝光

央企“最牛女副处长”落马:两年与上司开房410次,细节曝光

西门老爹
2025-12-16 15:35:31
泰军炸掉诈骗园区、器官移植中心,洪森为何气急败坏?

泰军炸掉诈骗园区、器官移植中心,洪森为何气急败坏?

胡严乱语
2025-12-16 20:33:51
第一批免签去俄罗斯的中产傻眼了

第一批免签去俄罗斯的中产傻眼了

风向观察
2025-12-16 18:26:08
1950年,一名韩国维修工撞死美第8集团军司令,李承晚:枪毙司机

1950年,一名韩国维修工撞死美第8集团军司令,李承晚:枪毙司机

鹤羽说个事
2025-12-16 15:09:55
特斯拉发文:一味堆电池只会增加车重,一些车100度电池续航也没超过Model 3

特斯拉发文:一味堆电池只会增加车重,一些车100度电池续航也没超过Model 3

金融界
2025-12-16 16:52:45
特朗普称认定委内瑞拉现政府是“外国恐怖组织”

特朗普称认定委内瑞拉现政府是“外国恐怖组织”

极目新闻
2025-12-17 08:39:22
净亏4000万!西媒:利物浦愿以1.1亿欧元将维尔茨卖给皇马

净亏4000万!西媒:利物浦愿以1.1亿欧元将维尔茨卖给皇马

球事百科吖
2025-12-17 05:43:03
火箭输球太冤!战掘金裁判报告出炉:加时三次错漏判都是火箭吃亏

火箭输球太冤!战掘金裁判报告出炉:加时三次错漏判都是火箭吃亏

罗说NBA
2025-12-17 06:52:03
陈慧琳演唱会穿三角裤衩,五十多了合适吗?人老心不老

陈慧琳演唱会穿三角裤衩,五十多了合适吗?人老心不老

蕾爸退休日记
2025-12-16 22:37:37
从十月销量,看奇瑞的“吹牛”方法论

从十月销量,看奇瑞的“吹牛”方法论

AutoBusiness
2025-11-14 15:10:05
印度防务网站刊文:印军在“辛杜尔行动”击杀314km外巴基斯坦预警机

印度防务网站刊文:印军在“辛杜尔行动”击杀314km外巴基斯坦预警机

不掉线电波
2025-12-17 10:24:40
二手房全线下跌!贝壳挂牌量高达650万套房子,房子太多太多了

二手房全线下跌!贝壳挂牌量高达650万套房子,房子太多太多了

小星球探索
2025-12-16 12:53:59
阿萨德与乌克兰前总统是邻居,准备重操旧业?

阿萨德与乌克兰前总统是邻居,准备重操旧业?

新民周刊
2025-12-17 09:06:50
“每天回家我都想吐!”整整3年,因顶楼住户一个操作,广东一小区整栋楼业主直呼“苦不堪言”,多方最新回应

“每天回家我都想吐!”整整3年,因顶楼住户一个操作,广东一小区整栋楼业主直呼“苦不堪言”,多方最新回应

环球网资讯
2025-12-17 07:32:29
2025-12-17 11:20:49

科技要闻

无人驾驶迈关键一步 特斯拉股价触历史新高

头条要闻

牛弹琴:特朗普下狠手BBC面临生死存亡 英国人急坏了

头条要闻

牛弹琴:特朗普下狠手BBC面临生死存亡 英国人急坏了

体育要闻

短短一年,从争冠到0胜垫底...

娱乐要闻

鞠婧祎收入曝光,丝芭称已支付1.3亿

财经要闻

"祥源系"爆雷 有投资者数百万元无法提现

汽车要闻

一车多动力+双姿态 长城欧拉5上市 限时9.18万元起

态度原创

家居
手机
亲子
房产
游戏

家居要闻

温馨独栋 驼色与浅色碰撞

手机要闻

消息称小米17 Ultra徕卡特别版手机启用双品牌

亲子要闻

城市长大的女孩更容易早熟,发育“抢跑”或致大脑结构改变

房产要闻

6.66亿摘地,海南封关大动作,千亩海澄新城震撼登场

《天国:拯救2》团队:我们需要高度投入的核心玩家

无障碍浏览 进入关怀版
×