网易首页 > 网易号 > 正文 申请入驻

从DeepSeek R1的复现看深度思考模型的未来|ML-Summit 2025

0
分享至

备受瞩目的 2025 全球机器学习技术大会(ML Summit 2025)将于 4 月 18-19 日在上海虹桥西郊庄园丽笙大酒店召开。本次盛会由 CSDN & Boolan 联合主办,汇聚了超 50 位来自学术界和工业界顶尖专家,共同探讨智能体、联邦学习、多模态大模型等热门 AI 技术实践。

作为全球机器学习技术大会的老朋友,新浪微博首席科学家及 AI 研发部负责人张俊林将带来《从 DeepSeek R1 的复现看深度思考模型的未来》的精彩分享。

张俊林作为「大模型技术拆解得最通透的实战派」,在 2024 年的机器学习技术大会上,他对 Gemini 多模态架构、OpenAI o1 技术的硬核拆解,让开发者直呼“终于有人讲透技术本质”。

从 DeepSeek R1 复现出发,洞见深度思考模型未来

DeepSeek R1 的开源引发了学术界和工业界对其复现研究的热潮,也为探索更强大的“深度思考”模型提供了新的视角。本次演讲将:

  • 系统梳理技术脉络: 回顾 DeepSeek R1 开源后的各类复现研究,涵盖 SFT 阶段的轻量适配(如 S1)与 RL 阶段的创新实践。

  • 深度解析训练范式: 重点剖析其核心的两阶段训练模式——如何通过冷启动微调结合多领域数据优化进行 SFT,以及如何运用 GRPO 强化学习与全场景对齐实现模型“深度思考”能力的跃迁。

  • 探讨关键技术问题: 尝试解答一系列备受关注的核心问题,例如:强化学习(RL)的 Scaling Law 边界何在?影响 SFT 阶段蒸馏方法效果的关键因素是什么?如何科学地理解和解释 DeepSeek 团队提及的“Aha Moment”现象?

大模型时代,Scaling Law 依旧是核心驱动力。张俊林深入探讨 Grok 3 背后的 Scaling Law 本质,以及对大模型未来发展的启示。他提出,即使 Grok 3 耗费大量算力,仍然遵循预训练阶段增大模型尺寸的“传统”做法,这种做法的性价比值得进一步思考。

此外,张俊林通过用 S 型曲线叠加来解释大模型预训练、后训练以及推理阶段 Scaling Law 的各种现象,引发业界广泛关注。他认为,理解 Scaling Law 的关键在于理解 S 型曲线的叠加。具体可参考张俊林撰写的如下两篇文章,AI 科技大本营均有发表:

对于渴望紧跟大模型前沿、理解深度思考模型核心机制与未来方向的听众而言,张俊林的分享无疑是一场不容错过的知识盛宴。

ML Summit 2025:汇聚全球智慧,共绘 AI 新蓝图

2025 全球机器学习技术大会 (ML Summit 2025) 不仅是技术交流的平台,更是推动 AI 生态融合、促进行业协同创新的重要契机。大会设有 12 大技术专题,覆盖 AI 领域的前沿热点。此外,大会还将设置 AI 企业创新展区,展示最新的技术产品和解决方案。

我们诚挚邀请全球 AI 产业参与者积极加入 ML Summit 2025,共同探索 AI 的未来发展方向,推动 AI 在更广泛的应用场景中落地生根。期待与您在 ML Summit 2025 携手见证 AI 时代的新篇章!

▲2024全球机器学习技术大会展区盛况

我们诚邀全球 AI 产业参与者积极加入,共同捕捉前沿趋势,探索产业升级路径,推动 AI 走向更广阔的应用场景。期待在 ML Summit 2025,与每一位同行者携手见证 AI 时代的新篇章 !

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
贾永婕发文还原大S临终场面吴佩慈目睹抢救过程大S生前已有预感

贾永婕发文还原大S临终场面吴佩慈目睹抢救过程大S生前已有预感

可乐谈情感
2026-02-26 07:46:30
冲上热搜!刘强东回应造游艇:我们家100多年都是船民,当船长是儿时梦想;已接到5条大型游艇订单,每艘平均卖6000万欧元

冲上热搜!刘强东回应造游艇:我们家100多年都是船民,当船长是儿时梦想;已接到5条大型游艇订单,每艘平均卖6000万欧元

每日经济新闻
2026-02-25 19:31:58
荷兰没回头路了!中国子公司宣布:正式换国内供应商,不再合作!

荷兰没回头路了!中国子公司宣布:正式换国内供应商,不再合作!

生活新鲜市
2026-02-25 18:47:22
120抵达40分钟后病人才上救护车,老人抢救无效死亡急救中心被判赔17万余元 急救搬抬如何破局?|红星深度

120抵达40分钟后病人才上救护车,老人抢救无效死亡急救中心被判赔17万余元 急救搬抬如何破局?|红星深度

红星新闻
2026-02-25 21:05:18
187cm已塌房男演员,试图复出无望,结果又有新“瓜”?

187cm已塌房男演员,试图复出无望,结果又有新“瓜”?

有仁有娱
2026-02-24 23:36:53
贾浅浅《开花》被获得全国诗歌一等奖的诗,写出了女性的原始欲

贾浅浅《开花》被获得全国诗歌一等奖的诗,写出了女性的原始欲

读睡
2026-02-20 16:29:43
28岁北京独子王荻娶50岁德国妻子,宁断香火也要成婚,现状太意外

28岁北京独子王荻娶50岁德国妻子,宁断香火也要成婚,现状太意外

谈史论天地
2026-02-25 06:53:06
威尔士公开赛16强出炉附赛程,张安达vs希金斯,8强中国有望占4席

威尔士公开赛16强出炉附赛程,张安达vs希金斯,8强中国有望占4席

小火箭爱体育
2026-02-26 09:05:55
笑喷了!汪大爷能屈能伸,积极配合张兰,小孙孙出生详情曝光

笑喷了!汪大爷能屈能伸,积极配合张兰,小孙孙出生详情曝光

小娱乐悠悠
2026-02-26 08:00:55
人到中年,真的要感谢单位“不重用”之恩!

人到中年,真的要感谢单位“不重用”之恩!

侃故事的阿庆
2026-02-26 10:12:33
皇太极的变态嗜好:把妻子赏给下人,坐月子、儿子为王皆不能幸免

皇太极的变态嗜好:把妻子赏给下人,坐月子、儿子为王皆不能幸免

老谢谈史
2026-02-26 02:06:26
火箭大胜!杜兰特21+4+5,赛后老范抱住德罗赞,小谢接受采访

火箭大胜!杜兰特21+4+5,赛后老范抱住德罗赞,小谢接受采访

担酒
2026-02-26 11:21:36
都说不去日本,春节赴日的却是这群人!日媒暗访揭开真相

都说不去日本,春节赴日的却是这群人!日媒暗访揭开真相

壹知眠羊
2026-02-25 22:18:18
王力宏现身比亚迪深圳坪山总部 副总裁李柯及核心高管亲自接待

王力宏现身比亚迪深圳坪山总部 副总裁李柯及核心高管亲自接待

快科技
2026-02-26 09:45:06
财政压力的下半场:退休人员占比近四成,才是硬账

财政压力的下半场:退休人员占比近四成,才是硬账

超先声
2026-01-09 16:45:39
Tesla特斯拉(春招)招聘公告!

Tesla特斯拉(春招)招聘公告!

实习僧
2026-02-25 14:40:30
长沙市重大项目集中签约开工,总投资额超260亿元

长沙市重大项目集中签约开工,总投资额超260亿元

界面新闻
2026-02-26 09:37:06
果然不简单:中国摁住日本后,又让美国见识了北京的“阳谋”

果然不简单:中国摁住日本后,又让美国见识了北京的“阳谋”

花小猫的美食日常
2026-02-26 06:51:35
越秀236亿跑马场地块定局 谁在为广州顶奢商业买单?

越秀236亿跑马场地块定局 谁在为广州顶奢商业买单?

观点机构
2026-02-26 03:34:10
这个世界上最搞不懂的,就是尼格买提的父母了

这个世界上最搞不懂的,就是尼格买提的父母了

百态人间
2026-02-24 15:44:11
2026-02-26 13:23:00
AI科技大本营 incentive-icons
AI科技大本营
连接AI技术的创造者和使用者
2632文章数 7645关注度
往期回顾 全部

科技要闻

单季营收681亿净利429亿!英伟达再次炸裂

头条要闻

特朗普自诩开启美国"黄金时代" 遭美媒集体"打脸"

头条要闻

特朗普自诩开启美国"黄金时代" 遭美媒集体"打脸"

体育要闻

从排球少女到冰壶女神,她在米兰冬奥练出6块腹肌

娱乐要闻

尼格买提撒贝宁滑雪被偶遇 17年老友情

财经要闻

短剧市场风云突变!有人投百万赔得精光

汽车要闻

第五代宏光MINIEV焕新 四门玩趣代步车来袭

态度原创

房产
艺术
游戏
健康
军事航空

房产要闻

2.2万/m²起!三亚主城性价比标杆 海垦·桃花源实景现房春节被疯抢

艺术要闻

2025年百家金陵画展 | 油画作品选刊

新品节DEMO试玩报告

转头就晕的耳石症,能开车上班吗?

军事要闻

美政府给新伊核协议设限内容遭披露

无障碍浏览 进入关怀版