网易首页 > 网易号 > 正文 申请入驻

从DeepSeek R1的复现看深度思考模型的未来|ML-Summit 2025

0
分享至

备受瞩目的 2025 全球机器学习技术大会(ML Summit 2025)将于 4 月 18-19 日在上海虹桥西郊庄园丽笙大酒店召开。本次盛会由 CSDN & Boolan 联合主办,汇聚了超 50 位来自学术界和工业界顶尖专家,共同探讨智能体、联邦学习、多模态大模型等热门 AI 技术实践。

作为全球机器学习技术大会的老朋友,新浪微博首席科学家及 AI 研发部负责人张俊林将带来《从 DeepSeek R1 的复现看深度思考模型的未来》的精彩分享。

张俊林作为「大模型技术拆解得最通透的实战派」,在 2024 年的机器学习技术大会上,他对 Gemini 多模态架构、OpenAI o1 技术的硬核拆解,让开发者直呼“终于有人讲透技术本质”。

从 DeepSeek R1 复现出发,洞见深度思考模型未来

DeepSeek R1 的开源引发了学术界和工业界对其复现研究的热潮,也为探索更强大的“深度思考”模型提供了新的视角。本次演讲将:

  • 系统梳理技术脉络: 回顾 DeepSeek R1 开源后的各类复现研究,涵盖 SFT 阶段的轻量适配(如 S1)与 RL 阶段的创新实践。

  • 深度解析训练范式: 重点剖析其核心的两阶段训练模式——如何通过冷启动微调结合多领域数据优化进行 SFT,以及如何运用 GRPO 强化学习与全场景对齐实现模型“深度思考”能力的跃迁。

  • 探讨关键技术问题: 尝试解答一系列备受关注的核心问题,例如:强化学习(RL)的 Scaling Law 边界何在?影响 SFT 阶段蒸馏方法效果的关键因素是什么?如何科学地理解和解释 DeepSeek 团队提及的“Aha Moment”现象?

大模型时代,Scaling Law 依旧是核心驱动力。张俊林深入探讨 Grok 3 背后的 Scaling Law 本质,以及对大模型未来发展的启示。他提出,即使 Grok 3 耗费大量算力,仍然遵循预训练阶段增大模型尺寸的“传统”做法,这种做法的性价比值得进一步思考。

此外,张俊林通过用 S 型曲线叠加来解释大模型预训练、后训练以及推理阶段 Scaling Law 的各种现象,引发业界广泛关注。他认为,理解 Scaling Law 的关键在于理解 S 型曲线的叠加。具体可参考张俊林撰写的如下两篇文章,AI 科技大本营均有发表:

对于渴望紧跟大模型前沿、理解深度思考模型核心机制与未来方向的听众而言,张俊林的分享无疑是一场不容错过的知识盛宴。

ML Summit 2025:汇聚全球智慧,共绘 AI 新蓝图

2025 全球机器学习技术大会 (ML Summit 2025) 不仅是技术交流的平台,更是推动 AI 生态融合、促进行业协同创新的重要契机。大会设有 12 大技术专题,覆盖 AI 领域的前沿热点。此外,大会还将设置 AI 企业创新展区,展示最新的技术产品和解决方案。

我们诚挚邀请全球 AI 产业参与者积极加入 ML Summit 2025,共同探索 AI 的未来发展方向,推动 AI 在更广泛的应用场景中落地生根。期待与您在 ML Summit 2025 携手见证 AI 时代的新篇章!

▲2024全球机器学习技术大会展区盛况

我们诚邀全球 AI 产业参与者积极加入,共同捕捉前沿趋势,探索产业升级路径,推动 AI 走向更广阔的应用场景。期待在 ML Summit 2025,与每一位同行者携手见证 AI 时代的新篇章 !

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
实在不行求大陆吧!国民党主席郑丽文发声明:台湾现在快没气烧了

实在不行求大陆吧!国民党主席郑丽文发声明:台湾现在快没气烧了

南权先生
2026-03-11 15:53:16
迎战奔驰G级!宝马首款硬派豪华SUV预计2029投产

迎战奔驰G级!宝马首款硬派豪华SUV预计2029投产

快科技
2026-03-12 15:10:36
特朗普人还没到,先改访华规格,中方已接到通知,美国要弯道超车

特朗普人还没到,先改访华规格,中方已接到通知,美国要弯道超车

面包夹知识
2026-03-11 20:16:29
盈科暴雷:全球最大律所,毁于低认知豪赌

盈科暴雷:全球最大律所,毁于低认知豪赌

不正确
2026-03-11 23:11:56
美媒警告:中美可能很快就会开战,中国导弹雨能穿透美军所有防御

美媒警告:中美可能很快就会开战,中国导弹雨能穿透美军所有防御

阿芑历史
2026-03-12 14:07:10
揭秘!外卖员几乎不骑雅迪、爱玛,背后原因太现实,全是无奈之举

揭秘!外卖员几乎不骑雅迪、爱玛,背后原因太现实,全是无奈之举

老特有话说
2026-03-08 15:32:40
诺贝尔奖获得者警告:AI 兴起后,年轻一代不要一窝蜂地学习科学、技术、工程和数学

诺贝尔奖获得者警告:AI 兴起后,年轻一代不要一窝蜂地学习科学、技术、工程和数学

新浪财经
2026-03-11 07:06:54
WTT重庆冠军赛:国乒一人出局,日本三人晋级16强

WTT重庆冠军赛:国乒一人出局,日本三人晋级16强

阿嚼影视评论
2026-03-12 14:42:29
云南楚雄一共享单车防风护罩疑遭恶意插针,针头对着握把,或故意为之!有人被扎到后进行了体检,多方回应:已报案并全面排查

云南楚雄一共享单车防风护罩疑遭恶意插针,针头对着握把,或故意为之!有人被扎到后进行了体检,多方回应:已报案并全面排查

大风新闻
2026-03-11 12:07:02
小杨阿姨待不住了,隔空示弱老板娘,马筱梅晒亲妈炖的麻油鸡汤

小杨阿姨待不住了,隔空示弱老板娘,马筱梅晒亲妈炖的麻油鸡汤

小娱乐悠悠
2026-03-12 11:58:19
沦为共享单车的女色虎

沦为共享单车的女色虎

深度报
2026-03-05 22:39:27
看了沙特的海水淡化技术,再看中国海水淡化技术,才懂差距有多大

看了沙特的海水淡化技术,再看中国海水淡化技术,才懂差距有多大

原梦叁生
2026-03-11 04:20:45
狐狸尾巴藏不住了?马筱梅与汪家矛盾再升级,张兰的话有人信了

狐狸尾巴藏不住了?马筱梅与汪家矛盾再升级,张兰的话有人信了

老塕是个手艺人
2026-03-10 22:25:05
老年人的性生活多久一次合理?要戴套吗?答案颠覆认知

老年人的性生活多久一次合理?要戴套吗?答案颠覆认知

贱议你读史
2026-03-06 23:28:50
藏了19年!《我的山与海》爆火的李娟,竟是北电校花、名导儿媳!

藏了19年!《我的山与海》爆火的李娟,竟是北电校花、名导儿媳!

动物奇奇怪怪
2026-03-12 14:27:38
老师病危,我们全班凑20万,结果师母只收到8万,班长冷汗直流

老师病危,我们全班凑20万,结果师母只收到8万,班长冷汗直流

船长与船1
2026-03-12 10:29:58
资本让老头老太太连垃圾都捡不了!武汉部分小区,惊现废品回收机

资本让老头老太太连垃圾都捡不了!武汉部分小区,惊现废品回收机

火山詩话
2026-03-11 14:33:00
《逐玉》6位妈妈辈大有来头,认出了田丽,却没认出头发花白的她

《逐玉》6位妈妈辈大有来头,认出了田丽,却没认出头发花白的她

剧芒芒
2026-03-11 15:15:50
比芯片还难造?美国一尖端武器在中国放了50年,至今没仿制成功

比芯片还难造?美国一尖端武器在中国放了50年,至今没仿制成功

真正能保护你的
2026-02-19 18:28:03
13比0!联合国要求伊朗停止打击海湾国家,中国的态度亮了

13比0!联合国要求伊朗停止打击海湾国家,中国的态度亮了

子桑说
2026-03-12 14:58:21
2026-03-12 15:43:00
AI科技大本营 incentive-icons
AI科技大本营
连接AI技术的创造者和使用者
2642文章数 7662关注度
往期回顾 全部

科技要闻

当养虾人开始卸载,大厂的战争才真正开始

头条要闻

美国将对包括中国在内的多国启动新贸易调查 中方回应

头条要闻

美国将对包括中国在内的多国启动新贸易调查 中方回应

体育要闻

要脸,还是要83分纪录?

娱乐要闻

李湘瘦身惊艳亮相肖邦之夜 携女儿出席

财经要闻

卢锋:从特朗普团队群演看时代变局

汽车要闻

大众2025财报:转型虽有阵痛 "大象"已然起跑

态度原创

教育
家居
艺术
时尚
数码

教育要闻

家长在所有开销里,请把吃放在第一位!

家居要闻

触感本真 家的迹象

艺术要闻

朱屺瞻『凌波仙子』

风衣+大包,春季最气质搭配!

数码要闻

从玥影灰到知味大模型,看AWE 2026方太如何重构智慧厨居范式

无障碍浏览 进入关怀版