网易首页 > 网易号 > 正文 申请入驻

从DeepSeek R1的复现看深度思考模型的未来|ML-Summit 2025

0
分享至

备受瞩目的 2025 全球机器学习技术大会(ML Summit 2025)将于 4 月 18-19 日在上海虹桥西郊庄园丽笙大酒店召开。本次盛会由 CSDN & Boolan 联合主办,汇聚了超 50 位来自学术界和工业界顶尖专家,共同探讨智能体、联邦学习、多模态大模型等热门 AI 技术实践。

作为全球机器学习技术大会的老朋友,新浪微博首席科学家及 AI 研发部负责人张俊林将带来《从 DeepSeek R1 的复现看深度思考模型的未来》的精彩分享。

张俊林作为「大模型技术拆解得最通透的实战派」,在 2024 年的机器学习技术大会上,他对 Gemini 多模态架构、OpenAI o1 技术的硬核拆解,让开发者直呼“终于有人讲透技术本质”。

从 DeepSeek R1 复现出发,洞见深度思考模型未来

DeepSeek R1 的开源引发了学术界和工业界对其复现研究的热潮,也为探索更强大的“深度思考”模型提供了新的视角。本次演讲将:

  • 系统梳理技术脉络: 回顾 DeepSeek R1 开源后的各类复现研究,涵盖 SFT 阶段的轻量适配(如 S1)与 RL 阶段的创新实践。

  • 深度解析训练范式: 重点剖析其核心的两阶段训练模式——如何通过冷启动微调结合多领域数据优化进行 SFT,以及如何运用 GRPO 强化学习与全场景对齐实现模型“深度思考”能力的跃迁。

  • 探讨关键技术问题: 尝试解答一系列备受关注的核心问题,例如:强化学习(RL)的 Scaling Law 边界何在?影响 SFT 阶段蒸馏方法效果的关键因素是什么?如何科学地理解和解释 DeepSeek 团队提及的“Aha Moment”现象?

大模型时代,Scaling Law 依旧是核心驱动力。张俊林深入探讨 Grok 3 背后的 Scaling Law 本质,以及对大模型未来发展的启示。他提出,即使 Grok 3 耗费大量算力,仍然遵循预训练阶段增大模型尺寸的“传统”做法,这种做法的性价比值得进一步思考。

此外,张俊林通过用 S 型曲线叠加来解释大模型预训练、后训练以及推理阶段 Scaling Law 的各种现象,引发业界广泛关注。他认为,理解 Scaling Law 的关键在于理解 S 型曲线的叠加。具体可参考张俊林撰写的如下两篇文章,AI 科技大本营均有发表:

对于渴望紧跟大模型前沿、理解深度思考模型核心机制与未来方向的听众而言,张俊林的分享无疑是一场不容错过的知识盛宴。

ML Summit 2025:汇聚全球智慧,共绘 AI 新蓝图

2025 全球机器学习技术大会 (ML Summit 2025) 不仅是技术交流的平台,更是推动 AI 生态融合、促进行业协同创新的重要契机。大会设有 12 大技术专题,覆盖 AI 领域的前沿热点。此外,大会还将设置 AI 企业创新展区,展示最新的技术产品和解决方案。

我们诚挚邀请全球 AI 产业参与者积极加入 ML Summit 2025,共同探索 AI 的未来发展方向,推动 AI 在更广泛的应用场景中落地生根。期待与您在 ML Summit 2025 携手见证 AI 时代的新篇章!

▲2024全球机器学习技术大会展区盛况

我们诚邀全球 AI 产业参与者积极加入,共同捕捉前沿趋势,探索产业升级路径,推动 AI 走向更广阔的应用场景。期待在 ML Summit 2025,与每一位同行者携手见证 AI 时代的新篇章 !

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
临牌成了“免罚护身符”?北京正研究加强监管措施

临牌成了“免罚护身符”?北京正研究加强监管措施

笔墨V
2026-01-17 14:52:29
陪睡陪玩只是冰山一角!万达蒸发800亿后,王思聪再次传出大丑闻

陪睡陪玩只是冰山一角!万达蒸发800亿后,王思聪再次传出大丑闻

阿器谈史
2025-12-26 15:26:05
大事不妙,以德达成协议,美国恐复制马杜罗悲剧,伊朗遭三国围击

大事不妙,以德达成协议,美国恐复制马杜罗悲剧,伊朗遭三国围击

非凡观点
2026-01-16 09:43:37
3-2加时绝杀!越南四战全胜,重返亚洲杯四强,静候中国男足晋级

3-2加时绝杀!越南四战全胜,重返亚洲杯四强,静候中国男足晋级

侃球熊弟
2026-01-17 02:18:27
周伯通被杀,郭靖为何不报仇?你看凶手是谁,加上杨过也难赢那人

周伯通被杀,郭靖为何不报仇?你看凶手是谁,加上杨过也难赢那人

耳东文史
2026-01-14 00:02:57
美媒爆:大批美军机正飞往中东

美媒爆:大批美军机正飞往中东

环球时报国际
2026-01-17 16:52:48
“收拾这个烂摊子”:省长福特强烈反对卡尼对华电动车协议

“收拾这个烂摊子”:省长福特强烈反对卡尼对华电动车协议

王糬自驾
2026-01-17 08:15:29
超20位央企掌门人年薪超90万元

超20位央企掌门人年薪超90万元

21世纪经济报道
2026-01-17 18:55:35
别再可怜李咏了!离世7年后医生揭秘离世真相,难怪选择葬身美国

别再可怜李咏了!离世7年后医生揭秘离世真相,难怪选择葬身美国

LULU生活家
2025-12-29 18:30:47
“台独”是假议题!洪秀柱:既然早晚要统一,不如赶快统一吧

“台独”是假议题!洪秀柱:既然早晚要统一,不如赶快统一吧

海峡导报社
2026-01-16 22:28:03
我国古代唯一被灭绝的民族:所作所为让人唾弃,被各族集体绞杀

我国古代唯一被灭绝的民族:所作所为让人唾弃,被各族集体绞杀

铭记历史呀
2026-01-15 16:51:59
被中国U23淘汰,乌兹别克斯坦连续四届U23亚洲杯晋级四强终止

被中国U23淘汰,乌兹别克斯坦连续四届U23亚洲杯晋级四强终止

懂球帝
2026-01-17 22:37:35
从脸到脚!张天爱光脚造型火出圈,网友吵翻我们到底在追捧什么?

从脸到脚!张天爱光脚造型火出圈,网友吵翻我们到底在追捧什么?

庭小娱
2026-01-17 13:18:55
刚刚!昌平升级至暴雪预警!最低气温突破零下两位数——

刚刚!昌平升级至暴雪预警!最低气温突破零下两位数——

家住昌平
2026-01-17 18:13:57
“血液干净”的人,一般有6个特征,若能达到5个,恭喜!

“血液干净”的人,一般有6个特征,若能达到5个,恭喜!

医学原创故事会
2026-01-17 22:42:05
被控“收受大陆资金”,中天记者林宸佑被羁押,或因得罪民进党引祸上身

被控“收受大陆资金”,中天记者林宸佑被羁押,或因得罪民进党引祸上身

海峡导报社
2026-01-17 18:36:03
王毅挂断电话,伊朗援兵终于赶到,特朗普最后一刻喊停,不打了?

王毅挂断电话,伊朗援兵终于赶到,特朗普最后一刻喊停,不打了?

知鉴明史
2026-01-16 15:56:06
12斤肉3个月甩净!全红婵减重到离谱,这哪是减肥,是拿命拼金牌

12斤肉3个月甩净!全红婵减重到离谱,这哪是减肥,是拿命拼金牌

做一个合格的吃瓜群众
2025-12-31 07:41:05
丹麦通告全球:禁止中方上岛投资!特朗普接管前,丹麦露出真面目

丹麦通告全球:禁止中方上岛投资!特朗普接管前,丹麦露出真面目

博览历史
2026-01-16 11:33:49
卡里克谈梅努首发:他是个非常棒的球员,踢过一些重大比赛

卡里克谈梅努首发:他是个非常棒的球员,踢过一些重大比赛

懂球帝
2026-01-17 20:39:35
2026-01-17 23:31:00
AI科技大本营 incentive-icons
AI科技大本营
连接AI技术的创造者和使用者
2614文章数 7639关注度
往期回顾 全部

科技要闻

8亿周活扛不住烧钱 ChatGPT终向广告"低头"

头条要闻

李昊发挥神勇 U23国足点球战胜乌兹别克斯坦晋级四强

头条要闻

李昊发挥神勇 U23国足点球战胜乌兹别克斯坦晋级四强

体育要闻

三巨头走了俩,联盟笑柄却起飞了

娱乐要闻

马年春晚首次联排场外细节!

财经要闻

保不准,人民币会闪击6.8!

汽车要闻

林肯贾鸣镝:稳中求进,将精细化运营进行到底

态度原创

游戏
教育
健康
房产
数码

魔坛每周节奏丨Lawliet问鼎WSB,中韩对抗赛浪漫一穿四AK

教育要闻

你离“省级教学能手”还有几步?好多老师卡在了第二级!

血常规3项异常,是身体警报!

房产要闻

真四代来了!这次,海口楼市将彻底颠覆!

数码要闻

ATK RS7 Air磁轴键盘开启预约,435元起配置亮眼

无障碍浏览 进入关怀版