网易首页 > 网易号 > 正文 申请入驻

2月15日,探讨DeepSeek开源模型引发的AI最新趋势!蒸馏经验/开源生态/工程能力提升|嘉程创业流水席第249期

0
分享至

本周六上午10:00,与英伟达董鑫、Agent2.AI秦楚辞、像素绽放/ AiPPT.cn江天宇、微软金瀛探讨DeepSeek开源模型引发的AI最新趋势!

扫描上方二维码即可报名

蛇年春节,来自中国的开源基座大模型公司DeepSeek火遍全球。其实最早在去年12月下旬, DeepSeek-V3版本开源模型发布,其创新性地融合了三项关键技术——FP8、MLA(多头潜在注意力)和MoE(混合专家)架构,大幅提升了性能和效率。华尔街随即将目光聚焦于DeepSeek,因为其后续发布的模型一次比一次惊艳。2025年1月20日,其发布DeepSeek-R1,专门适用于数学、编码和逻辑等任务,性能对标OpenAI o1。1月27日,DeepSeek又发布了Janus Pro 7B和1.5B模型, 值得一提的是,7B和1.5B这两个参数量,令DeepSeek的模型具备端侧消费级硬件,比如AIPC运行模型的潜力。

从数据来看,DeepSeek爆发力耀眼。2025年2月初,其日活已突破4,000万,是ChatGPT的约70%,这一增长速度超过了许多同类产品。在没有任何广告投放的情况下,DeepSeek仅用7天就完成了1亿用户的增长。

DeepSeek不仅引领了开源模型社区的火爆,还开辟了高性价比训练模型的全新路径,并被业界迅速采用,比如加州大学伯克利和香港科技大学的一些小规模实验就获得了有效的证实,说明更小规模、更容易采用的模型,也能受益于DeepSeek的创新。这势必会提升小型研究实验室、创业公司和小机构的AI参与热情。此外,开源社区正围绕DeepSeek-R1迅速形成协作环境,近期Huggingface就计划上线一系列基于R1模型的版本,工具和教程,更多的公司正加入进来,加速创新和应用的步伐。

由于模型性能卓越,用户众多,国内外已有众多巨头公司与DeepSeek进行深度合作。在海外,英伟达宣布DeepSeek-R1模型可作为NVIDIA NIM微服务预览版使用,称该模型为推理、数学和编码等任务提供了“最先进的推理能力”,“高推理效率”以及“领先的准确性”;AMD则将DeepSeek的新模型集成到自己的GPU中,并针对推理进行了优化。国内,华为云宣布与硅基流动联合首发并上线基于华为云昇腾云服务的 DeepSeek R1/V3推理服务;腾讯云宣布在高性能应用服务HAI上支持一键部署 Deepseek-R1模型,还将其与腾讯云的Cloud Studio、对象存储等服务无缝集成。百度云、阿里云也接入相关部署。在汽车行业,东风汽车于2月7日宣布,已完成DeepSeek全系列大语言模型的接入工作,旗下猛士、奕派、风神、纳米等自主品牌车型将于近期陆续搭载应用;吉利汽车在2月 6日宣布,其自主研发的星睿大模型已成功与DeepSeek-R1完成技术融合。OPPO手机近日宣布,本月即将发布的OPPO Find N5将正式接入DeepSeek-R1人工智能推理模型。

在训练技术方面,DeepSeek也取得了一系列突破性的进展。其诞生出的训练模式广泛且有效,多个其他模型沿用其训练方式实现了模型推理进步和性能提升,同时在小规模模型上的验证依然有效。

其中,GRPO(Group Relative Policy Optimization)强化学习算法是 DeepSeek的重要创新之一。它作为Proximal Policy Optimization(PPO)的变体,取消了对critic模型的依赖,而是通过“组内评分”来估计基线,从而大幅降低了训练时的内存消耗和计算资源。在数学指令调优阶段,GRPO通过这种方式显著提升了模型在各类数学基准(如GSM8K、MATH以及其他外域数学任务)的表现。

此外,DeepSeek还首创了FP8 Mixed Precision Training Framework,首次在极大规模模型上引入并验证了FP8混合精度训练框架。通过支持FP8运算和存储,实现了训练加速和减少内存占用。在训练过程中,DualPipe算法实现了流水线并行,减少了流水线空泡,实现了计算与通信重叠;开发的专门跨节点All-to-All通信内核,则充分利用了InfiniBand (IB)和NVLink的带宽,确保各节点之间的数据交换高效且低延迟。

DeepSeek的出现,对AI行业格局产生了深远的影响:

  • 未来大模型的开源与普及加速。目前全球AI产业都在早期阶段,闭源大模型短期内暂未有明确的商业化路径,DeepSeek以开源+生态+性价比的方式异军崛起,其示范效应激励了众多科研机构和巨头公司自己开发基座模型,也吸引了更多开发者投入到AI产业中来;

  • AI行业对算力的需求结构可能发生变化。DeepSeek通过极致的工程能力、算法优化和架构创新,大幅降低了模型训练与推理对高规格算力的依赖。此外,边缘设备和终端产品中的应用逐渐增多,对能够支持高效推理的端侧算力芯片的需求升高,未来推理算力和端侧算力的需求也将迎来显著增长。


2月15日,本周六上午10:00,热爱创新的嘉程资本携手硅星人开启嘉程创业流水席第249席!我们邀请了英伟达研究院研究科学家董鑫、Agent2.AI创始人秦楚辞、像素绽放 / AiPPT.cn CFO江天宇、Microsoft Senior Research Scientist金瀛一起深度探讨DeepSeek开源模型引发的AI最新趋势!欢迎各位关注DeepSeek领域上下游的研发人员、创业者、投资人和行业专家一起参加!

再次邀请上车!

主题:探讨DeepSeek开源模型引发的AI最新趋势!

时间:2025年2月15日10:00-12:00

形式:腾讯会议

名额:为保证活动私密性和讨论质量,限100位!

本场活动免费参加!

嘉程创业流水席是嘉程资本为创业者打造的高端、私密、平等的社交平台。大家迅速交流最新行业趋势,认识行业合作伙伴、深度学习行业真知灼见。自2018年下半年推出嘉程创业流水席的服务以来,我们通过线上线下结合的方式,举办了248场创业者流水席,迄今已服务数万名创新者,形成全球华人科技创新者的活跃生态。

点个“爱心”,再走吧

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
上海宛平南路一套房子爆火!月租7000元,回家像玩密室逃脱...

上海宛平南路一套房子爆火!月租7000元,回家像玩密室逃脱...

黄河新闻网吕梁
2026-03-26 15:14:06
张雪峰奶奶近况令人担忧,4年内子孙相继离世,不设追思会瞒着她

张雪峰奶奶近况令人担忧,4年内子孙相继离世,不设追思会瞒着她

古希腊掌管松饼的神
2026-03-26 11:29:25
我有一个朋友在张雪峰公司上班他说张雪峰根本不是大家看到的样子

我有一个朋友在张雪峰公司上班他说张雪峰根本不是大家看到的样子

乐悠悠娱乐
2026-03-26 10:27:07
张雪峰猝然离世,办公室内景曝光,摆设奇怪,写真照被指像遗照,生前的话字字催泪

张雪峰猝然离世,办公室内景曝光,摆设奇怪,写真照被指像遗照,生前的话字字催泪

笔墨V
2026-03-26 14:53:51
恶毒诋毁张雪峰离世:千万粉丝“留几手”被罚!网友:应永久封杀

恶毒诋毁张雪峰离世:千万粉丝“留几手”被罚!网友:应永久封杀

影像温度
2026-03-26 11:25:05
伊朗女药剂师拒绝撤离,空袭第10天在“精准”打击下被“误杀”

伊朗女药剂师拒绝撤离,空袭第10天在“精准”打击下被“误杀”

网易新闻出品
2026-03-26 11:16:13
“我用房子贷的款却进了他们口袋”,佛山一男子称遭遇套路贷;警方立案侦查,3人被批捕后取保候审

“我用房子贷的款却进了他们口袋”,佛山一男子称遭遇套路贷;警方立案侦查,3人被批捕后取保候审

大风新闻
2026-03-26 16:56:40
张雪峰被骂8年,走后全网才发现:他说的5句话是给普通人的保命符

张雪峰被骂8年,走后全网才发现:他说的5句话是给普通人的保命符

奇思妙想草叶君
2026-03-25 13:22:05
继张雪峰之后,中医大师黄贵华被曝心梗去世,社交账号已变黑白

继张雪峰之后,中医大师黄贵华被曝心梗去世,社交账号已变黑白

180视角
2026-03-26 11:52:12
斯柯达将退出中国,大众中国回应

斯柯达将退出中国,大众中国回应

第一财经资讯
2026-03-26 15:14:56
TVB宣布拟改名!以后要叫你...

TVB宣布拟改名!以后要叫你...

东莞潮事儿
2026-03-26 12:32:15
坚决反对中国任何城市申办奥运会,国际奥委会这次怕是真失算了

坚决反对中国任何城市申办奥运会,国际奥委会这次怕是真失算了

南权先生
2026-03-25 15:25:11
中国禁止AI公司Manus两名高管离境?外交部回应

中国禁止AI公司Manus两名高管离境?外交部回应

澎湃新闻
2026-03-26 15:36:31
痛别!李幼平逝世

痛别!李幼平逝世

极目新闻
2026-03-26 13:31:27
张少康辞去广东省人民政府副省长职务

张少康辞去广东省人民政府副省长职务

新快报新闻
2026-03-26 11:50:03
高速统一限速3月26日正式落地!五档限速+清理非标不会再乱扣分!

高速统一限速3月26日正式落地!五档限速+清理非标不会再乱扣分!

沙雕小琳琳
2026-03-26 09:41:30
还有谁!杨瀚森100%命中率!20+9+5打出完美一战!

还有谁!杨瀚森100%命中率!20+9+5打出完美一战!

柚子说球
2026-03-26 13:07:05
黎真主党导弹袭击以国防部及军营

黎真主党导弹袭击以国防部及军营

北青网-北京青年报
2026-03-26 10:19:17
特朗普拒绝承认对伊朗打击是战争

特朗普拒绝承认对伊朗打击是战争

界面新闻
2026-03-26 15:51:22
袁家军会见王兴兴

袁家军会见王兴兴

新京报政事儿
2026-03-26 16:45:34
2026-03-26 17:39:00
硅星人 incentive-icons
硅星人
硅(Si)是创造未来的基础,欢迎来到这个星球。
2960文章数 10473关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

男子从四家公司贷出共计356万元 实际到手却仅8万多元

头条要闻

男子从四家公司贷出共计356万元 实际到手却仅8万多元

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

长护险谁能享受?享受多少?解答来了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

家居
亲子
房产
教育
健康

家居要闻

傍海而居 静观蝴蝶海

亲子要闻

售卖“增高神药”让孩子“猛长20厘米”?多家店铺被立案调查!

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

教育要闻

中小学家长必看数据,看与不看都会后悔

转头就晕的耳石症,能开车上班吗?

无障碍浏览 进入关怀版