网易首页 > 网易号 > 正文 申请入驻

当我们谈论DeepSeek时是在谈论什么

0
分享至

王鑫

在国内舆论场中,DeepSeek创始人梁文峰与DeepSeek是深度捆绑的,有人称他是人工智能上甘岭的“黄继光”,有人说他是中国的“马斯克”。在笔者看来,更重要的或许在于做好DeepSeek与梁文峰思维的解码——当我们在谈论DeepSeek时,到底在谈论什么,或者说应该谈论什么。

其一:突围,山重水复疑无路

ChatGPT问世以来,全球AI竞赛正式进入“大力出奇迹”时代。当美国科技大厂已投入巨资,构建起了一套由他们制定的行业标准、生存法则时,当很多人潜意识中已默许,AI领域未来发展的话语权、主导权和控制权正牢牢掌握在西方手中时,来自中国的DeepSeek却突然闯了进来。

DeepSeek用架构算法、训练方式、工程优化等系统性创新,在千亿参数规模下展现出与GPT-o1-1217相当的推理能力,以显著降低的训练成本,走出了一条差异化技术路径,实现了国产大模型的突围。

美国拜登政府2022年实施并在此后多次收紧禁止向中国出售最先进芯片及芯片制造设备的禁令,目的就是限制中国获取尖端技术。DeepSeek团队正是在美国AI芯片禁运的压力下,不得不在较低性能的H800GPU上训练模型。但正是这样的“降维”,反而推动了算法优化的突破。

其二:创新,东风夜放花千树

DeepSeek的成功,挑战了AI领域“规模至上”的传统思维。从技术角度看,DeepSeek主要创造了哪些核心创新?

首先是模型架构。混合专家模型(MoE)通过将模型分成多个专家,并在每个特定任务中只激活少量合适的专家,从而在推理过程中减少参数量,提升效率。DeepSeek引入了新的无损负载均衡技术和路由网络方法,有效降低了通信开销,突破了传统方法增加通信开销换取高效推理的瓶颈,使得新框架更加稳定高效。

其次是算法突破。多头潜在注意力机制(Multi-HeadLatentAttention,MLA)是DeepSeek最关键的技术突破,它显著降低了模型推理成本。

第三是训练方式。DeepSeek-R1-Zero首次证明了基于大规模强化学习(RL)与高质量合成数据(SyntheticData)结合的技术路径,可在不依赖标注数据、监督微调(SFT)的情况下,获得高水平推理能力。在R1-Zero训练中,DeepSeek应用组相对优化策略(GRPO)和两个简单的奖励函数,使得R1-Zero自发形成了评估和优化推理的能力,产生令人惊叹的“顿悟时刻”(AhaMoment)。

第四是数据策略。DeepSeek采用高质量合成数据的数据策略与其训练方式、推理任务相匹配,极大降低了数据成本。“数据质量优先”的核心原则也已逐渐成为领域共识:比数据规模更重要的是数据质量与知识密度,相应地,DeepSeek采取了拒绝采样(rejectionsampling)等基于验证的数据筛选与增强方法。

最后是工程技术。DeepSeek绕过了英伟达的通用编程框架CUDA,使用了更底层也更复杂的PTX(ParallelThreadExecution)汇编语言直接操控GPU指令集,从而实现芯片算力的效用最大化,并为未来适配国产GPU留下巨大的想象空间。

其三:未来,长风破浪会有时

DeepSeek的横空出世让人们重新反思大模型、AGI领域暴力美学式的思维惯性,也重新关注算法、架构、优化等技术创新的巨大潜力。更重要的是,DeepSeek-R1还可以免费使用,而且是开源的。低成本与开放性的强强联合可能有助于普及AI技术,让其他国家(尤其是美国以外)的开发者能够入局。

DeepSeek撕掉了此前笼罩在AI之上的神秘面纱。它专注创新,在人工智能全球竞争白热化的关键时期形成突破,为中国的智能生态构建奠定关键基础;它拥抱开源,拒绝“CloseAI”,为全世界技术社区做出坚实贡献。当我们赞叹DeepSeek产品的巨大成功,也应当关注其团队的系统性创新能力,这既包含多方面的技术突破,也包括如何聚合“高密度技术人才”、如何为年轻团队提供高效的创新土壤。

最后,也要指出DeepSeek的关键破局点,是在保持推理能力相当的情况下,实现了训练及计算成本的极大降低。而从数学原理上说,并未跳出大模型浪潮范畴,这也意味着,DeepSeek也无法解决这一技术路线下不可解释、幻觉等内在问题。因此,关于智能“涌现”的根本奥秘,关于现有模型的智能边界与潜力,关于模型的解释性、泛化性、稳定性,尤其是幻觉引发的认知安全风险,仍是值得深入探索的重要议题。

长期而言,算力依然是人工智能的基础设施,我们也期待芯片领域诞生属于中国的DeepSeek时刻。

(作者为北京航空航天大学人工智能学院副教授)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
内塔尼亚胡失算了,击中俄罗斯人后,普京一声令下,以色列恐遭殃

内塔尼亚胡失算了,击中俄罗斯人后,普京一声令下,以色列恐遭殃

泪满过眼
2026-03-21 21:48:10
糖尿病能喝酒吗?医生提醒:喝酒时注意这个病,要喝就要这样喝

糖尿病能喝酒吗?医生提醒:喝酒时注意这个病,要喝就要这样喝

快乐的小大夫
2024-08-22 10:26:01
欧尔班的好日子到头了

欧尔班的好日子到头了

民间胡扯老哥
2026-03-25 05:22:48
因祸得福!烧129年的地下火被灭,新疆凭空多了个金饭碗

因祸得福!烧129年的地下火被灭,新疆凭空多了个金饭碗

混沌录
2026-03-24 23:03:10
马筱梅低调为汪宝办满月,亲戚一概没出镜,汪小菲盛赞岳母很辛苦

马筱梅低调为汪宝办满月,亲戚一概没出镜,汪小菲盛赞岳母很辛苦

小娱乐悠悠
2026-03-25 10:28:48
特朗普据悉将请扎克伯格、 埃里森和黄仁勋加入 科技委员会

特朗普据悉将请扎克伯格、 埃里森和黄仁勋加入 科技委员会

每日经济新闻
2026-03-25 23:07:37
蓝营一天三大噩耗!柯文哲预言成真,郑丽文陷入辞职危机

蓝营一天三大噩耗!柯文哲预言成真,郑丽文陷入辞职危机

青梅侃史啊
2026-03-25 12:17:08
“花48元请她吃饭,她不让睡只能奸杀”,2016年19岁女孩被奸杀

“花48元请她吃饭,她不让睡只能奸杀”,2016年19岁女孩被奸杀

汉史趣闻
2026-03-26 14:13:20
拒绝回归WCBA!李月汝再赴美国,官宣重磅决定,韩旭也要这么干了

拒绝回归WCBA!李月汝再赴美国,官宣重磅决定,韩旭也要这么干了

萌兰聊个球
2026-03-26 13:09:33
国民党大乱!马英九紧急发声,郑丽文下场开骂:扯破脸、斗到底!

国民党大乱!马英九紧急发声,郑丽文下场开骂:扯破脸、斗到底!

阿策聊实事
2026-03-26 04:16:27
以军一特种部队士兵在黎巴嫩南部死亡

以军一特种部队士兵在黎巴嫩南部死亡

界面新闻
2026-03-26 16:15:25
据报:伊朗最高领袖穆杰塔巴·哈梅内伊同意与美国进行谈判并达成协议

据报:伊朗最高领袖穆杰塔巴·哈梅内伊同意与美国进行谈判并达成协议

紫京讲谈
2026-03-26 01:39:04
孙子生日,我转了8888元给儿媳,她回复2个字,我直接冻结银行卡

孙子生日,我转了8888元给儿媳,她回复2个字,我直接冻结银行卡

清茶浅谈
2025-09-07 23:32:29
3月25日俄乌:川普再次吹嘘并“许愿”

3月25日俄乌:川普再次吹嘘并“许愿”

山河路口
2026-03-25 16:36:21
主场32分惨败上海!山西主帅:这是我接队以来,打得最差一场比赛

主场32分惨败上海!山西主帅:这是我接队以来,打得最差一场比赛

狼叔评论
2026-03-25 23:58:05
姆巴佩:无法想象没有内马尔的世界杯,但我也不能去反对安帅

姆巴佩:无法想象没有内马尔的世界杯,但我也不能去反对安帅

懂球帝
2026-03-26 07:00:47
香港再无董建华

香港再无董建华

华人星光
2025-11-25 12:01:27
NBA积分榜又乱了!掘金4连胜,火箭加时2分惜败,快船稳居第8

NBA积分榜又乱了!掘金4连胜,火箭加时2分惜败,快船稳居第8

薇说体育
2026-03-26 16:03:59
41岁张雪峰离世后遗产分配上热搜!11岁女儿张姩菡面临跟后妈争产,是否立遗嘱成关键

41岁张雪峰离世后遗产分配上热搜!11岁女儿张姩菡面临跟后妈争产,是否立遗嘱成关键

观星赏月
2026-03-26 03:56:16
FCC把3亿台路由器扔进黑名单,中国厂商连夜改产线

FCC把3亿台路由器扔进黑名单,中国厂商连夜改产线

Ping值焦虑
2026-03-25 13:41:53
2026-03-26 16:48:49
北青网-北京青年报 incentive-icons
北青网-北京青年报
北青网官方网易号
1101248文章数 854242关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

国防部:日本侵略过所有周边国家 至今都没有真正反省

头条要闻

国防部:日本侵略过所有周边国家 至今都没有真正反省

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

长护险谁能享受?享受多少?解答来了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

本地
数码
时尚
教育
公开课

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

数码要闻

1599~2499元,英特尔酷睿Ultra 200S Plus处理器发售

皮衣+裙,高级到炸

教育要闻

2026湖北高职单招工作启动

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版