网易首页 > 网易号 > 正文 申请入驻

DeepSeek在海内外彻底爆发,但它不需要被神话

0
分享至

界面新闻记者 | 伍洋宇
界面新闻编辑 | 文姝琪

1月27日,DeepSeek AI智能助手同时冲上中美iOS免费应用排行榜第一,这是中国应用首次达成这一成绩。

与此同时,与这家大模型公司相关的多个词条挤入微博热搜,其中一条是,“DeepSeek彻底爆发”。这背后有社交平台涌入的万千情绪:开源追上闭源,中国大模型公司超越OpenAI。

DeepSeek真的爆发了吗?

事实上,DeepSeek在这两天并没有做什么特别的事,将它推进舆论风暴中心的力量主要来自于Meta。

大概三天以前,在美国匿名职场社区teamblind上,有Meta员工直言,DeepSeek最近的一系列动作让Meta的生成式AI团队陷入了恐慌,前者低成本的训练工作,让后者难以解释自己超高预算的合理性。

“工程师们正在疯狂地分析DeepSeek,试图从中复制任何可能的东西。”

随即,Meta首席人工智能科学家杨立昆(Yann LeCun)在X(原推特)平台上表示,对于那些认为“中国在人工智能领域正在超越美国”的人,正确的想法是,“开源模型正在超越闭源模型”。这番表态直指DeepSeek近来在开源模型上的表现。

DeepSeek并不是突如其来“惊艳”所有人,从DeepSeek-V2开始,这家公司已经被硅谷视为一股东方的神秘力量。国内大模型行业第一场真正意义上的“降价潮”,也是由这家公司凭借“MoE+MLA”这一架构创新率先发起。

它近期之所以再度被热议,主要在于它过去一个月内相继发布了DeepSeek-V3和R1两款大模型产品。

2024年底,DeepSeek发布新一代MoE模型DeepSeek-V3,它拥有6710亿参数,其中激活参数为370亿,在14.8万亿token上进行了预训练。

在知识类任务(MMLU, MMLU-Pro, GPQA, SimpleQA)上,V3接近当前表现最好的Claude-3.5-Sonnet-1022,在代码能力上同样稍好于后者。而在数学能力上,V3已明显领先其他开闭源模型,包括LIama3.1 405B-Inst,GPT-4o 0513,Qwen2.5 72B-Inst。

这已经是一个足够好的开源模型,但真正让其受到大量关注的,是DeepSeek在技术论文中表示,DeepSeek-V3模型总训练成本为557.6万美元,完整训练消耗了278.8万个GPU小时,几乎是同等性能水平模型训练所需十分之一。这也是DeepSeek-V3引起Meta关注的核心表现之一。

让这番关注量级再上一层楼的,是DeepSeek一周以前发布的推理模型R1。

1月20日,DeepSeek发布性能对齐OpenAI-o1正式版的DeepSeek-R1,并同步开源模型权重。它在数学、代码、自然语言推理等任务上与OpenAI-o1-1217基本持平,尤其在AIME 2024(美国数学邀请赛)、MATH-500、SWE-Bench Verified(软件开发领域测试集)三项测试集上以微弱优势取胜。

作为对R1能力的一种验证,由660B版本R1蒸馏得到的多个小尺寸模型中,32B和70B两款模型在多项能力上能够与OpenAI o1-mini对标。并且,这些蒸馏模型分属Qwen系列和Llama系列,其中,14B Qwen系列蒸馏模型,其各项推理类测试集表现已经明显好于QwQ-32B-Preview。

它当时更引入注目的是同步开源了DeepSeek-R1-Zero,这是一个仅在预训练基础上加入了RL(强化学习)而没有经过SFT(监督微调)的成果。

由于没有人类监督数据介入,R1-Zero在生成上可能存在可读性较差、语言混杂的现象,但该模型仍然足以对标OpenAI-o1-0912。它更重要的意义是探索出了仅通过强化学习训练大语言模型就能获得推理能力的技术可能性,为相关后续研究提供了重要基础。

在训练方式上,DeepSeek利用了数千条长CoT冷启动数据,先是对DeepSeek-V3-Base这一基础模型进行微调。随后进行面向推理的大规模RL训练,并引入语言一致性奖励克服语言混杂问题。经历监督微调之后,R1又进行了适用于所有场景的强化学习,对推理数据和一般数据采用不同的奖励规则。

另外,R1在强化学习中加入了组相对策略优化算法(Group Relative Policy Optimization,GRPO),从效果上来说,它能够优化策略、提高样本效率和增强算法稳定性等。

至此,回到DeepSeek的近期表现上,它的确刷新了开源大模型的最好性能表现,但一名大模型行业投资人对界面新闻记者表示,仍要理智看待DeepSeek,这家公司不需要被神话。

他认为,DeepSeek-V3的确是当前最好的开源模型,但说它能够与头部闭源模型打擂台还为时尚早。另外,在GPT-4出现近两年时间里,开源大模型的算法、框架及系统都在同步更新迭代,DeepSeek此时做出大概为GPT-4三分之一参数大小的V3模型,实际上是一件顺其自然的事。

杨立昆也有类似的观点表达,他在前述推文中提到,DeepSeek自身也“从开源研究和技术中获益”。“他们提出了新想法,并基于其他人的工作进行创新。由于他们的工作是公开和开源的,所有人都能从中获益。这就是开源研究和开源技术的力量。”

一名AI从业者则对界面新闻表示,在前期探索者的基础上,DeepSeek的确可以少做很多倍次实验。

而对于R1,它在没有加入过程奖励模型(只有结果奖励模型)和蒙特卡洛树搜索等更复杂技术的前提下,便实现了o1水平的推理性能。

并且,这种纯RL训练方式让R1自己学会了Longer-chain reasoning(长链推理)和Reflection(反思),这是一种“自我进化”能力,被认为是大语言模型学会自我反思、可以自我纠错的“aha moment”。

不过,在一些行业人士看来,R1也可能存在自己的局限。一方面,过程奖励和树搜索技术,是否是模型进一步提高推理能力的关键方法,外界还无从得知。另一方面,前述行业人士对界面新闻记者指出,R1目前的知识范围不会超过OpenAI o1。

事实上,前不久在OpenAI年底发布季上亮相的o3和o3-mini,性能相比o1又猛长了一大截。从o1到o3,OpenAI公布的间隔时间仅有三个月,显然强化学习带来的推理阶段scaling up的技术范式,要比GPT系列模型以年为单位的预训练范式的节奏快得多。这意味着国内大模型公司仍有加速创新的竞争压力。

技术热议之外,真正让DeepSeek接住这番“泼天流量”的,也在于这家公司近期战略性上线了C端(用户)智能助手应用,让大众可以直观感受V3和R1的技术价值。这股热浪甚至一度至其服务“宕机”。

DeepSeek AI智能助手同样是一款ChatBot类应用,在社交平台上,用户分享自己与它的对话也成为一种热潮。性能强大、价格便宜是大家普遍强调的特点,游戏科学创始人兼CEO、《黑神话:悟空》制作人冯骥将其形容为“可能是个国运级别的科技成果”。但除此以外,一些用户评论显示,在不同场景需求下它也存在自己的短板。

从一家公司的发展脉络来看,DeepSeek真正的价值还体现在,它证明了一个短小精悍、扁平高效的组织架构,可能才是面向AGI(通用人工智能)的大模型研发可以依赖的创业形态。

在DeepSeek发布R1后不久,Meta首席执行官扎克伯格表示,Meta计划在2025年投入超过600亿美元,进一步加大对人工智能的投资。由此,DeepSeek的低训练成本和高创新效率对于AI大模型行业的价值可见一斑。

如今,值得行业正视的现实是,DeepSeek从创业理念、人才组织再到研发成果,都是中国企业中可以面向OpenAI、Meta等开闭源大模型公司与之一战的存在,但无需借此将它推上神坛。

这是DeepSeek从成立之初就已经内化的目标。创始人梁文峰在此前接受采访时表示,“我们认为随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“拯救美国大兵”,特朗普“赢学”被打脸

“拯救美国大兵”,特朗普“赢学”被打脸

上观新闻
2026-04-04 17:27:38
这是迄今为止,我见过最美的女人,不接受反驳

这是迄今为止,我见过最美的女人,不接受反驳

草莓解说体育
2026-04-03 15:08:02
彻底反转!澳洲品牌方发声澄清,董宇辉直播间根本没卖问题款

彻底反转!澳洲品牌方发声澄清,董宇辉直播间根本没卖问题款

行者聊官
2026-04-04 16:43:42
为营救F-15飞行员,美军特种兵冒死突入伊朗,地面战激烈交火

为营救F-15飞行员,美军特种兵冒死突入伊朗,地面战激烈交火

共工之锚
2026-04-04 00:05:37
官宣!34岁奥斯卡因病正式退役 放弃6647万薪水 中超8年赚16亿

官宣!34岁奥斯卡因病正式退役 放弃6647万薪水 中超8年赚16亿

念洲
2026-04-04 21:52:19
王楚钦逆转却留隐患!1-3落后做出搏命举动,半决赛令人担忧

王楚钦逆转却留隐患!1-3落后做出搏命举动,半决赛令人担忧

三十年莱斯特城球迷
2026-04-04 20:52:16
郑丽文为何先飞上海,不直飞南京不包机还坐普通航班?原因很现实

郑丽文为何先飞上海,不直飞南京不包机还坐普通航班?原因很现实

混沌录
2026-04-03 17:28:23
金正恩难以垮台的真正原因

金正恩难以垮台的真正原因

深度报
2026-04-04 17:39:30
美国F-15E战斗机被击落,飞行员逃生,现已全部救回

美国F-15E战斗机被击落,飞行员逃生,现已全部救回

金召点评
2026-04-04 14:30:23
许家印突发消息

许家印突发消息

新浪财经
2026-04-04 18:41:17
作秀半生,标哥归来仍是戏中人

作秀半生,标哥归来仍是戏中人

迷世书童H9527
2026-04-03 21:50:47
丑陋比赛!山东泰山爆冷输球,明显点球被黑掉,韩鹏到底练什么?

丑陋比赛!山东泰山爆冷输球,明显点球被黑掉,韩鹏到底练什么?

话体坛
2026-04-04 21:26:41
别什么东西都往豆包上发了,男子发私照让豆包评价身材,账号遭封禁:会有人审核,别乱发乱聊天

别什么东西都往豆包上发了,男子发私照让豆包评价身材,账号遭封禁:会有人审核,别乱发乱聊天

观威海
2026-04-04 16:15:03
19岁“失联”女孩露面,称因网恋自愿前往柬埔寨,绑架是演戏为向家里要钱!其父回应:确认是她

19岁“失联”女孩露面,称因网恋自愿前往柬埔寨,绑架是演戏为向家里要钱!其父回应:确认是她

大象新闻
2026-04-04 08:49:03
今日油价|4月4日调整后92/95号汽油价格,下周油价将大涨!

今日油价|4月4日调整后92/95号汽油价格,下周油价将大涨!

猪友巴巴
2026-04-04 16:20:03
“日乒噩梦”!王曼昱四杀桥本帆乃香成定局,日女乒恐全军覆没!

“日乒噩梦”!王曼昱四杀桥本帆乃香成定局,日女乒恐全军覆没!

田先生篮球
2026-04-04 06:07:07
社保局提醒:退休证只是开始!这三张“保命纸”不办,亏大了

社保局提醒:退休证只是开始!这三张“保命纸”不办,亏大了

好笑娱乐君每一天
2026-04-04 13:15:57
"猪肝红"!上海人被堵傻眼,多个服务区一度进不去

"猪肝红"!上海人被堵傻眼,多个服务区一度进不去

看看新闻Knews
2026-04-04 20:07:10
“麻豆传媒·关停”:黄色产业,居然也有寒冬!?

“麻豆传媒·关停”:黄色产业,居然也有寒冬!?

辰星杂谈
2026-04-04 13:38:22
澳门世界杯:四强诞生,张本惨败出局,松岛辉空半决赛对手确定

澳门世界杯:四强诞生,张本惨败出局,松岛辉空半决赛对手确定

观察鉴娱
2026-04-04 17:33:41
2026-04-04 22:51:00
界面新闻 incentive-icons
界面新闻
只服务于独立思考的人群
1050339文章数 1332444关注度
往期回顾 全部

科技要闻

内存一年涨四倍!国产手机厂商集体涨价

头条要闻

媒体:美军上演现实版"拯救大兵" 特朗普"赢学"被打脸

头条要闻

媒体:美军上演现实版"拯救大兵" 特朗普"赢学"被打脸

体育要闻

刹不住的泰格·伍兹,口袋里的两粒药丸

娱乐要闻

Q女士反击,否认逼宋宁峰张婉婷离婚

财经要闻

中微董事长,给半导体泼点冷水

汽车要闻

17万级海豹07EV 不仅续航长还有9分钟满电的快乐

态度原创

亲子
游戏
艺术
本地
公开课

亲子要闻

中俄带娃观念差异有多大

别偷看啦!《红色沙漠》美女NPC全都懂

艺术要闻

高4000米,造价9000亿!日本为什么抛出“钢铁山脉”摩天楼?

本地新闻

跟着歌声游安徽,听古村回响

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版