网易首页 > 网易号 > 正文 申请入驻

DeepSeek何以创造了“行业奇迹”| 新京报专栏

0
分享至

一家此前不在多数媒体的“明星企业”列表中的“小企业”,一家走开源路线而非走闭源或率先开发应用的“创新组织”,却意外在2025年开年成为了中国大模型领域科技创新的全球代表。

据多家媒体报道,这家名为DeepSeek(深度求索)的中国大模型企业,最近发布的大模型,在多项性能测试中已经达到了OpenAI的最新大模型o1水平,部分项目还实现了超越。由此引发了全球科技行业的热烈讨论,有媒体形容“DeepSeek朝硅谷‘开了一枪’”,甚至“震动美国科技界”。

底层创新提升算力效率

DeepSeek当前所创造的“神话”,主要是两类叙事。第一类,是DeepSeek的算力成本投入与表现出来的性能对比,超出了行业的一般认知。据部分行业媒体报道,DeepSeek r1的训练成本仅为ChatGPT o1的零头。第二类神话则是,DeepSeek的成功证明了开源路线的逆袭胜利,对大公司、巨头的闭源路线进行了一次底层颠覆。

这两类看法被灌注到社交平台上进行广泛讨论后,事实上都或多或少因人们的真诚期待而略有扭曲。例如,DeepSeek r1的真实算力成本投入远不止600万美元,且最早报道的媒体混淆了DeepSeek在论文中提及的训练成本。根据原文,550万美元是DeepSeek v3在正式训练阶段的成本,不包括前期研究、实验的成本。

并且,从行业发展的逻辑看,探索与迭代、追赶所需的算力成本,也不应该放在一起对比。OpenAI在ChatGPT o1的研发探索,与v3在前序产品基础上的迭代,成本无法简单对比。创新和探索必然伴随着算力和各项成本的浪费,在确定性的路径上优化所付出的代价,与探索未知所付出的代价,互相之间不宜简单对比。

而从大模型现阶段的发展看,准确地说,一家企业的阶段性产品的成功,还不能定义为闭源与开源路线的成败。

综合以上,比较严谨地看待DeepSeek带给我们的惊喜,应该是:DeepSeek展示了模型架构底层创新的价值,不断提升了算力效率。并且,这一家架构的底层创新,推动了开源大模型产品在能力上的超越,从而将进一步提升行业整体的应用研发水平。

更重要的仍是“创新”本身

尽管比起人们热爱的传奇故事,上面的这个故事显得有些过于审慎无聊。但事实上,这样一个严谨的故事,更值得我们去探讨本文开篇的两句话:为什么是一家资金量不占优势的、专注于底层创新而非商业化的开源企业,创造了中国企业在大模型领域的一次“弯道超车”?

2024年8月,在接受媒体专访时,DeepSeek创始人梁文锋提及了团队的研发思路,“如果目标是做应用,那沿用LLaMA模型(LLaMA,是元宇宙平台公司,即Meta公开发布的产品)短平快上产品也是合理的,但我们的目的地是AGI(通用人工智能),这意味着我们需要研究新的模型结构,在有限资源下,实现更强的模型能力”。

这句话揭示了“奇迹”诞生的出发点:因为目标不同,所以方法不同,面对差距的态度也不同。

就在DeepSeek创造“行业奇迹”不久前,国内大模型行业的共识几乎仍然是“要做应用”,因为做通用大模型的机会已经没有了。一些明星创业企业更是放弃了对通用AGI的探索,转而借助现有的模型去研发应用。

在这种行业共识之下,我们所接触到的多数国产大模型企业,津津乐道的多数都是具体且仍不成熟的应用。如,多如牛毛的陪伴型AI聊天机器人,或是文生图、文生视频等“奇观展示”。

这并非刻意贬低应用层的研发努力,面对差距做策略性的舍弃,是正常的科技与商业选择。就连梁文锋自己也在访谈中承认,在模型结构和训练动力学上,国内的最高水平比起国外最高水平可能有一倍的差距,与此同时,数据效率上国内比起海外可能也有一倍的差距,两者相加,相当于国内要用四倍的算力才能取得同样的效果。

再加上复杂宏观环境下算力本身的成本差距。在这种现实下,多数企业选择了绕开这些差距,确实是一个直觉上可以理解的选项。

但DeepSeek选择的方向却显得反直觉和常识。既然资源差距大,那就干脆回到模型架构底层去创新和优化。而事实证明,这条路最终反而能更快地达成目标。

事实上,AGI的长期发展固然与算力成本息息相关,但AGI本身仍然处在不断迭代的过程之中。在科技创新之中,决定长期结果的固然是宏观环境、经济投入等底层基础,但在动态的创新发生过程中,更重要的或许仍旧是“创新”本身。

大模型已经火热许久,但时至今日,仍然不是简单的资源加总游戏,不是简单地囤更多算力就能快速实现突破,也不是谁更早拥有更多用户,有更多商业化的场景和赚钱的能力,就能笑到最后。而这正是那些曾经风光无二但却迅速退潮的企业所没有想明白的基础逻辑。

从这个更严谨的行业发展故事来看,DeepSeek的最大启发,是我们仍旧处在充满不确定性的创新探索周期里。而短视,恰恰是创新的最大敌人。坚持长期视角,专注底层创新,探索新的路径,比起融资、囤卡和商业化,更有可能获得最终的胜利。

撰稿 / 王晓凯(媒体人)

编辑 / 迟道华 马小龙

校对 / 赵琳


新京报评论,欢迎读者朋友投稿。投稿邮箱:xjbpl2009@sina.com评论选题须是机构媒体当天报道的新闻。来稿将择优发表,有稿酬。投稿请在邮件主题栏写明文章标题,并在文末按照我们的发稿规范,附上作者署名、身份职业、身份证号码、电话号码以及银行账户(包括户名、开户行支行名称)等信息,如用笔名,则需要备注真实姓名,以便发表后支付稿酬。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
东南亚人口拐卖最新套路:20万一个人,落地就被卖进园区!

东南亚人口拐卖最新套路:20万一个人,落地就被卖进园区!

命运自认幽默
2026-06-22 01:28:36
穆里尼奥:梅西夺冠让我相信足球之神!我从不信命,这次信了

穆里尼奥:梅西夺冠让我相信足球之神!我从不信命,这次信了

圣西罗的太阳
2026-06-26 12:02:51
惠州惠城区财政局副局长杨世祥主动投案

惠州惠城区财政局副局长杨世祥主动投案

南方都市报
2026-06-26 16:49:27
鲍鹏山:如果中国真的足够强大!我们没必要脆弱到那么害怕批评!

鲍鹏山:如果中国真的足够强大!我们没必要脆弱到那么害怕批评!

用冷眼洞悉世界
2026-06-24 00:44:14
白血病盯上小孩子!血液科提醒:家里久放的3类物品,千万小心

白血病盯上小孩子!血液科提醒:家里久放的3类物品,千万小心

一口娱乐
2026-06-26 09:43:23
Here we go!罗马诺:森林中场埃利奥特-安德森1.3亿镑加盟曼城

Here we go!罗马诺:森林中场埃利奥特-安德森1.3亿镑加盟曼城

懂球帝
2026-06-26 05:10:11
沪指跌幅扩大至2% 全市场超4500只个股下跌

沪指跌幅扩大至2% 全市场超4500只个股下跌

证券时报
2026-06-26 11:16:30
中方正式改口!不再称“日本政府”,新称呼直接挑明立场

中方正式改口!不再称“日本政府”,新称呼直接挑明立场

夏至陌离殇
2026-06-25 14:31:47
毛主席晚年为什么孤独,后世对他的评价,为什么越来越高

毛主席晚年为什么孤独,后世对他的评价,为什么越来越高

阿鰤科普记录
2026-06-24 16:53:09
深夜,美军发起“斩首行动”,不到24小时,特朗普宣布3个新决定

深夜,美军发起“斩首行动”,不到24小时,特朗普宣布3个新决定

新姐看世界
2026-06-26 15:26:47
武汉最著名的夜市街“变味”了?为什么升级改造后反倒没了人气?

武汉最著名的夜市街“变味”了?为什么升级改造后反倒没了人气?

吃货的分享
2026-06-26 16:16:39
国防部新闻发言人就近期涉军问题发布消息并答记者问

国防部新闻发言人就近期涉军问题发布消息并答记者问

新华社
2026-06-25 22:23:25
亚洲兄弟补刀+1,韩国再降2位!默契:澳大利亚0-0巴拉圭携手出线

亚洲兄弟补刀+1,韩国再降2位!默契:澳大利亚0-0巴拉圭携手出线

足球大腕
2026-06-26 13:07:41
这个小国比朝鲜还神秘,5毛一升油,水电全免费,却是女性的噩梦

这个小国比朝鲜还神秘,5毛一升油,水电全免费,却是女性的噩梦

抽象派大师
2026-06-26 00:56:10
“霉霉”被曝7月3日举办婚礼,纽约一街道将封锁3天;纽约市长表示“非常期待泰勒的婚礼”,警察局局长也表示要为“可能的婚礼”增派警力

“霉霉”被曝7月3日举办婚礼,纽约一街道将封锁3天;纽约市长表示“非常期待泰勒的婚礼”,警察局局长也表示要为“可能的婚礼”增派警力

鲁中晨报
2026-06-26 12:51:47
审计署抽查60县,平均每个县翻出10个亿问题资金

审计署抽查60县,平均每个县翻出10个亿问题资金

南方都市报
2026-06-25 12:17:33
快讯!关于日本的消息!

快讯!关于日本的消息!

故事终将光明磊落
2026-06-26 13:51:28
北平解放,韩复榘妻子打算逃往台湾,其子反对:杀父之仇不共戴天

北平解放,韩复榘妻子打算逃往台湾,其子反对:杀父之仇不共戴天

大运河时空
2026-06-26 16:30:03
摊牌了!马宁世界杯主裁喊停,不是吹黑哨,中国裁判组问题曝光

摊牌了!马宁世界杯主裁喊停,不是吹黑哨,中国裁判组问题曝光

老搽学科普
2026-06-26 05:39:16
天津市委原副秘书长孙建华被“双开”

天津市委原副秘书长孙建华被“双开”

界面新闻
2026-06-26 16:03:24
2026-06-26 19:52:49
新京报评论 incentive-icons
新京报评论
新京报评论唯一官方账号
23715文章数 113815关注度
往期回顾 全部

科技要闻

拿了500亿的梁文锋,只挖地基,不信销售

头条要闻

女子称遭性侵警方不予立案 内裤裆部和胸部检出男方DNA

头条要闻

女子称遭性侵警方不予立案 内裤裆部和胸部检出男方DNA

体育要闻

我在世界杯的每次奔跑,都为了证明你没看错

娱乐要闻

玥儿不回北京,马筱梅解释后妈身份

财经要闻

悬在科技头上的达摩克利斯之剑

汽车要闻

老板们的新座驾!65万元起,尊界V800/V680开启预订

态度原创

时尚
亲子
艺术
健康
公开课

盛夏,才要穿出松弛感!

亲子要闻

对话南开大学教授、人口学者吴帆:怎样才是“好妈妈”

艺术要闻

王羲之《道德经》现身美国,这小楷登峰造极

“无糖汤圆”是否隐藏着健康陷阱?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版