网易首页 > 网易号 > 正文 申请入驻

21观察│重新认识DeepSeek奇迹

0
分享至

21世纪经济报道记者孔海丽 北京报道

一支来自“中国的神秘力量”,一再震撼硅谷和华尔街,以算法打破了算力神话,重构AI叙事。

当地时间1月27日,美股芯片板块大幅调整,英伟达暴跌16.86%,创市值最大蒸发纪录;博通大跌逾17%,甲骨文下跌近14%,纳斯达克下挫3.07%。

很多投资者将这次的调整归因于DeepSeek的崛起。这家位于杭州的人工智能公司,最近推出了最新开源大模型R1,其性能直追OpenAI大模型o1。

该公司去年12月推出的大模型DeepSeek-V3,多项测试性能直追Anthropic的Claude-3.5和OpenAI的闭源模型GPT-4o,个别项目甚至有所超越。

正当一批AI分析师认为DeepSeek只聚焦于语言大模型而暂时放弃多模态模型时,该公司于1月28日发布了一款多模态大模型Janus-Pro,而该模型在图像生成基准测试中超过了OpenAI的DALL-E3。

最令硅谷震惊的是,DeepSeek的开源大模型,性能卓越,却是在更低成本、更短时间、更少算力的基础上实现的。V3和R1的训练成本均只有550万美元左右,不及Anthropic和OpenAI同类模型成本的十分之一。

1月27日,DeepSeek登顶苹果中国地区和美国地区应用商店免费App下载排行榜,超越了ChatGPT。

这当然是不折不扣的奇迹。

美国总统特朗普当地时间27日在佛罗里达州迈阿密举行的共和党会议上表示,中国人工智能初创公司DeepSeek的崛起应当为美国企业敲响“警钟”,“这可能是非常积极的发展。因此,与其投入数十亿资金,不如花费更少的(资源),但愿能得出同样的解决方案。”

人工智能国际大佬又是如何看待这一奇迹?

微软首席执行官萨蒂亚·纳德拉(Satya Nadella)在世界经济论坛上谈到DeepSeek时表示:“DeepSeek的新模型令人印象深刻,他们不仅有效地构建了一个开源模型,能够在推理计算时高效运行,而且在计算效率方面表现出色。我们必须非常非常认真地对待中国的AI进步。”

创立于2022年的Perplexity,估值90亿美元,是仅次于Anthropic和OpenAI等第一梯队的人工智能新创企业。近日,Perplexity首席执行官Aravind Srinivas(阿拉温德·斯里尼瓦斯)在一次访谈中详谈了对DeepSeek的看法。

斯里尼瓦斯表示,需求是发明之母。由于硬件资源条件受限,中国企业不得不寻找变通方案,最终,“他们(DeepSeek)以更高效、更低成本的方式开发了类似(Anthropic和OpenAI)的技术。这确实让人感到压力”。如果说Meta正在赶上OpenAI或Anthropic,那么同样的说法也可以用于中国赶上美国。

但是,为DeepSeek的成就感到兴奋自豪之余,也要对世界人工智能永不停歇的发展势头保持客观理性的认识,不可盲目自满。记者近期采访了多位国内专家和相关从业人员、投资者,关于DeepSeek现象,有以下共识:

其一,V3和R1的重大突破,并不能证明算力不重要。

近几年以OpenAI为代表的美国人工智能发展,是建立在更强的算力、更大的参数、更高的成本之上。某种程度上,它可称之为人工智能的“硅谷叙事”。这个粗放豪横的模式讲到极致,就是5000亿美元的星际之门计划。

但中国企业无法获得高性能的芯片,也没有那么多的资金。客观条件受限,只能在底层算力基础上进行架构、算法和数据利用方面的探索,在特定领域走出一条高效率、低成本的实用主义路子。

这条路子就是如浙江大学计算机博士、美国南加州大学访问学者傅聪所说的,在“后训练”过程中,通过学习CoT(思维链)的方式,一步一步推理得出结果,而不是直接预测答案,“这一方案,也是圈子内对OpenAI o1模型实现路径的猜测,而Deepseek用极快的速度,验证了这一路径的可行性!”

事实上,DeepSeek创始人梁文锋透露,此前该公司已储备了万张A100芯片等。这比一般初创公司强多了。只不过,在开发V3和R1时,由于效率高,他们没有使用那么多算力罢了。

其二,英伟达等芯片股的调整,主要是市场风险的释放,与DeepSeek的重大突破之间,逻辑上没有必然联系。

以英伟达为代表的人工智能板块,已持续上涨几年。中间虽然偶有波动,但调整并不充分。英伟达PE长期横移在40倍上方,17日收盘后仍有45倍。

1月17日纳斯达克芯片股的大跌,更多是在高估值风险预期之下一种市场情绪的释放。DeepSeek只是提供或者触发了风险释放的媒介。现在没有证据表明,全球算力尤其是高端算力资源已经过剩。更大的可能是,如果2025年打开了人工智能应用的空间,算力需求也会随之增加,只不过,像DeepSeek这样高效率利用算力,将会被更多企业借鉴。AI硬件仍有很大的增长空间,算力叙事没有过时。

当地时间1月27日,英伟达发表声明表示,DeepSeek所取得的进展,显示出其芯片在中国市场的实用价值,且未来为满足DeepSeek的服务需求,将需要更多英伟达芯片。

其三,探索与追赶:中国企业的创新能力在增强。

梁文锋去年7月在接受媒体采访时说,硅谷习惯于将中国AI公司视为follow的角色,当一个中国公司以创新贡献者的身份,加入到他们游戏里去,而且表现优异时,他们就很震惊。

毫无疑问,在大模型开发路径上,DeepSeek扮演了一种创新者的角色,亦即低成本、少算力的高效集成之路。

作为追赶者,存在后发优势。1月26日,在拾象创始人兼CEO李广密组织的关于 DeepSeek的闭门讨论会上,专家提出,AI 类似阶跃函数,现在做追赶者的算力需求少了 10 倍。追赶者的算力成本一直不太高,但探索者还是要训很多模型。

后发者可以聪明地进行创新。举个例子。大模型开发需要庞大的数据集(数据库)。而数据有没有标注,其精确度是不一样的。前述专家透露,DeepSeek 非常重视数据标注,听说梁文锋自己也会打标签,这就大大提高了他们数据的精确度。再比如,DeepSeek还善于做数据蒸馏(优化筛选),当然如果是开发通用大模型就不能做数据蒸馏。这些都是‌该公司Post-training更高效率的体现。

DeepSeek给国内同行的其他启示还包括,大模型开发在降低成本的同时也可以探索智能的边界,在Transformer之外寻找其他架构;产品上,AI agent在未获得大规模应用之前,有很大的探索空间,存在多领域商用的机会,今年在多模态方面,可能会出现能挑战ChatGPT形态的产品。

硅谷一位华裔资深AI工程师对21世纪经济报道记者说,DeepSeek以低成本、高效率开发了几款了不起的产品,探索出了一条全新的路径,让国际同行也不得不佩服,但我们在自豪之余,也要客观认识到,DeepSeek等中国AI新创企业,目前还不具备全面挑战OpenAI、Anthropic这些巨头的实力。人工智能的竞争才刚刚开始,前面有无限可能。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
二百多名军官被枪毙、撤职、处分,长津湖战役中失职的志愿军88师

二百多名军官被枪毙、撤职、处分,长津湖战役中失职的志愿军88师

云霄纪史观
2026-03-25 12:16:14
沙特实战封神!中国“天盾”21发全中,15亿美制系统竟惨遭反杀

沙特实战封神!中国“天盾”21发全中,15亿美制系统竟惨遭反杀

素衣读史
2026-03-25 21:26:46
王毅判断没错,短短三天中方见识了:比利时的虚伪、西班牙的真诚

王毅判断没错,短短三天中方见识了:比利时的虚伪、西班牙的真诚

快看张同学
2026-03-26 10:19:39
巴蒂:马拉多纳离世时身边没有人,最后走得像条狗一样

巴蒂:马拉多纳离世时身边没有人,最后走得像条狗一样

懂球帝
2026-03-26 06:43:02
调查发现:若50岁前没患这4种疾病,以后患癌的几率或微乎其微?

调查发现:若50岁前没患这4种疾病,以后患癌的几率或微乎其微?

医学科普汇
2026-03-26 20:55:03
以色列收到1.28万份战火损失赔偿申请

以色列收到1.28万份战火损失赔偿申请

财联社
2026-03-26 23:22:07
卡尔森:坏了!原来小丑不是特朗普,而是我自己

卡尔森:坏了!原来小丑不是特朗普,而是我自己

朝廷心腹
2026-03-26 09:07:14
“大概有几十万”,重庆一小区有人高空撒钱,物业称捡回几大桶,撒钱者正配合调查

“大概有几十万”,重庆一小区有人高空撒钱,物业称捡回几大桶,撒钱者正配合调查

新京报
2026-03-26 20:41:35
我在小城市,一个人做电商,半年挣300万

我在小城市,一个人做电商,半年挣300万

南风窗
2026-03-26 10:07:51
特朗普称伊朗送上“价值连城大礼”:允许8艘油轮通过海峡

特朗普称伊朗送上“价值连城大礼”:允许8艘油轮通过海峡

Nee看
2026-03-27 00:39:12
这才叫杀疯了!烂番茄100%动作神片,这不直接碾压《镖人》?

这才叫杀疯了!烂番茄100%动作神片,这不直接碾压《镖人》?

动物奇奇怪怪
2026-03-26 17:48:01
森林狼逆火箭:申京努力了,然而杜兰特啊

森林狼逆火箭:申京努力了,然而杜兰特啊

张佳玮写字的地方
2026-03-26 13:03:18
怼得漂亮!伊朗外长:既然我们连领导层都没有了,还有什么好谈的

怼得漂亮!伊朗外长:既然我们连领导层都没有了,还有什么好谈的

南风不及你温柔
2026-03-26 14:07:38
曝张雪峰倒下30分钟后才被发现,饮食习惯糟糕,一口气吃8根雪糕

曝张雪峰倒下30分钟后才被发现,饮食习惯糟糕,一口气吃8根雪糕

古希腊掌管松饼的神
2026-03-25 11:08:46
日本公布中国游客免税店2月份消费数据,真的是打脸了!

日本公布中国游客免税店2月份消费数据,真的是打脸了!

消失的电波
2026-03-26 15:20:44
你在无意中发现别人什么秘密?网友爆料,电视剧都不敢这样演

你在无意中发现别人什么秘密?网友爆料,电视剧都不敢这样演

夜深爱杂谈
2026-03-16 22:21:03
“我用房子贷的款却进了他们口袋”,佛山一男子称遭遇套路贷;警方立案侦查,3人被批捕后取保候审

“我用房子贷的款却进了他们口袋”,佛山一男子称遭遇套路贷;警方立案侦查,3人被批捕后取保候审

大风新闻
2026-03-26 16:56:40
张晋血管堵80%差点闭眼,张雪峰却再没醒过来:有些努力真会要命

张晋血管堵80%差点闭眼,张雪峰却再没醒过来:有些努力真会要命

阿天爱旅行
2026-03-26 22:54:07
男子干活时摔成高位截瘫,妻子一看男子不能赚钱养家了,丢下男子和6岁的女儿跑了

男子干活时摔成高位截瘫,妻子一看男子不能赚钱养家了,丢下男子和6岁的女儿跑了

张晓磊
2026-03-26 11:22:06
曝张雪峰在苏州举办葬礼,生前最后一次直播,趴桌子上身体已不适

曝张雪峰在苏州举办葬礼,生前最后一次直播,趴桌子上身体已不适

180视角
2026-03-25 16:58:57
2026-03-27 01:19:00
21世纪经济报道 incentive-icons
21世纪经济报道
中国商业新闻领导者
239882文章数 743883关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

亲子
数码
旅游
公开课
军事航空

亲子要闻

看看把孩子吓得哈哈哈

数码要闻

英特尔发Q1.26版Arc Pro专业显卡驱动,支持B70 / B65显卡

旅游要闻

老外为羊拿铁扎堆魔都街头 法国游客花式夸上海

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版