网易首页 > 网易号 > 正文 申请入驻

利空英伟达?国产DeepSeek大模型震动全球AI圈,周末疯狂刷屏,量化私募巨头成功跨界AI!网名调侃:中国股民做出贡献

0
分享至

周末疯狂刷屏,来自国内量化私募巨头幻方量化的DeepSeek大模型的震动全球AI圈!

近日,DeepSeek公司宣布正式发布最新人工智能模型DeepSeek-R1,并同步开源模型权重。DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

DeepSeek-R1在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。数据显示,DeepSeek-R1在算法类代码场景(Codeforces)和知识类测试(GPQA、MMLU)中的得分略低于OpenAI o1,但在工程类代码场景(SWE-Bench Verified)、美国数学竞赛(AIME 2024, MATH)项目上,均超过了OpenAI o1 。

更重要的是,工作人员发现,在DeepSeek-R1-Zero自我学习的过程,随着时间的增加,该模型“涌现”出了复杂的行为,如自我反思、评估先前步骤、自发寻找替代方案的情况,还包括一次“尤里卡时刻”(“aha moment”)。“尤里卡时刻”指人类突然理解一个以前无法理解的问题或概念的某个时刻。

深度求索透露,这次“尤里卡”发生在DeepSeek-R1-Zero的的中间版本期间。当时工作人员惊奇地发现,在一道数学题中,该模型学会了使用拟人化的语气进行自我反思,并主动为问题分配了更多的时间进行重新思考。

震动全球AI圈

这一消息震动全球AI圈,美国AI公司研究人员对中国大模型技术感到吃惊。

在最近两天DeepSeek-R1引发海外广泛讨论后,目前DeepSeek在苹果App Store应用商店美区免费榜排行第六,超越Google Gemini、Microsoft Copilot等美国生成式AI产品。今日有网友反映,DeepSeek崩了,提示服务器繁忙。

一位Meta的工程师在美国科技公司员工社区Blind中这样写道,“Meta的生成式AI部门正处于恐慌中。这一切始于DeepSeek,它使得 Llama 4 在基准测试中已经落后。雪上加霜的是:那个不知名的中国公司,仅有550万美元的训练预算。工程师们正在疯狂地剖析DeepSeek,并试图从中复制一切可能的东西。”

”英伟达高级研究科学家Jim Fan表示,DeepSeek-R1可能是第一个展示了RL(强化学习)飞轮可发挥作用且能带来持续增长的OSS(开源软件)项目。加利福尼亚大学伯克利分校教授Alex Dimakis则称,DeepSeek似乎是奔赴OpenAI最初使命的“最佳人选”,其他公司需要迎头赶上。

硅谷风投A16Z创始人Marc Andreessen也发表评论称,DeepSeek-R1是他见过的最令人惊叹且令人印象深刻的一个突破,作为开源的模型,它的面世给世界带来了一份礼物。

不过,“深度学习”三巨头之一、图灵奖得主、Meta AI首席科学家杨立昆表示,DeepSeek-R1面世与其说意味着中国公司在AI领域正在超越美国公司,不如说意味着开源大模型正在超越闭源。

训练成本大降,利空英伟达?

此外,值得注意的是DeepSeek-R1 API服务定价为每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens16元,输出API价格只有OpenAI o1的3%。低价背后,显然仍是秀肌肉,价格实力展现了技术实力——从AIInfra 层面降本的技术能力。

而训练成本一直是DeepSeek的一大优势。

在其12月底发布的DeepSeek-V3中,参数量为671B,激活参数为37B,使用的预训练token量为14.8万亿。其多项评测成绩超越了阿里的Qwen2.5-72B和MetadeLlama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

前OpenAI联创、知名AI科学家AndrejKarpathy在其个人社交平台上表示,DeepSeek-V3整个训练过程仅用了不到280万GPU小时,相比之下,Meta旗下顶尖的开源模型Llama-3405B的训练时长是3080万GPU小时。如果DeepSeekV3的优良表现能够得到广泛验证,那么这将是资源有限情况下对研究和工程的一次出色展示。若从成本上进行更直观的对比,假设H800的租金为每GPU小时2美元,DeepSeek-V3的总训练成本仅为600万美元不到,是Llama-3405B超6000万美元训练成本的十分之一不到。

对于深度求索强大的降本能力,“AI界的拼多多”呼声四起。

英伟达的竞争对手、知名半导体公司超微半导体(AMD)昨日发布消息称,已将DeepSeek-V3模型集成到AMD的芯片产品Instinct MI300X GPU上,该模型旨在与SGLang一起实现最佳性能。DeepSeek-V3针对Al推理进行了优化。业内人士分析称,AMD作为全球领先的芯片厂商,通过与DeepSeek合作将为AI推理带来新的想象空间,也有望动摇“英伟达+OpenAI”联合主导的行业格局,改变既有的游戏规则。

DeepSeek不仅将模型训练成本大幅降低,而且发布的新模型R1也同步开源模型权重,公开了完整训练细节,挑战了闭源系统的优势。随着DeepSeek将AI大模型技术及使用门槛降低,有市场人士担忧,DeepSeekR1的崛起可能会削弱市场对英伟达AI芯片需求的预期,对英伟达的市场地位和战略布局产生影响。

有观点认为,DeepSeek-V3极低的训练成本预示着AI大模型对算力投入的需求将大幅下降,这无疑将利空全球AI算力的核心供应商英伟达。

网名调侃:中国股民做出贡献

DeepSeek是国内量化巨头幻方量化的子公司。依靠DeepSeek的出色表现,量化巨头幻方量化创始人梁文锋也迅速奠定了在AI圈地位。

梁文锋本硕均就读于浙江大学信息与电子工程学专业。2015年,梁文锋与校友共同创立幻方量化。2021年,幻方量化成为国内首家突破千亿规模的的量化私募大厂,被称为国内量化私募“四大天王”之一。早年,幻方量化开始大规模布局 AI 算力,搭建起“萤火一号”集群。2021年,“萤火二号”落成,这给了DeepSeek快速奔跑的底层支撑。

对此,有人调侃,中国股民给世界AI最大的的贡献就是让幻方量化赚了那么多钱。然后幻方量化创始人有钱买最好的GPU,收纳一批中国最牛的精英,做出了不错的Deepseek。

本文源自:金融界

作者:大江大河

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
从2026年7月1日起,全国将强制执行退休返聘及超龄员工,好事呀!

从2026年7月1日起,全国将强制执行退休返聘及超龄员工,好事呀!

福建睿平
2026-07-02 07:47:57
森保一:我不知道韩国民众对韩国队的评价如何,他们已经尽力了

森保一:我不知道韩国民众对韩国队的评价如何,他们已经尽力了

懂球帝
2026-07-03 03:11:07
清华参观变“受辱现场”,宝妈带娃逛名校,却被食堂细节搞破防了

清华参观变“受辱现场”,宝妈带娃逛名校,却被食堂细节搞破防了

妍妍教育日记
2026-07-01 20:54:40
良机里有良“机”(“三农”观察)

良机里有良“机”(“三农”观察)

人民网
2026-07-02 06:26:39
先给C罗当绿叶,后跟梅西闹宫斗,南美足球先生照样生不逢时

先给C罗当绿叶,后跟梅西闹宫斗,南美足球先生照样生不逢时

足篮大世界
2026-07-02 22:32:48
“时间旅行者”现身 !美国男子自称穿越到2118年,还带回了照片

“时间旅行者”现身 !美国男子自称穿越到2118年,还带回了照片

译言
2026-07-02 06:53:57
紫牛头条|景区 NPC 与游客互动掰手腕致骨折,自己垫付医药费后被游客拉黑

紫牛头条|景区 NPC 与游客互动掰手腕致骨折,自己垫付医药费后被游客拉黑

扬子晚报
2026-07-03 07:25:03
凌晨美国大满贯4强出炉!3-1国乒两连胜,世界第二又“复活”了

凌晨美国大满贯4强出炉!3-1国乒两连胜,世界第二又“复活”了

傲傲讲历史
2026-07-03 04:07:06
大婚风波未过,香港政府“点名”霍启山,原来他和霍启刚处境一样

大婚风波未过,香港政府“点名”霍启山,原来他和霍启刚处境一样

乡野小珥
2026-07-03 04:00:44
詹姆斯387万底薪引争抢,掘金意外半路杀出

詹姆斯387万底薪引争抢,掘金意外半路杀出

格斗联盟王大锤
2026-07-03 09:21:09
玉米是血栓“凶手”?医生劝告:上了年纪的老人,这几物尽量少碰

玉米是血栓“凶手”?医生劝告:上了年纪的老人,这几物尽量少碰

岐黄传人孙大夫
2026-07-01 23:35:03
娱乐圈婆媳关系天花板,秦海璐用行动诠释什么是担当

娱乐圈婆媳关系天花板,秦海璐用行动诠释什么是担当

专扭杨过那条好胳膊
2026-07-02 15:30:15
青海海东一皮卡车超载侧翻,司机在内8人死亡,村民:遇难乘客均为五十多岁女性,受雇去药材地拔草,每天百来块钱,回家途中出事

青海海东一皮卡车超载侧翻,司机在内8人死亡,村民:遇难乘客均为五十多岁女性,受雇去药材地拔草,每天百来块钱,回家途中出事

大风新闻
2026-07-02 15:36:09
夜市当众“活春宫”!夫妻双双获刑25天,公共场合真不是你家卧室

夜市当众“活春宫”!夫妻双双获刑25天,公共场合真不是你家卧室

川渝视觉
2026-07-03 09:50:57
欧洲热成火炉,但日本以空调为代表的白色家电行业似乎已经凉透了

欧洲热成火炉,但日本以空调为代表的白色家电行业似乎已经凉透了

青陆
2026-07-02 15:45:57
颐和园、天坛有蛇出没?专家回应“北京公园的蛇好像变多了”

颐和园、天坛有蛇出没?专家回应“北京公园的蛇好像变多了”

极目新闻
2026-07-02 22:36:35
梅罗之争吵了十几年,一个小孩用两句话让甲亢哥闭嘴了

梅罗之争吵了十几年,一个小孩用两句话让甲亢哥闭嘴了

圣西罗的太阳
2026-07-03 08:32:18
曝韩红退出公益行业仅1天,再迎2大"噩耗",荒唐的一幕发生

曝韩红退出公益行业仅1天,再迎2大"噩耗",荒唐的一幕发生

不似少年游
2026-07-01 14:54:59
别被降价蒙蔽双眼!理想、蔚来、小鹏集体换二线电池,真相扎心了

别被降价蒙蔽双眼!理想、蔚来、小鹏集体换二线电池,真相扎心了

趣味萌宠的日常
2026-07-02 14:21:33
2026上半年电影总票房仅173亿元 暴跌超40%

2026上半年电影总票房仅173亿元 暴跌超40%

快科技
2026-06-30 21:49:05
2026-07-03 10:19:00
金融界 incentive-icons
金融界
投资者信赖的财经金融门户网站
9194706文章数 546586关注度
往期回顾 全部

科技要闻

特斯拉交付超预期7.4万辆,股价却大跌7.5%

头条要闻

葡萄牙2-1绝杀克罗地亚晋级 克罗地亚绝平球被判越位

头条要闻

葡萄牙2-1绝杀克罗地亚晋级 克罗地亚绝平球被判越位

体育要闻

韩国人,为什么恨透了洪明甫?

娱乐要闻

众星祝福祖国,曾沛慈原形毕露?

财经要闻

半导体涨价潮能持续多久?

汽车要闻

有纯电有增程 还有二代VLA支持 小鹏MONA L03预售价14.38万起

态度原创

家居
手机
旅游
健康
公开课

家居要闻

传奇筑 日常诗

手机要闻

探秘苹果iPhone电池生产线:iFixit亲手组装一块电池

旅游要闻

宁静澄澈!夏日喀拉托海湖的宝石蓝太美了

这4类消化病患者 吃粘食管住嘴

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版