网易首页 > 网易号 > 正文 申请入驻

利空英伟达?国产DeepSeek大模型震动全球AI圈,周末疯狂刷屏,量化私募巨头成功跨界AI!网名调侃:中国股民做出贡献

0
分享至

周末疯狂刷屏,来自国内量化私募巨头幻方量化的DeepSeek大模型的震动全球AI圈!

近日,DeepSeek公司宣布正式发布最新人工智能模型DeepSeek-R1,并同步开源模型权重。DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

DeepSeek-R1在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。数据显示,DeepSeek-R1在算法类代码场景(Codeforces)和知识类测试(GPQA、MMLU)中的得分略低于OpenAI o1,但在工程类代码场景(SWE-Bench Verified)、美国数学竞赛(AIME 2024, MATH)项目上,均超过了OpenAI o1 。

更重要的是,工作人员发现,在DeepSeek-R1-Zero自我学习的过程,随着时间的增加,该模型“涌现”出了复杂的行为,如自我反思、评估先前步骤、自发寻找替代方案的情况,还包括一次“尤里卡时刻”(“aha moment”)。“尤里卡时刻”指人类突然理解一个以前无法理解的问题或概念的某个时刻。

深度求索透露,这次“尤里卡”发生在DeepSeek-R1-Zero的的中间版本期间。当时工作人员惊奇地发现,在一道数学题中,该模型学会了使用拟人化的语气进行自我反思,并主动为问题分配了更多的时间进行重新思考。

震动全球AI圈

这一消息震动全球AI圈,美国AI公司研究人员对中国大模型技术感到吃惊。

在最近两天DeepSeek-R1引发海外广泛讨论后,目前DeepSeek在苹果App Store应用商店美区免费榜排行第六,超越Google Gemini、Microsoft Copilot等美国生成式AI产品。今日有网友反映,DeepSeek崩了,提示服务器繁忙。

一位Meta的工程师在美国科技公司员工社区Blind中这样写道,“Meta的生成式AI部门正处于恐慌中。这一切始于DeepSeek,它使得 Llama 4 在基准测试中已经落后。雪上加霜的是:那个不知名的中国公司,仅有550万美元的训练预算。工程师们正在疯狂地剖析DeepSeek,并试图从中复制一切可能的东西。”

”英伟达高级研究科学家Jim Fan表示,DeepSeek-R1可能是第一个展示了RL(强化学习)飞轮可发挥作用且能带来持续增长的OSS(开源软件)项目。加利福尼亚大学伯克利分校教授Alex Dimakis则称,DeepSeek似乎是奔赴OpenAI最初使命的“最佳人选”,其他公司需要迎头赶上。

硅谷风投A16Z创始人Marc Andreessen也发表评论称,DeepSeek-R1是他见过的最令人惊叹且令人印象深刻的一个突破,作为开源的模型,它的面世给世界带来了一份礼物。

不过,“深度学习”三巨头之一、图灵奖得主、Meta AI首席科学家杨立昆表示,DeepSeek-R1面世与其说意味着中国公司在AI领域正在超越美国公司,不如说意味着开源大模型正在超越闭源。

训练成本大降,利空英伟达?

此外,值得注意的是DeepSeek-R1 API服务定价为每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens16元,输出API价格只有OpenAI o1的3%。低价背后,显然仍是秀肌肉,价格实力展现了技术实力——从AIInfra 层面降本的技术能力。

而训练成本一直是DeepSeek的一大优势。

在其12月底发布的DeepSeek-V3中,参数量为671B,激活参数为37B,使用的预训练token量为14.8万亿。其多项评测成绩超越了阿里的Qwen2.5-72B和MetadeLlama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

前OpenAI联创、知名AI科学家AndrejKarpathy在其个人社交平台上表示,DeepSeek-V3整个训练过程仅用了不到280万GPU小时,相比之下,Meta旗下顶尖的开源模型Llama-3405B的训练时长是3080万GPU小时。如果DeepSeekV3的优良表现能够得到广泛验证,那么这将是资源有限情况下对研究和工程的一次出色展示。若从成本上进行更直观的对比,假设H800的租金为每GPU小时2美元,DeepSeek-V3的总训练成本仅为600万美元不到,是Llama-3405B超6000万美元训练成本的十分之一不到。

对于深度求索强大的降本能力,“AI界的拼多多”呼声四起。

英伟达的竞争对手、知名半导体公司超微半导体(AMD)昨日发布消息称,已将DeepSeek-V3模型集成到AMD的芯片产品Instinct MI300X GPU上,该模型旨在与SGLang一起实现最佳性能。DeepSeek-V3针对Al推理进行了优化。业内人士分析称,AMD作为全球领先的芯片厂商,通过与DeepSeek合作将为AI推理带来新的想象空间,也有望动摇“英伟达+OpenAI”联合主导的行业格局,改变既有的游戏规则。

DeepSeek不仅将模型训练成本大幅降低,而且发布的新模型R1也同步开源模型权重,公开了完整训练细节,挑战了闭源系统的优势。随着DeepSeek将AI大模型技术及使用门槛降低,有市场人士担忧,DeepSeekR1的崛起可能会削弱市场对英伟达AI芯片需求的预期,对英伟达的市场地位和战略布局产生影响。

有观点认为,DeepSeek-V3极低的训练成本预示着AI大模型对算力投入的需求将大幅下降,这无疑将利空全球AI算力的核心供应商英伟达。

网名调侃:中国股民做出贡献

DeepSeek是国内量化巨头幻方量化的子公司。依靠DeepSeek的出色表现,量化巨头幻方量化创始人梁文锋也迅速奠定了在AI圈地位。

梁文锋本硕均就读于浙江大学信息与电子工程学专业。2015年,梁文锋与校友共同创立幻方量化。2021年,幻方量化成为国内首家突破千亿规模的的量化私募大厂,被称为国内量化私募“四大天王”之一。早年,幻方量化开始大规模布局 AI 算力,搭建起“萤火一号”集群。2021年,“萤火二号”落成,这给了DeepSeek快速奔跑的底层支撑。

对此,有人调侃,中国股民给世界AI最大的的贡献就是让幻方量化赚了那么多钱。然后幻方量化创始人有钱买最好的GPU,收纳一批中国最牛的精英,做出了不错的Deepseek。

本文源自:金融界

作者:大江大河

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
上海市崇明区政协副主席张荣被查

上海市崇明区政协副主席张荣被查

新京报
2025-09-18 11:08:09
同一天内!广东8名干部被查!

同一天内!广东8名干部被查!

知肇分子
2025-09-18 22:42:01
全女野营卡式炉爆炸后:甩锅商家失败,神操作被还原,曝更多细节

全女野营卡式炉爆炸后:甩锅商家失败,神操作被还原,曝更多细节

奇思妙想草叶君
2025-09-17 23:23:58
“给钱也不卖中国”!日德联合断供高铁车轮,被中国规则彻底打脸

“给钱也不卖中国”!日德联合断供高铁车轮,被中国规则彻底打脸

石辰搞笑日常
2025-09-18 14:10:17
热议国安2-2河内:中超踢亚冠意义是什么?国安至少有态度

热议国安2-2河内:中超踢亚冠意义是什么?国安至少有态度

雷速体育
2025-09-18 22:59:09
高调离婚后又要复合?内娱第一笑话

高调离婚后又要复合?内娱第一笑话

创意社V
2025-09-04 10:46:45
朝鲜专列进京有多离谱?金正恩来中国为何坐火车不坐飞机?

朝鲜专列进京有多离谱?金正恩来中国为何坐火车不坐飞机?

诗意世界
2025-09-17 13:19:48
卫健委的这组数据,耐人寻味

卫健委的这组数据,耐人寻味

小萝卜丝
2025-09-17 09:54:40
日本右翼要气疯了!不是宝岛要收复,是日本民众都盼着看731真相

日本右翼要气疯了!不是宝岛要收复,是日本民众都盼着看731真相

青青子衿
2025-09-17 21:56:54
全红婵发育变壮事出有因:家族遗传基因改不了,妈妈+妹妹都很壮

全红婵发育变壮事出有因:家族遗传基因改不了,妈妈+妹妹都很壮

二哥聊球
2025-09-18 10:55:42
知情人曝:于朦胧妈妈陷入昏迷,醒来情绪不稳,聚会人员集资赔钱

知情人曝:于朦胧妈妈陷入昏迷,醒来情绪不稳,聚会人员集资赔钱

钺鉴
2025-09-18 16:12:03
A股:股民系好安全带,大资金明牌了,周五将迎来更大级别变盘?

A股:股民系好安全带,大资金明牌了,周五将迎来更大级别变盘?

小嵩
2025-09-18 16:00:21
国安噩梦开局!20岁门将判断失误,媒体人集体开炮:太业余

国安噩梦开局!20岁门将判断失误,媒体人集体开炮:太业余

奥拜尔
2025-09-18 20:37:16
北大副校长任羽中投案,曾是四川省文科状元

北大副校长任羽中投案,曾是四川省文科状元

人力资源报
2025-09-17 16:12:26
墙倒众人推!快船多名成员推动伦纳德离开球队,他们受够这人了!

墙倒众人推!快船多名成员推动伦纳德离开球队,他们受够这人了!

爱体育
2025-09-18 23:17:24
干得漂亮!战斗力爆表,1名乌军一天居然杀死了40名俄军……

干得漂亮!战斗力爆表,1名乌军一天居然杀死了40名俄军……

翻开历史和现实
2025-09-16 11:20:23
被白嫖了!重庆49岁大姐和小6岁男友处对象,3年转7万对方玩消失

被白嫖了!重庆49岁大姐和小6岁男友处对象,3年转7万对方玩消失

丫头舫
2025-09-17 20:29:53
排面拉满!穆帅亮相发布会,15名记者+21名摄影记者和摄影师静候

排面拉满!穆帅亮相发布会,15名记者+21名摄影记者和摄影师静候

直播吧
2025-09-18 22:44:02
95后UCLA女留学生张晓宁在联合国大楼前举牌并失控杀人

95后UCLA女留学生张晓宁在联合国大楼前举牌并失控杀人

霹雳炮
2025-09-17 22:55:12
中波双方谈完,波兰当着全球公布重大喜讯,美国想要的给了波兰

中波双方谈完,波兰当着全球公布重大喜讯,美国想要的给了波兰

卷史
2025-09-18 17:40:16
2025-09-19 00:31:00
金融界 incentive-icons
金融界
投资者信赖的财经金融门户网站
9194706文章数 545466关注度
往期回顾 全部

科技要闻

英伟达50亿美元投资英特尔,但代工免谈

头条要闻

男子8001元捡漏网拍劳力士后商家拒发货 起诉获赔7万

头条要闻

男子8001元捡漏网拍劳力士后商家拒发货 起诉获赔7万

体育要闻

身高170的他,让196的博尔特坐不住了

娱乐要闻

最美央视才女,甩掉孙红雷嫁给张嘉益

财经要闻

起底多校“发臭午餐”供应商绿捷

汽车要闻

女神代言/新增配色/智能升级 26款腾势N9售38.98万起

态度原创

旅游
家居
本地
健康
军事航空

旅游要闻

热闻|清明假期将至,热门目的地有哪些?

家居要闻

多维交集 简意雅情结合

本地新闻

云游中国|谁懂!在天下第一关拍到史诗感大片

内分泌科专家破解身高八大谣言

军事要闻

哈马斯高层在多哈遇袭后首次现身

无障碍浏览 进入关怀版