网易首页 > 网易号 > 正文 申请入驻

利空英伟达?国产DeepSeek大模型震动全球AI圈,周末疯狂刷屏,量化私募巨头成功跨界AI!网名调侃:中国股民做出贡献

0
分享至

周末疯狂刷屏,来自国内量化私募巨头幻方量化的DeepSeek大模型的震动全球AI圈!

近日,DeepSeek公司宣布正式发布最新人工智能模型DeepSeek-R1,并同步开源模型权重。DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

DeepSeek-R1在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。数据显示,DeepSeek-R1在算法类代码场景(Codeforces)和知识类测试(GPQA、MMLU)中的得分略低于OpenAI o1,但在工程类代码场景(SWE-Bench Verified)、美国数学竞赛(AIME 2024, MATH)项目上,均超过了OpenAI o1 。

更重要的是,工作人员发现,在DeepSeek-R1-Zero自我学习的过程,随着时间的增加,该模型“涌现”出了复杂的行为,如自我反思、评估先前步骤、自发寻找替代方案的情况,还包括一次“尤里卡时刻”(“aha moment”)。“尤里卡时刻”指人类突然理解一个以前无法理解的问题或概念的某个时刻。

深度求索透露,这次“尤里卡”发生在DeepSeek-R1-Zero的的中间版本期间。当时工作人员惊奇地发现,在一道数学题中,该模型学会了使用拟人化的语气进行自我反思,并主动为问题分配了更多的时间进行重新思考。

震动全球AI圈

这一消息震动全球AI圈,美国AI公司研究人员对中国大模型技术感到吃惊。

在最近两天DeepSeek-R1引发海外广泛讨论后,目前DeepSeek在苹果App Store应用商店美区免费榜排行第六,超越Google Gemini、Microsoft Copilot等美国生成式AI产品。今日有网友反映,DeepSeek崩了,提示服务器繁忙。

一位Meta的工程师在美国科技公司员工社区Blind中这样写道,“Meta的生成式AI部门正处于恐慌中。这一切始于DeepSeek,它使得 Llama 4 在基准测试中已经落后。雪上加霜的是:那个不知名的中国公司,仅有550万美元的训练预算。工程师们正在疯狂地剖析DeepSeek,并试图从中复制一切可能的东西。”

”英伟达高级研究科学家Jim Fan表示,DeepSeek-R1可能是第一个展示了RL(强化学习)飞轮可发挥作用且能带来持续增长的OSS(开源软件)项目。加利福尼亚大学伯克利分校教授Alex Dimakis则称,DeepSeek似乎是奔赴OpenAI最初使命的“最佳人选”,其他公司需要迎头赶上。

硅谷风投A16Z创始人Marc Andreessen也发表评论称,DeepSeek-R1是他见过的最令人惊叹且令人印象深刻的一个突破,作为开源的模型,它的面世给世界带来了一份礼物。

不过,“深度学习”三巨头之一、图灵奖得主、Meta AI首席科学家杨立昆表示,DeepSeek-R1面世与其说意味着中国公司在AI领域正在超越美国公司,不如说意味着开源大模型正在超越闭源。

训练成本大降,利空英伟达?

此外,值得注意的是DeepSeek-R1 API服务定价为每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens16元,输出API价格只有OpenAI o1的3%。低价背后,显然仍是秀肌肉,价格实力展现了技术实力——从AIInfra 层面降本的技术能力。

而训练成本一直是DeepSeek的一大优势。

在其12月底发布的DeepSeek-V3中,参数量为671B,激活参数为37B,使用的预训练token量为14.8万亿。其多项评测成绩超越了阿里的Qwen2.5-72B和MetadeLlama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

前OpenAI联创、知名AI科学家AndrejKarpathy在其个人社交平台上表示,DeepSeek-V3整个训练过程仅用了不到280万GPU小时,相比之下,Meta旗下顶尖的开源模型Llama-3405B的训练时长是3080万GPU小时。如果DeepSeekV3的优良表现能够得到广泛验证,那么这将是资源有限情况下对研究和工程的一次出色展示。若从成本上进行更直观的对比,假设H800的租金为每GPU小时2美元,DeepSeek-V3的总训练成本仅为600万美元不到,是Llama-3405B超6000万美元训练成本的十分之一不到。

对于深度求索强大的降本能力,“AI界的拼多多”呼声四起。

英伟达的竞争对手、知名半导体公司超微半导体(AMD)昨日发布消息称,已将DeepSeek-V3模型集成到AMD的芯片产品Instinct MI300X GPU上,该模型旨在与SGLang一起实现最佳性能。DeepSeek-V3针对Al推理进行了优化。业内人士分析称,AMD作为全球领先的芯片厂商,通过与DeepSeek合作将为AI推理带来新的想象空间,也有望动摇“英伟达+OpenAI”联合主导的行业格局,改变既有的游戏规则。

DeepSeek不仅将模型训练成本大幅降低,而且发布的新模型R1也同步开源模型权重,公开了完整训练细节,挑战了闭源系统的优势。随着DeepSeek将AI大模型技术及使用门槛降低,有市场人士担忧,DeepSeekR1的崛起可能会削弱市场对英伟达AI芯片需求的预期,对英伟达的市场地位和战略布局产生影响。

有观点认为,DeepSeek-V3极低的训练成本预示着AI大模型对算力投入的需求将大幅下降,这无疑将利空全球AI算力的核心供应商英伟达。

网名调侃:中国股民做出贡献

DeepSeek是国内量化巨头幻方量化的子公司。依靠DeepSeek的出色表现,量化巨头幻方量化创始人梁文锋也迅速奠定了在AI圈地位。

梁文锋本硕均就读于浙江大学信息与电子工程学专业。2015年,梁文锋与校友共同创立幻方量化。2021年,幻方量化成为国内首家突破千亿规模的的量化私募大厂,被称为国内量化私募“四大天王”之一。早年,幻方量化开始大规模布局 AI 算力,搭建起“萤火一号”集群。2021年,“萤火二号”落成,这给了DeepSeek快速奔跑的底层支撑。

对此,有人调侃,中国股民给世界AI最大的的贡献就是让幻方量化赚了那么多钱。然后幻方量化创始人有钱买最好的GPU,收纳一批中国最牛的精英,做出了不错的Deepseek。

本文源自:金融界

作者:大江大河

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
网友莫斯科遇见58岁伊能静与47岁秦昊,女方脸型紧致比男方还年轻

网友莫斯科遇见58岁伊能静与47岁秦昊,女方脸型紧致比男方还年轻

明星私服穿搭daily
2026-03-21 14:25:06
6月起,网约车司机超8小时高时长工作时代结束

6月起,网约车司机超8小时高时长工作时代结束

第一财经资讯
2026-03-30 19:50:14
都熟知西游记,那东游记、南游记、北游记,分别都是什么书?

都熟知西游记,那东游记、南游记、北游记,分别都是什么书?

长风文史
2026-03-27 16:31:57
2026,离职潮彻底消失了。

2026,离职潮彻底消失了。

老陆不老
2026-03-18 12:53:10
一个没有芯片的集装箱,凭啥垄断全球96%市场,连美国都造不起?

一个没有芯片的集装箱,凭啥垄断全球96%市场,连美国都造不起?

丁丁鲤史纪
2026-03-30 15:36:58
1-0大冷!中国女足扬眉吐气 掀翻英格兰 最新排名:亚洲占据前二

1-0大冷!中国女足扬眉吐气 掀翻英格兰 最新排名:亚洲占据前二

侃球熊弟
2026-03-31 07:25:18
网友遛娃偶遇何穗,她带孩子出门玩,儿子皮肤白像混血眉眼更像她

网友遛娃偶遇何穗,她带孩子出门玩,儿子皮肤白像混血眉眼更像她

老吴教育课堂
2026-03-31 03:13:30
彻底疯狂!以色列,亮出终极杀招了!

彻底疯狂!以色列,亮出终极杀招了!

大嘴说天下
2026-03-30 21:41:07
今日!CCTV5直播国乒出战世界杯 王楚钦VS约内斯库,张本智和亮相

今日!CCTV5直播国乒出战世界杯 王楚钦VS约内斯库,张本智和亮相

晚池
2026-03-31 03:04:42
释永信“开光”真相大白,过程不堪入目,易中天也被牵连

释永信“开光”真相大白,过程不堪入目,易中天也被牵连

往史过眼云烟
2026-03-24 17:05:24
缅甸在国庆阅兵式上展示了首批国产BTR-4U装甲战车

缅甸在国庆阅兵式上展示了首批国产BTR-4U装甲战车

深度Militaire
2026-03-31 07:51:00
中国大使参加摩洛哥国王宴会,士兵闯入开枪扫射,众人倒在血泊中

中国大使参加摩洛哥国王宴会,士兵闯入开枪扫射,众人倒在血泊中

百年历史老号
2024-04-02 19:37:39
7年败光数亿,55岁王中磊落魄,被迫拍短视频还债,儿子在美潇洒

7年败光数亿,55岁王中磊落魄,被迫拍短视频还债,儿子在美潇洒

以茶带书
2026-03-30 18:03:47
综述|日本有识之士指闯馆事件性质极为恶劣 要求日本政府立即向中方道歉

综述|日本有识之士指闯馆事件性质极为恶劣 要求日本政府立即向中方道歉

新华社
2026-03-30 20:41:47
联大投票揭晓:伊朗122国获压倒性胜利,英法德日弃权

联大投票揭晓:伊朗122国获压倒性胜利,英法德日弃权

花漾夜雨飘雪
2026-03-31 08:25:35
俄罗斯不卖油了!普京禁令一下,遭殃的不是欧洲,而是两个邻国

俄罗斯不卖油了!普京禁令一下,遭殃的不是欧洲,而是两个邻国

共工之锚
2026-03-31 00:08:35
吴向飞再回应李荣浩:这些年只要我参与的诉讼,最终对方全部败诉

吴向飞再回应李荣浩:这些年只要我参与的诉讼,最终对方全部败诉

小徐讲八卦
2026-03-30 07:47:00
杜月笙在河边钓鱼,遇到地痞要保护费,杜月笙:找你们老板过来

杜月笙在河边钓鱼,遇到地痞要保护费,杜月笙:找你们老板过来

千秋文化
2026-03-25 21:29:50
比赛还没开打,U23国足先遭遇3个致命坏消息,取胜越南队有点悬

比赛还没开打,U23国足先遭遇3个致命坏消息,取胜越南队有点悬

零度眼看球
2026-03-31 07:19:29
一人睡遍整个娱乐圈?司晓迪打响了2026年第一炮

一人睡遍整个娱乐圈?司晓迪打响了2026年第一炮

阅毒君
2026-01-05 07:05:06
2026-03-31 09:27:00
金融界 incentive-icons
金融界
投资者信赖的财经金融门户网站
9194706文章数 546126关注度
往期回顾 全部

科技要闻

尚未正式宣发,国行苹果AI半夜"意外闪现"

头条要闻

牛弹琴:中东新的大麻烦来了 特朗普又盯上了新目标

头条要闻

牛弹琴:中东新的大麻烦来了 特朗普又盯上了新目标

体育要闻

想进世界杯,意大利还要过他这一关

娱乐要闻

全红婵聊到体重哭了,每天只吃一顿饭

财经要闻

助贷被约谈背后:谁在「吞噬」你的借款?

汽车要闻

限时12.58万起 银河星耀8远航家系列上市

态度原创

亲子
旅游
健康
数码
军事航空

亲子要闻

孕期宝妈哭诉:丈夫突然被裁,每月房贷4500,天要塌了!

旅游要闻

山东肥城:赴一场桃花之约

干细胞抗衰4大误区,90%的人都中招

数码要闻

测试中!苹果自动音频切换将下放至第三方音频配件

军事要闻

第三艘航母出动数千名士兵抵达 美军大举增兵中东战场

无障碍浏览 进入关怀版