网易首页 > 网易号 > 正文 申请入驻

最近有件比肩六代机首飞的事,撼动了整个西方科技界和财经界

0
分享至

  昨晚美股市场突遭猛烈抛售

  
有人讲外界关注中国六代机成功首飞传闻,被中国的六代机吓到了。

  有人讲是四川舰下水,意味着中国航母和类航母的巨大优势,中美在最高军事技术的斗争中,中国取得了压倒性胜利。

  有人讲是被中国宇树的机器人震撼了(而波士顿机器人被日本软银收购后又被转卖给了韩国现代)。

  其实上面这些都不是主要原因

  真实情况是号称AI界的拼多多!国产AI大模型DeepSeek-V3版本正式发布

  它不仅便宜,而且完全开源,仅需2000张GPU计算卡,两个月的训练时间就匹敌了美国OpenAI公司花费数百倍成本的最先进大模型GPT-4o,训练成本仅556万美元

  于是 这对大多数美国人的震惊程度真的不亚于中国六代机领先美国首飞,特别是那些对武器装备不感兴趣的老外们,他们把这件事称为“斯普尼特时刻”,这对美国经济和科技圈的影响也远远大于六代机首飞。

  其实这事真的挺震撼的,我们一个国产大模型能在世界上大杀四方。

  不仅训练成本比国外一众大模型低的离谱,效果还出奇的好。

  具体有多强呢?

  DeepSeek V3 是一个6710亿参数的开源大模型。

  作为对比,我们熟知的阿里开源的 Qwen 2.5 系列最大的模型参数量是720亿

  Meta开源的 Llama 3.1 系列最大的模型参数量是4050亿。

  重点来了,DeepSeek V3 在参数量如此巨大的情况下,只用了2048块 H800 GPU,花费了仅仅550万美金左右的训练成本,要知道,Llama 3.1 的训练成本是 DeepSeek V3 的11倍。

  而且,DeepSeek V3 在多个评测成绩排名上,不仅超越了 Qwen 2.5 和 Llama 3.1,甚至还能和最顶尖的闭源模型 GPT-4o 和 Claude-3.5-Sonnet 打打排位。

  简直强到离谱。

  OpenAI可是烧了几个亿才烧出 GPT-4o 这样逆天的模型,而 DeepSeek 只花了区区 550万,零头都不到。

  这还没完,DeepSeek 不仅把模型毫无保留地开源了,还发布了一份53页的技术报告,所有的细节掰开揉碎了给你讲清楚那种,生怕一众友商们学不会。

  因为以前从来没有论文,能把大模型的秘密解释得这么清楚。OpenAI弄出东西了,但是论文根本没说细节,云山雾罩的,背离了业界的开源传统。

  现在很多人以为美国干出了什么黑科技,其实不是,论文说的很清楚,就是这么弄出来的。

  DeepSeek没有选择「1→10」而逆向选择了「0→1」,其提出了一种崭新的MLA(一种新的多头潜在注意力机制)架构。

  也正是这种独特架构,其把显存占用降到了过去最常用的MHA架构的5%-13%。

  同时,它独创的DeepSeekMoESparse结构,也把计算量降到极致,所有这些最终促成了成本的下降,宣布了行业震惊的定价方案——API定价为每百万tokens输入1元、输出2元,价格显著低于当前市场上的其他同类产品。

  套用QLoRA一作大佬的话说,这模型简直“优雅”到家了!

  然而更抽象的是,如此厉害的大模型,竟然不是互联网科技巨头研发的,而是来自金融领域的头部量化——幻方量化。

  你看看国内做量化的,竟然能对模型训练的资金控制这么严,硬生生逼出来一个新一代模型了,远超一众大举投入数百亿的互联网公司

  几乎所有投资者圈层都在问:幻方De­e­p­s­e­ek v3只用了2048卡的H800,训练两个月就完成了。你们公司买了10万张卡,单集群万卡,都搞出什么成果来了?有人质疑Op­e­n­AI干什么去了。

  然后今天这些机构,大资金跑的比谁都快。

  因为在 DeepSeek V3 发布之前,所有人都以为大模型要做到顶流,一定要堆参数,堆GPU,大厂的军备竞赛变成了谁拥有最多的GPU,谁就是王者的氪金游戏。

  而 DeepSeek V3 告诉大家,在人工智能时代,我们仍然要比智慧,比创新,不是谁烧的钱多,谁就会赢得一切。

  假如DeepSeek V3 模型的训练这么节省显卡,且数据是真实准确的,那么意味着市场上的算力GPU卡已经过剩,英伟达卡在未来几年的出货量将会断崖下降。

  如果大家有兴趣的话,可以去他们官网试着玩一玩。

DeepSeek V3体验网址:https://chat.deepseek.com/

  看到这里,不少网友可能就会发出感叹:怪不得炒股赚不到钱,原来自己做交易的对手竟然是电脑,论计算,普通人怎么比得过电脑?

  还有网友直接将其比作是:核动力镰刀。

  不过,幻方量化此前曾多次澄清,探索AGI并不是用来炒股,是做 GTP 相关的大模型,与金融无关。

  相反,正是由于2024年10月,监管政策加近期市场环境的变化,幻方认为中性量化策略不赚钱,逐步降低仓位,缩减私募规模至200~300亿。如下新闻记录。

  不搞量化了,这么多卡用来干啥呢?

  于是,幻方的deepseek大模型横空出世。

  目前老美的科创能力还是很坚实和领先的。咱这边局部赶上了一些。但还有差距。

  正如DeepSeek创始人梁文峰所说:「中国也要逐步成为贡献者,而不是一直搭便车。」

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美媒感慨:若不是中国还在反抗特朗普,几乎全世界都向他投降了

美媒感慨:若不是中国还在反抗特朗普,几乎全世界都向他投降了

悦心知足
2026-02-21 23:03:46
各国远程弹道导弹对比

各国远程弹道导弹对比

衔春信
2026-03-06 04:51:49
一发瘫痪全美?美专家急喊中国停手,自己玩了60年却不让中国碰!

一发瘫痪全美?美专家急喊中国停手,自己玩了60年却不让中国碰!

李健政观察
2026-03-04 17:27:14
河南小伙在非洲16年,当地一夫多妻制,男人只用玩,女人挣钱养家

河南小伙在非洲16年,当地一夫多妻制,男人只用玩,女人挣钱养家

网络易不易
2026-02-08 11:32:05
有福之人,必有三缺:真正有福的人,一辈子有三缺,越少越有福

有福之人,必有三缺:真正有福的人,一辈子有三缺,越少越有福

金沛的国学笔记
2026-03-05 13:09:45
从普校英语专业到阿里AI灵魂, 离职被疯抢:林俊旸做对了什么?

从普校英语专业到阿里AI灵魂, 离职被疯抢:林俊旸做对了什么?

侃故事的阿庆
2026-03-05 16:35:50
为了访华,特朗普下死命令,台当局天塌了,对台军售出现新变数

为了访华,特朗普下死命令,台当局天塌了,对台军售出现新变数

起喜电影
2026-03-05 12:07:49
前申花外援炮轰斯卢茨基:伤愈1周便让我首发 与他交恶迫使我离队

前申花外援炮轰斯卢茨基:伤愈1周便让我首发 与他交恶迫使我离队

我爱英超
2026-03-05 19:22:17
特朗普下台压力增大,美两党罕见联手,以色列伤亡惨重

特朗普下台压力增大,美两党罕见联手,以色列伤亡惨重

倾世璃歌
2026-03-06 03:33:43
国务院令出台了:3月30日起正式实施,老坟、祖坟有新规了!

国务院令出台了:3月30日起正式实施,老坟、祖坟有新规了!

大静吖
2026-03-04 20:17:10
1949年傅作义任水利部长遭闲置,主席当面质问,周恩来听闻当即发火

1949年傅作义任水利部长遭闲置,主席当面质问,周恩来听闻当即发火

磊子讲史
2026-01-14 10:12:21
郑州供暖即将截止!4月起供暖规定有新变化!

郑州供暖即将截止!4月起供暖规定有新变化!

大象新闻
2026-03-05 11:47:13
75岁老人全新养老方式:不请保姆不去养老院,成本小老人舒心

75岁老人全新养老方式:不请保姆不去养老院,成本小老人舒心

孢木情感
2026-02-21 12:15:25
日本模特阿部夏树身材惹火,网友:这傲人胸围是真实存在的吗?

日本模特阿部夏树身材惹火,网友:这傲人胸围是真实存在的吗?

娱乐领航家
2026-03-02 19:00:03
成人奥斯卡,尺度全开,导演连最后的体面也不要了,此片杀疯了

成人奥斯卡,尺度全开,导演连最后的体面也不要了,此片杀疯了

棱镜电影
2026-03-04 15:25:35
美国空军部署 A-10 疣猪对地攻击机对伊朗进行第一轮打击

美国空军部署 A-10 疣猪对地攻击机对伊朗进行第一轮打击

深度Militaire
2026-03-04 10:42:27
伊朗发出警告:如果伊朗石油和天然气设施遭袭击,作为回应,该地区所有国家的油气设施都将被摧毁

伊朗发出警告:如果伊朗石油和天然气设施遭袭击,作为回应,该地区所有国家的油气设施都将被摧毁

大象新闻
2026-03-02 15:50:38
朝鲜姑娘远嫁广州,6年寄回200万,回家探亲傻眼了

朝鲜姑娘远嫁广州,6年寄回200万,回家探亲傻眼了

今日搞笑分享
2026-03-05 20:15:48
广东足球传奇,和容志行是好伙伴,曾任广东台,如今定居加拿大

广东足球传奇,和容志行是好伙伴,曾任广东台,如今定居加拿大

一盅情怀
2026-03-04 16:57:39
伊朗熔断,空战结束,百头蛇战争开始!

伊朗熔断,空战结束,百头蛇战争开始!

汉唐智库
2026-03-04 00:04:40
2026-03-06 05:43:00
许戈投资 incentive-icons
许戈投资
金融从业二十余载,大型金融机构,海外对冲基金从业经验,用人话谈财经,看不懂,是我的问题….
412文章数 184关注度
往期回顾 全部

科技要闻

独家|林俊旸辞职 我们和认识他的人聊了聊

头条要闻

伊朗:已作好准备应对美国地面行动

头条要闻

伊朗:已作好准备应对美国地面行动

体育要闻

不开玩笑,没人想在季后赛碰上黄蜂

娱乐要闻

谢娜下场撕薛之谦,张杰前女友爆猛料

财经要闻

“十五五”开局之年,这么干!

汽车要闻

15.98万元起 第三代领克03大尾翼版上市

态度原创

旅游
时尚
数码
公开课
军事航空

旅游要闻

云南兰坪向阳山坡长出“空中民宿”,两地共建现代农业产业园探路农文旅融合

显白的奶茶色,穿出春日味道

数码要闻

从光学玻璃到几何波导:肖特发布全系列AR光学方案

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

2026年中国国防预算增长7%

无障碍浏览 进入关怀版