网易首页 > 网易号 > 正文 申请入驻

最近有件比肩六代机首飞的事,撼动了整个西方科技界和财经界

0
分享至

  昨晚美股市场突遭猛烈抛售

  
有人讲外界关注中国六代机成功首飞传闻,被中国的六代机吓到了。

  有人讲是四川舰下水,意味着中国航母和类航母的巨大优势,中美在最高军事技术的斗争中,中国取得了压倒性胜利。

  有人讲是被中国宇树的机器人震撼了(而波士顿机器人被日本软银收购后又被转卖给了韩国现代)。

  其实上面这些都不是主要原因

  真实情况是号称AI界的拼多多!国产AI大模型DeepSeek-V3版本正式发布

  它不仅便宜,而且完全开源,仅需2000张GPU计算卡,两个月的训练时间就匹敌了美国OpenAI公司花费数百倍成本的最先进大模型GPT-4o,训练成本仅556万美元

  于是 这对大多数美国人的震惊程度真的不亚于中国六代机领先美国首飞,特别是那些对武器装备不感兴趣的老外们,他们把这件事称为“斯普尼特时刻”,这对美国经济和科技圈的影响也远远大于六代机首飞。

  其实这事真的挺震撼的,我们一个国产大模型能在世界上大杀四方。

  不仅训练成本比国外一众大模型低的离谱,效果还出奇的好。

  具体有多强呢?

  DeepSeek V3 是一个6710亿参数的开源大模型。

  作为对比,我们熟知的阿里开源的 Qwen 2.5 系列最大的模型参数量是720亿

  Meta开源的 Llama 3.1 系列最大的模型参数量是4050亿。

  重点来了,DeepSeek V3 在参数量如此巨大的情况下,只用了2048块 H800 GPU,花费了仅仅550万美金左右的训练成本,要知道,Llama 3.1 的训练成本是 DeepSeek V3 的11倍。

  而且,DeepSeek V3 在多个评测成绩排名上,不仅超越了 Qwen 2.5 和 Llama 3.1,甚至还能和最顶尖的闭源模型 GPT-4o 和 Claude-3.5-Sonnet 打打排位。

  简直强到离谱。

  OpenAI可是烧了几个亿才烧出 GPT-4o 这样逆天的模型,而 DeepSeek 只花了区区 550万,零头都不到。

  这还没完,DeepSeek 不仅把模型毫无保留地开源了,还发布了一份53页的技术报告,所有的细节掰开揉碎了给你讲清楚那种,生怕一众友商们学不会。

  因为以前从来没有论文,能把大模型的秘密解释得这么清楚。OpenAI弄出东西了,但是论文根本没说细节,云山雾罩的,背离了业界的开源传统。

  现在很多人以为美国干出了什么黑科技,其实不是,论文说的很清楚,就是这么弄出来的。

  DeepSeek没有选择「1→10」而逆向选择了「0→1」,其提出了一种崭新的MLA(一种新的多头潜在注意力机制)架构。

  也正是这种独特架构,其把显存占用降到了过去最常用的MHA架构的5%-13%。

  同时,它独创的DeepSeekMoESparse结构,也把计算量降到极致,所有这些最终促成了成本的下降,宣布了行业震惊的定价方案——API定价为每百万tokens输入1元、输出2元,价格显著低于当前市场上的其他同类产品。

  套用QLoRA一作大佬的话说,这模型简直“优雅”到家了!

  然而更抽象的是,如此厉害的大模型,竟然不是互联网科技巨头研发的,而是来自金融领域的头部量化——幻方量化。

  你看看国内做量化的,竟然能对模型训练的资金控制这么严,硬生生逼出来一个新一代模型了,远超一众大举投入数百亿的互联网公司

  几乎所有投资者圈层都在问:幻方De­e­p­s­e­ek v3只用了2048卡的H800,训练两个月就完成了。你们公司买了10万张卡,单集群万卡,都搞出什么成果来了?有人质疑Op­e­n­AI干什么去了。

  然后今天这些机构,大资金跑的比谁都快。

  因为在 DeepSeek V3 发布之前,所有人都以为大模型要做到顶流,一定要堆参数,堆GPU,大厂的军备竞赛变成了谁拥有最多的GPU,谁就是王者的氪金游戏。

  而 DeepSeek V3 告诉大家,在人工智能时代,我们仍然要比智慧,比创新,不是谁烧的钱多,谁就会赢得一切。

  假如DeepSeek V3 模型的训练这么节省显卡,且数据是真实准确的,那么意味着市场上的算力GPU卡已经过剩,英伟达卡在未来几年的出货量将会断崖下降。

  如果大家有兴趣的话,可以去他们官网试着玩一玩。

DeepSeek V3体验网址:https://chat.deepseek.com/

  看到这里,不少网友可能就会发出感叹:怪不得炒股赚不到钱,原来自己做交易的对手竟然是电脑,论计算,普通人怎么比得过电脑?

  还有网友直接将其比作是:核动力镰刀。

  不过,幻方量化此前曾多次澄清,探索AGI并不是用来炒股,是做 GTP 相关的大模型,与金融无关。

  相反,正是由于2024年10月,监管政策加近期市场环境的变化,幻方认为中性量化策略不赚钱,逐步降低仓位,缩减私募规模至200~300亿。如下新闻记录。

  不搞量化了,这么多卡用来干啥呢?

  于是,幻方的deepseek大模型横空出世。

  目前老美的科创能力还是很坚实和领先的。咱这边局部赶上了一些。但还有差距。

  正如DeepSeek创始人梁文峰所说:「中国也要逐步成为贡献者,而不是一直搭便车。」

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
随着法布雷加斯率队2-3,意大利杯决赛诞生1席,意甲领头羊率先晋级

随着法布雷加斯率队2-3,意大利杯决赛诞生1席,意甲领头羊率先晋级

侧身凌空斩
2026-04-22 05:03:46
李想怒喷日产的背后,藏着“增程帝国”崩塌的无能为力

李想怒喷日产的背后,藏着“增程帝国”崩塌的无能为力

少数派报告Report
2026-04-19 09:17:16
普京都惊叹:泰国女总理惨遭流亡,无路可退,竟当上中国董事长!

普京都惊叹:泰国女总理惨遭流亡,无路可退,竟当上中国董事长!

蓝色海边
2026-04-22 03:32:31
中国民航大学教师汪瑾去世,年仅56岁,去年刚刚退休,前同事称她深受学生爱戴

中国民航大学教师汪瑾去世,年仅56岁,去年刚刚退休,前同事称她深受学生爱戴

极目新闻
2026-04-21 17:39:34
观点:海港沦为保级队纯属技不如人,穆帅和全队终要为外援调整错误还债!

观点:海港沦为保级队纯属技不如人,穆帅和全队终要为外援调整错误还债!

上观新闻
2026-04-22 04:36:18
火狐把VPN塞进浏览器,免费午餐能吃吗?

火狐把VPN塞进浏览器,免费午餐能吃吗?

报错免疫体
2026-04-22 00:36:29
小伙80万元开面馆十几天倒闭,两年后40万开包子店,日营业额过万正筹备第二家门店

小伙80万元开面馆十几天倒闭,两年后40万开包子店,日营业额过万正筹备第二家门店

极目新闻
2026-04-21 13:34:19
日本7.7 级强震后,高市得罪 4 邻国,谁还愿救日本核电站?

日本7.7 级强震后,高市得罪 4 邻国,谁还愿救日本核电站?

眼界看视野
2026-04-21 09:49:11
伊朗明起恢复国内航班

伊朗明起恢复国内航班

财联社
2026-04-21 17:26:20
不是被炒而是辞职!老里弗斯再次回应下课:百分百是我自己的决定

不是被炒而是辞职!老里弗斯再次回应下课:百分百是我自己的决定

罗说NBA
2026-04-22 05:47:48
美日彻底慌了!日本军舰闯台海,中国解放军把军舰开到家门口!

美日彻底慌了!日本军舰闯台海,中国解放军把军舰开到家门口!

健身狂人
2026-04-21 11:59:49
金庸给了她最丑的脸,一身稀烂的武功,她却成了读者最想娶的女侠

金庸给了她最丑的脸,一身稀烂的武功,她却成了读者最想娶的女侠

耳东文史
2026-04-21 00:07:39
柳州火车“漏人”案:女乘客车厢离奇消失,乘警找到人后不敢靠近

柳州火车“漏人”案:女乘客车厢离奇消失,乘警找到人后不敢靠近

猫眼观史
2025-04-15 21:56:11
岳雨婷工作室发声明并道歉:第一时间向警方报案,已正式立案调查

岳雨婷工作室发声明并道歉:第一时间向警方报案,已正式立案调查

韩小娱
2026-04-22 05:50:19
演过了焦泊乔,眼神防守低级走步,事后吊儿郎当,这在报复杜锋?

演过了焦泊乔,眼神防守低级走步,事后吊儿郎当,这在报复杜锋?

后仰大风车
2026-04-21 08:20:13
骑士115-105击败猛龙!系列赛2-0,哈登创80年NBA纪录,前无古人

骑士115-105击败猛龙!系列赛2-0,哈登创80年NBA纪录,前无古人

篮球大视野
2026-04-21 09:53:34
这五个号码千万不要接,一旦接听,银行卡里的钱都可能秒没

这五个号码千万不要接,一旦接听,银行卡里的钱都可能秒没

笑熬浆糊111
2026-04-20 00:05:15
在岸人民币汇率再创近三年来新高

在岸人民币汇率再创近三年来新高

北京商报
2026-04-21 18:44:17
睡一觉5万没了!全国多地爆发新型盗刷,睡前必查手机这4处

睡一觉5万没了!全国多地爆发新型盗刷,睡前必查手机这4处

洞见小能手
2026-04-20 16:03:26
15 年芭蕾功底的澳洲纯天然柔韧小姐姐Violet Grey下海

15 年芭蕾功底的澳洲纯天然柔韧小姐姐Violet Grey下海

吃瓜党二号头目
2026-04-20 08:23:16
2026-04-22 06:43:00
许戈投资 incentive-icons
许戈投资
金融从业二十余载,大型金融机构,海外对冲基金从业经验,用人话谈财经,看不懂,是我的问题….
443文章数 187关注度
往期回顾 全部

科技要闻

创造4万亿帝国、访华20次,库克留下了什么

头条要闻

三国取消飞航许可 赖清德无法窜访斯威士兰

头条要闻

三国取消飞航许可 赖清德无法窜访斯威士兰

体育要闻

一到NBA季后赛,四届DPOY就成了主角

娱乐要闻

宋承炫晒宝宝B超照,宣布老婆怀孕

财经要闻

现实是最大的荒诞:千亿平台的冲突始末

汽车要闻

全新坦克700正式上市 售价42.8万-50.8万元

态度原创

手机
旅游
亲子
时尚
教育

手机要闻

2999元杀疯了!卢伟冰回应REDMI K90 Max定价:亏损

旅游要闻

京城今春“滨水+”玩法迭代

亲子要闻

才六天的马宝宝,发这个视频没有别的意思,只是想骗你们生女儿而已

顶流复工,已判若两人

教育要闻

高考地理:区域协同发展的答题基本思路

无障碍浏览 进入关怀版