网易首页 > 网易号 > 正文 申请入驻

最近有件比肩六代机首飞的事,撼动了整个西方科技界和财经界

0
分享至

  昨晚美股市场突遭猛烈抛售

  
有人讲外界关注中国六代机成功首飞传闻,被中国的六代机吓到了。

  有人讲是四川舰下水,意味着中国航母和类航母的巨大优势,中美在最高军事技术的斗争中,中国取得了压倒性胜利。

  有人讲是被中国宇树的机器人震撼了(而波士顿机器人被日本软银收购后又被转卖给了韩国现代)。

  其实上面这些都不是主要原因

  真实情况是号称AI界的拼多多!国产AI大模型DeepSeek-V3版本正式发布

  它不仅便宜,而且完全开源,仅需2000张GPU计算卡,两个月的训练时间就匹敌了美国OpenAI公司花费数百倍成本的最先进大模型GPT-4o,训练成本仅556万美元

  于是 这对大多数美国人的震惊程度真的不亚于中国六代机领先美国首飞,特别是那些对武器装备不感兴趣的老外们,他们把这件事称为“斯普尼特时刻”,这对美国经济和科技圈的影响也远远大于六代机首飞。

  其实这事真的挺震撼的,我们一个国产大模型能在世界上大杀四方。

  不仅训练成本比国外一众大模型低的离谱,效果还出奇的好。

  具体有多强呢?

  DeepSeek V3 是一个6710亿参数的开源大模型。

  作为对比,我们熟知的阿里开源的 Qwen 2.5 系列最大的模型参数量是720亿

  Meta开源的 Llama 3.1 系列最大的模型参数量是4050亿。

  重点来了,DeepSeek V3 在参数量如此巨大的情况下,只用了2048块 H800 GPU,花费了仅仅550万美金左右的训练成本,要知道,Llama 3.1 的训练成本是 DeepSeek V3 的11倍。

  而且,DeepSeek V3 在多个评测成绩排名上,不仅超越了 Qwen 2.5 和 Llama 3.1,甚至还能和最顶尖的闭源模型 GPT-4o 和 Claude-3.5-Sonnet 打打排位。

  简直强到离谱。

  OpenAI可是烧了几个亿才烧出 GPT-4o 这样逆天的模型,而 DeepSeek 只花了区区 550万,零头都不到。

  这还没完,DeepSeek 不仅把模型毫无保留地开源了,还发布了一份53页的技术报告,所有的细节掰开揉碎了给你讲清楚那种,生怕一众友商们学不会。

  因为以前从来没有论文,能把大模型的秘密解释得这么清楚。OpenAI弄出东西了,但是论文根本没说细节,云山雾罩的,背离了业界的开源传统。

  现在很多人以为美国干出了什么黑科技,其实不是,论文说的很清楚,就是这么弄出来的。

  DeepSeek没有选择「1→10」而逆向选择了「0→1」,其提出了一种崭新的MLA(一种新的多头潜在注意力机制)架构。

  也正是这种独特架构,其把显存占用降到了过去最常用的MHA架构的5%-13%。

  同时,它独创的DeepSeekMoESparse结构,也把计算量降到极致,所有这些最终促成了成本的下降,宣布了行业震惊的定价方案——API定价为每百万tokens输入1元、输出2元,价格显著低于当前市场上的其他同类产品。

  套用QLoRA一作大佬的话说,这模型简直“优雅”到家了!

  然而更抽象的是,如此厉害的大模型,竟然不是互联网科技巨头研发的,而是来自金融领域的头部量化——幻方量化。

  你看看国内做量化的,竟然能对模型训练的资金控制这么严,硬生生逼出来一个新一代模型了,远超一众大举投入数百亿的互联网公司

  几乎所有投资者圈层都在问:幻方De­e­p­s­e­ek v3只用了2048卡的H800,训练两个月就完成了。你们公司买了10万张卡,单集群万卡,都搞出什么成果来了?有人质疑Op­e­n­AI干什么去了。

  然后今天这些机构,大资金跑的比谁都快。

  因为在 DeepSeek V3 发布之前,所有人都以为大模型要做到顶流,一定要堆参数,堆GPU,大厂的军备竞赛变成了谁拥有最多的GPU,谁就是王者的氪金游戏。

  而 DeepSeek V3 告诉大家,在人工智能时代,我们仍然要比智慧,比创新,不是谁烧的钱多,谁就会赢得一切。

  假如DeepSeek V3 模型的训练这么节省显卡,且数据是真实准确的,那么意味着市场上的算力GPU卡已经过剩,英伟达卡在未来几年的出货量将会断崖下降。

  如果大家有兴趣的话,可以去他们官网试着玩一玩。

DeepSeek V3体验网址:https://chat.deepseek.com/

  看到这里,不少网友可能就会发出感叹:怪不得炒股赚不到钱,原来自己做交易的对手竟然是电脑,论计算,普通人怎么比得过电脑?

  还有网友直接将其比作是:核动力镰刀。

  不过,幻方量化此前曾多次澄清,探索AGI并不是用来炒股,是做 GTP 相关的大模型,与金融无关。

  相反,正是由于2024年10月,监管政策加近期市场环境的变化,幻方认为中性量化策略不赚钱,逐步降低仓位,缩减私募规模至200~300亿。如下新闻记录。

  不搞量化了,这么多卡用来干啥呢?

  于是,幻方的deepseek大模型横空出世。

  目前老美的科创能力还是很坚实和领先的。咱这边局部赶上了一些。但还有差距。

  正如DeepSeek创始人梁文峰所说:「中国也要逐步成为贡献者,而不是一直搭便车。」

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
火箭110-105击败森林狼 球员评价:2人优秀,7人及格,戴维森低迷

火箭110-105击败森林狼 球员评价:2人优秀,7人及格,戴维森低迷

篮球资讯达人
2026-01-17 13:34:58
实践三十二号卫星发射失利

实践三十二号卫星发射失利

界面新闻
2026-01-17 10:24:41
失地不收是高明之策?被强占60年的藏南,为何成了印度的噩梦?

失地不收是高明之策?被强占60年的藏南,为何成了印度的噩梦?

素年文史
2026-01-17 10:40:57
美军上将大胆预言:解放军的统一之战,将以这个名义打响第一枪?

美军上将大胆预言:解放军的统一之战,将以这个名义打响第一枪?

真正能保护你的
2026-01-13 01:19:02
你永远不知道游戏里队友的现实职业有多离谱!网友:我队友是道士

你永远不知道游戏里队友的现实职业有多离谱!网友:我队友是道士

夜深爱杂谈
2026-01-15 20:22:21
清空的作品与破碎的公信力:军事专家李莉预测失灵背后的认知迷思

清空的作品与破碎的公信力:军事专家李莉预测失灵背后的认知迷思

老马拉车莫少装
2026-01-16 18:48:04
心酸!宁夏装死小羊晕倒原因解密,孩子衣服成关键线索,真相曝光

心酸!宁夏装死小羊晕倒原因解密,孩子衣服成关键线索,真相曝光

鋭娱之乐
2026-01-16 14:59:04
哈佛发现:高血脂不用治,治好都是误诊?告诉您5个血脂真相!

哈佛发现:高血脂不用治,治好都是误诊?告诉您5个血脂真相!

岐黄传人孙大夫
2026-01-08 10:06:20
立首功!台湾姑娘10人到呆呆家,一句“我们团圆了”,全网泪目

立首功!台湾姑娘10人到呆呆家,一句“我们团圆了”,全网泪目

李健政观察
2026-01-17 09:33:18
记者:申花队员对盖伊的印象就是“壮”,在身前就是一堵墙

记者:申花队员对盖伊的印象就是“壮”,在身前就是一堵墙

懂球帝
2026-01-16 22:32:30
铜价暴涨,“铜王”却倒了,王文银的坑比许家印还深?

铜价暴涨,“铜王”却倒了,王文银的坑比许家印还深?

保德全
2026-01-14 19:30:02
日本集体悼念聂卫平!棋圣小林光一:中国国民英雄 输给他后我剃发出家

日本集体悼念聂卫平!棋圣小林光一:中国国民英雄 输给他后我剃发出家

野渡舟山人
2026-01-16 09:52:00
美通告全球中方大幅抛售美债,特朗普打算动手,八国央行对美宣战

美通告全球中方大幅抛售美债,特朗普打算动手,八国央行对美宣战

墨兰史书
2026-01-16 15:25:03
杜兰特39+4+7无缘今日最佳球员!因为哈登31+2+10超神主导大逆转

杜兰特39+4+7无缘今日最佳球员!因为哈登31+2+10超神主导大逆转

Tracy的篮球博物馆
2026-01-17 14:08:46
广东佛山一中学103人感染诺如病毒,目前病情稳定!校方回应:这两天一直在消杀

广东佛山一中学103人感染诺如病毒,目前病情稳定!校方回应:这两天一直在消杀

潇湘晨报
2026-01-17 14:02:12
真能搞钱、真有搞头?!2026刚开年,新形态MMO就火了

真能搞钱、真有搞头?!2026刚开年,新形态MMO就火了

17173游戏网
2026-01-16 13:29:44
上海这一天:杨紫扛住了镜头,宋祖儿土出新花样,却被孙俪惊艳了

上海这一天:杨紫扛住了镜头,宋祖儿土出新花样,却被孙俪惊艳了

让心灵得以栖息
2026-01-16 23:47:47
日媒:随着春节临近,中国人赴日旅游的情况发生重大变化……

日媒:随着春节临近,中国人赴日旅游的情况发生重大变化……

日本物语
2026-01-15 21:08:14
中日德兰总监:胡荷韬让我印象深刻;留洋需要坚不可摧的意志

中日德兰总监:胡荷韬让我印象深刻;留洋需要坚不可摧的意志

懂球帝
2026-01-17 12:30:14
突发!证监会重磅会议定调,降温2.0在路上,下周要迎核弹级别行情?

突发!证监会重磅会议定调,降温2.0在路上,下周要迎核弹级别行情?

股市皆大事
2026-01-17 08:40:04
2026-01-17 15:19:00
许戈投资 incentive-icons
许戈投资
金融从业二十余载,大型金融机构,海外对冲基金从业经验,用人话谈财经,看不懂,是我的问题….
384文章数 165关注度
往期回顾 全部

科技要闻

8亿周活扛不住烧钱 ChatGPT终向广告"低头"

头条要闻

郑丽文喊话:国民党2026全台要像桃园一样全面胜利

头条要闻

郑丽文喊话:国民党2026全台要像桃园一样全面胜利

体育要闻

三巨头走了俩,联盟笑柄却起飞了

娱乐要闻

徐家还是爱孩子的,在马筱梅生产前选择和解

财经要闻

保不准,人民币会闪击6.8!

汽车要闻

林肯贾鸣镝:稳中求进,将精细化运营进行到底

态度原创

数码
手机
本地
教育
亲子

数码要闻

摩米士推出10000mAh半固态电池移动电源,支持25W无线快充

手机要闻

年度第二周排名,OPPO稳在第三,vivo稳在第四

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

教育要闻

“豆腐咋用2刀切8块?”家长质疑小学题目出错了,反被老师怼愣住

亲子要闻

养男孩的妈妈一定要保护好自己

无障碍浏览 进入关怀版