网易首页 > 网易号 > 正文 申请入驻

最近有件比肩六代机首飞的事,撼动了整个西方科技界和财经界

0
分享至

  昨晚美股市场突遭猛烈抛售

  
有人讲外界关注中国六代机成功首飞传闻,被中国的六代机吓到了。

  有人讲是四川舰下水,意味着中国航母和类航母的巨大优势,中美在最高军事技术的斗争中,中国取得了压倒性胜利。

  有人讲是被中国宇树的机器人震撼了(而波士顿机器人被日本软银收购后又被转卖给了韩国现代)。

  其实上面这些都不是主要原因

  真实情况是号称AI界的拼多多!国产AI大模型DeepSeek-V3版本正式发布

  它不仅便宜,而且完全开源,仅需2000张GPU计算卡,两个月的训练时间就匹敌了美国OpenAI公司花费数百倍成本的最先进大模型GPT-4o,训练成本仅556万美元

  于是 这对大多数美国人的震惊程度真的不亚于中国六代机领先美国首飞,特别是那些对武器装备不感兴趣的老外们,他们把这件事称为“斯普尼特时刻”,这对美国经济和科技圈的影响也远远大于六代机首飞。

  其实这事真的挺震撼的,我们一个国产大模型能在世界上大杀四方。

  不仅训练成本比国外一众大模型低的离谱,效果还出奇的好。

  具体有多强呢?

  DeepSeek V3 是一个6710亿参数的开源大模型。

  作为对比,我们熟知的阿里开源的 Qwen 2.5 系列最大的模型参数量是720亿

  Meta开源的 Llama 3.1 系列最大的模型参数量是4050亿。

  重点来了,DeepSeek V3 在参数量如此巨大的情况下,只用了2048块 H800 GPU,花费了仅仅550万美金左右的训练成本,要知道,Llama 3.1 的训练成本是 DeepSeek V3 的11倍。

  而且,DeepSeek V3 在多个评测成绩排名上,不仅超越了 Qwen 2.5 和 Llama 3.1,甚至还能和最顶尖的闭源模型 GPT-4o 和 Claude-3.5-Sonnet 打打排位。

  简直强到离谱。

  OpenAI可是烧了几个亿才烧出 GPT-4o 这样逆天的模型,而 DeepSeek 只花了区区 550万,零头都不到。

  这还没完,DeepSeek 不仅把模型毫无保留地开源了,还发布了一份53页的技术报告,所有的细节掰开揉碎了给你讲清楚那种,生怕一众友商们学不会。

  因为以前从来没有论文,能把大模型的秘密解释得这么清楚。OpenAI弄出东西了,但是论文根本没说细节,云山雾罩的,背离了业界的开源传统。

  现在很多人以为美国干出了什么黑科技,其实不是,论文说的很清楚,就是这么弄出来的。

  DeepSeek没有选择「1→10」而逆向选择了「0→1」,其提出了一种崭新的MLA(一种新的多头潜在注意力机制)架构。

  也正是这种独特架构,其把显存占用降到了过去最常用的MHA架构的5%-13%。

  同时,它独创的DeepSeekMoESparse结构,也把计算量降到极致,所有这些最终促成了成本的下降,宣布了行业震惊的定价方案——API定价为每百万tokens输入1元、输出2元,价格显著低于当前市场上的其他同类产品。

  套用QLoRA一作大佬的话说,这模型简直“优雅”到家了!

  然而更抽象的是,如此厉害的大模型,竟然不是互联网科技巨头研发的,而是来自金融领域的头部量化——幻方量化。

  你看看国内做量化的,竟然能对模型训练的资金控制这么严,硬生生逼出来一个新一代模型了,远超一众大举投入数百亿的互联网公司

  几乎所有投资者圈层都在问:幻方De­e­p­s­e­ek v3只用了2048卡的H800,训练两个月就完成了。你们公司买了10万张卡,单集群万卡,都搞出什么成果来了?有人质疑Op­e­n­AI干什么去了。

  然后今天这些机构,大资金跑的比谁都快。

  因为在 DeepSeek V3 发布之前,所有人都以为大模型要做到顶流,一定要堆参数,堆GPU,大厂的军备竞赛变成了谁拥有最多的GPU,谁就是王者的氪金游戏。

  而 DeepSeek V3 告诉大家,在人工智能时代,我们仍然要比智慧,比创新,不是谁烧的钱多,谁就会赢得一切。

  假如DeepSeek V3 模型的训练这么节省显卡,且数据是真实准确的,那么意味着市场上的算力GPU卡已经过剩,英伟达卡在未来几年的出货量将会断崖下降。

  如果大家有兴趣的话,可以去他们官网试着玩一玩。

DeepSeek V3体验网址:https://chat.deepseek.com/

  看到这里,不少网友可能就会发出感叹:怪不得炒股赚不到钱,原来自己做交易的对手竟然是电脑,论计算,普通人怎么比得过电脑?

  还有网友直接将其比作是:核动力镰刀。

  不过,幻方量化此前曾多次澄清,探索AGI并不是用来炒股,是做 GTP 相关的大模型,与金融无关。

  相反,正是由于2024年10月,监管政策加近期市场环境的变化,幻方认为中性量化策略不赚钱,逐步降低仓位,缩减私募规模至200~300亿。如下新闻记录。

  不搞量化了,这么多卡用来干啥呢?

  于是,幻方的deepseek大模型横空出世。

  目前老美的科创能力还是很坚实和领先的。咱这边局部赶上了一些。但还有差距。

  正如DeepSeek创始人梁文峰所说:「中国也要逐步成为贡献者,而不是一直搭便车。」

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
非史实:台州之战倭寇武士刀削铁如泥,戚继光却让战士用竹竿迎敌

非史实:台州之战倭寇武士刀削铁如泥,戚继光却让战士用竹竿迎敌

卡西莫多的故事
2026-01-09 10:58:46
美国人急眼了:我们垄断全球半个世纪,如今却被宁波一家小厂干翻

美国人急眼了:我们垄断全球半个世纪,如今却被宁波一家小厂干翻

三农老历
2026-01-16 12:48:21
1月16日今日金价:国际金价调整后,全国珠宝店黄金最新价格

1月16日今日金价:国际金价调整后,全国珠宝店黄金最新价格

蓝色海边
2026-01-17 04:23:50
精致的女人才懂这身打扮的含金量

精致的女人才懂这身打扮的含金量

美女穿搭分享
2026-01-13 12:06:20
一人出现疾病 四名宇航员提前返航 系NASA史上首次!

一人出现疾病 四名宇航员提前返航 系NASA史上首次!

每日经济新闻
2026-01-15 18:48:29
闫学晶一家三口现身机场!疑似遇到麻烦,老公不停打电话面露难色

闫学晶一家三口现身机场!疑似遇到麻烦,老公不停打电话面露难色

阿纂看事
2026-01-15 15:56:31
为什么许多中年人中年返贫?网友:就因为一次不理智投资!

为什么许多中年人中年返贫?网友:就因为一次不理智投资!

夜深爱杂谈
2026-01-16 19:18:25
泽连斯基怒怼特朗普:俄炸乌能源,和平协议早被普京撕毁!

泽连斯基怒怼特朗普:俄炸乌能源,和平协议早被普京撕毁!

奇思妙想生活家
2026-01-17 04:24:43
国家电网发布4万亿创纪录投资计划,重点方向明确

国家电网发布4万亿创纪录投资计划,重点方向明确

第一财经资讯
2026-01-16 08:40:44
正式申请被交易!多队有意却无人下手!真要砸手里了?

正式申请被交易!多队有意却无人下手!真要砸手里了?

阿浪的篮球故事
2026-01-16 17:35:15
冬窗花费破亿!曼城下一个引援目标曝光 曼联也想买他

冬窗花费破亿!曼城下一个引援目标曝光 曼联也想买他

球事百科吖
2026-01-17 05:10:30
老用户成“冤大头”?新号29元100G 老号89元不够用 3招破局不换号

老用户成“冤大头”?新号29元100G 老号89元不够用 3招破局不换号

Thurman在昆明
2026-01-03 15:59:21
20-14痛失好局!王祉怡2-1逆转日本名将,女单4强国羽占半壁江山

20-14痛失好局!王祉怡2-1逆转日本名将,女单4强国羽占半壁江山

钉钉陌上花开
2026-01-16 14:56:11
他从朝鲜载誉归却无职务,授衔获任海南军区司令,当场怀疑听错任命

他从朝鲜载誉归却无职务,授衔获任海南军区司令,当场怀疑听错任命

磊子讲史
2026-01-14 14:24:39
澜起科技:预计2025年年度净利润为21.5亿元~23.5亿元,较上年同期增长52.29%~66.46%

澜起科技:预计2025年年度净利润为21.5亿元~23.5亿元,较上年同期增长52.29%~66.46%

每日经济新闻
2026-01-16 18:43:08
中国将迎人口死亡高峰!22年1041万,23年1100万,去年死亡多少?

中国将迎人口死亡高峰!22年1041万,23年1100万,去年死亡多少?

长歌侃娱
2026-01-16 07:55:03
5块钱搞不定的8元套餐,在淘宝花8块4,一天就搞定了

5块钱搞不定的8元套餐,在淘宝花8块4,一天就搞定了

复转这些年
2026-01-16 23:51:17
摩根士丹利邢自强:中国每年理工科毕业生接近500万,超过欧洲和美国总和

摩根士丹利邢自强:中国每年理工科毕业生接近500万,超过欧洲和美国总和

新浪财经
2026-01-15 19:21:31
变革中的空中新交通——我国低空交通运输发展一线观察

变革中的空中新交通——我国低空交通运输发展一线观察

新华社
2026-01-15 18:21:15
离谱!朱媛媛去世不到一年,辛柏青高调官宣喜讯,恶心的一幕出现

离谱!朱媛媛去世不到一年,辛柏青高调官宣喜讯,恶心的一幕出现

喜欢历史的阿繁
2026-01-17 04:51:22
2026-01-17 05:44:49
许戈投资 incentive-icons
许戈投资
金融从业二十余载,大型金融机构,海外对冲基金从业经验,用人话谈财经,看不懂,是我的问题….
384文章数 165关注度
往期回顾 全部

科技要闻

贾国龙与罗永浩被禁言,微博CEO回应

头条要闻

罗永浩、贾国龙微博账号均被禁言

头条要闻

罗永浩、贾国龙微博账号均被禁言

体育要闻

全队身价=登贝莱,他们凭什么领跑法甲?

娱乐要闻

李湘翻车,早就有迹可循!

财经要闻

清流|酒店商家在携程和美团之间沦为炮灰

汽车要闻

方程豹品牌销量突破30万辆 2026年还将推出轿跑系列

态度原创

时尚
家居
游戏
公开课
军事航空

今年冬天最时髦保暖的4组搭配,照着穿美出新高度!

家居要闻

岁月柔情 现代品质轻奢

十三年后,《逆战:未来》想为所有逆行者们找回青春"/> 主站 商城 论坛 自运营 登录 注册 十三年后,《逆战:未来》想为所有逆行者们找回青春 廉颇 2...

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

欧洲多国向格陵兰岛派遣军事人员 白宫回应

无障碍浏览 进入关怀版