网易首页 > 网易号 > 正文 申请入驻

不仅开源还便宜好用,硅谷员工直呼“火烧屁股”的DeepSeek大模型强在哪

0
分享至

国产大模型公司深度求索(DeepSeek)发布的最新AI(人工智能)大模型在海外引起开发者和投资者的热议。

1月20日,量化巨头幻方量化旗下大模型公司DeepSeek正式发布推理大模型DeepSeek-R1。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。目前,在国外大模型排名榜Chatbot Arena上,DeepSeek-R1的基准测试排名已经升至全类别大模型第三,与OpenAI的ChatGPT-4o最新版并列,并在风格控制类模型(StyleCtrl)分类中与OpenAI的o1模型并列第一。

更令市场惊讶的是,据DeepSeek介绍,R1的预训练费用只有557.6万美元,在2048块英伟达H800 GPU(针对中国市场的低配版GPU)集群上运行55天完成,仅是OpenAI GPT-4o模型训练成本的不到十分之一。DeepSeek表示,R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。此外,DeepSeek不仅将R1训练技术全部公开,还蒸馏了6个小模型向社区开源,允许用户借此训练其他模型。

开源模型正在赶超,比OpenAI便宜九成

一经推出,DeepSeek-R1便凭借其“物美价廉”的特性在海外开发者社区中引发了轰动。在API定价方面,DeepSeek R1服务对每百万输入token收取0.55美元,对每百万输出token收取2.19美元/百万,而OpenAI最新版o1模型的相应收费分别为15美元/百万和60美元/百万。在海外AI社区中小有名气的研究者Shubham Saboo表示,作为一款“100%开源”的模型,R1比OpenAI o1便宜96.4%,同时提供类似的性能,建议已经订阅ChatGPT的开发者“放弃沉没成本”。

除了性能方面的突出表现外,DeepSeek还给出了新的AI大模型搭建思路。英伟达高级研究科学家Jim Fan表示,DeepSeek-R1可能是“首个展示了RL(强化学习)飞轮可以发挥作用且能带来持续增长的OSS(开源软件)项目”。其中,“飞轮”用来形容AI系统中自我强化、正向循环的过程。DeepSeek的论文显示,不同于过去AI模型往往依赖于监督微调(SFT,指AI模型通过已标注的数据进行训练),R1完全由强化学习驱动,证明了直接强化学习是可行的。

Jim Fan写道:“我们正处于一个奇特的时间线上,一家非美国公司正在践行OpenAI最初的使命,即实现真正开放的前沿研究并让所有人受益。这种情况简直无法理解。最有娱乐性的结果却是可能性最大的结果。”

硅谷知名投资机构A16z的合伙人、Mistral AI董事会成员Anjney Midha表示:“从斯坦福到麻省理工,DeepSeek-R1几乎在一夜之间成为美国顶尖大学研究人员的首选模型。”德国马克斯·普朗克量子光学研究所AI科学家实验室负责人马里奥·克伦(Mario Krenn)也盛赞DeepSeek-R1的开放性,相比之下,OpenAI旗下的模型“本质上都是黑箱”。

凭借极低的训练成本,DeepSeek-R1也让华尔街和投资者感到了震撼。1月24日,参投过OpenAI、Databricks、Character.AI等知名企业的风险投资巨头安德森·霍洛维茨基金(Andreessen Horowitz)的联合创始人马克·安德森(Marc Andreesen)连转了几篇关于Deepseek-R1的推文,并对其进行了公开赞赏。他在X(原推特)平台上写道:“Deepseek R1是我见过的最令人惊叹和印象深刻的突破之一——作为开源项目,它是对世界的一份深刻馈赠。”

随后,法国企业家、推特意见领袖阿诺德·贝特朗(Arnaud Bertrand)转发了安德森的推文,并称中国AI的发展速度令人惊艳:“Deepseek时刻不仅是关于AI的,而是让世界意识到中国在技术和创新方面已经赶上了美国,并且在某些领域甚至超过了美国,尽管有人努力阻止这种情况的发生。”

在近日举办的2025年达沃斯论坛上,AI科技初创公司Scale AI创始人亚历山大·王(Alexandr Wang)表示,DeepSeek的AI大模型性能“大致与美国最好的模型相当”。去年12月,DeepSeek发布上一代模型V3后,Alexandr Wang就在X平台上评价道:“DeepSeek-V3带给外界的教训是:当美国人在休息时,中国人在工作,并以更便宜、更快、更强的产品迎头赶上。”

而Meta首席AI科学家杨立昆(Yann LeCun)指出,比起“中国AI超越了美国”的观点,DeepSeek-R1更重要的是证明了“开源模型正在超越专用模型”:“DeepSeek得益于开源研究和开源项目(例如PyTorch和来自Meta的Llama)。这就是开放研究与开源的力量。”

1月26日,360创始人周鸿祎发视频谈“中国大模型DeepSeek反超GPT”,称中美AI竞争“最终一定是中国胜利”,就像中国已经在制造业领域战胜了美国:“DeepSeek这家公司最近的表现简直逆天,我相信将来如果要对抗美国的AI技术霸权,中国大模型技术复仇者联盟战队里一定有DeepSeek的一份,因为这家公司和它的创始人非常低调,他们技术能力和未来前景被市场严重低估了。”

AI竞赛发展加速,“烧钱”潮流能否持续

同时,市场开始猜测,DeepSeek-R1的横空出世是否会影响一味“砸钱”投入AI竞赛的美国科技巨头们。分析指出,AI行业竞争或将以比预想中更快的速度加剧,并有可能影响到上游AI硬件企业的收入。

加州大学伯克利分校的AI政策研究员Ritwik Gupta表示,DeepSeek-R1的出现证明了“AI能力没有技术护城河”,并称“中国的系统工程师人才库比美国大得多,他们懂得如何充分利用计算资源来更高效地训练和运行模型”。

1月23日,一名Meta员工在匿名职场论坛Teamblind上发帖称,Meta内部已经因为DeepSeek-R1而进入“恐慌模式”。这位员工写道:“Meta的工程师们正在争分夺秒地分析DeepSeek,试图复制其中一切可能的技术,管理层正为生成式AI研发部门的巨额投入而发愁。”

该员工表示,DeepSeek-R1的训练成本不到550万美元,而Meta的生成式AI部门里“每位领导的薪资都超过了这个数字”:“(AI部门)本应是一个以工程为核心的小型组织,但因为很多人都想进来分一杯羹,人为膨胀了组织的规模,结果人人都是输家。”

随后,有认证为谷歌员工的网友回复上述言论称:“DeepSeek做的事情很疯狂。不仅是Meta,OpenAI、谷歌和Anthropic都因为他们而火烧屁股。这是一件好事,我们可以见证公开竞争对创新的推动作用。”

或许是因为感受到了竞争压力,Meta的CEO马克·扎克伯格(Mark Zuckerburg)于24日在旗下社交平台上表示,公司计划在2025年投资600亿至650亿美元用于资本支出,并计划大幅扩张AI团队。到2025年年底,Meta将拥有超过130万个GPU。扎克伯格称“今年将是AI的关键一年”,公司还将在路易斯安那州建设一座价值100亿美元的数据中心。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
当“李赔光” 遇上 “董圣人”:一场担当的照妖镜,照出了虚伪

当“李赔光” 遇上 “董圣人”:一场担当的照妖镜,照出了虚伪

橙星文娱
2026-04-04 12:40:45
美军为何大白天冒险深入伊朗腹地救大兵?若其被俘或直接改变战事结局

美军为何大白天冒险深入伊朗腹地救大兵?若其被俘或直接改变战事结局

红星新闻
2026-04-04 13:29:21
全网最不想火的鸡煲店,凭一句“劝退”爆火

全网最不想火的鸡煲店,凭一句“劝退”爆火

广东发布
2026-04-03 20:04:56
“我准备倒闭了!” 广东爆火鸡煲店老板再发声:我用的是冰冻鸡,别来了

“我准备倒闭了!” 广东爆火鸡煲店老板再发声:我用的是冰冻鸡,别来了

21世纪经济报道
2026-04-04 14:07:57
活捉飞行员!伊朗,更大筹码来了!

活捉飞行员!伊朗,更大筹码来了!

大嘴说天下
2026-04-04 21:56:07
阿根廷、阿联酋、卡塔尔、黎巴嫩、阿塞拜疆驱逐伊朗大使

阿根廷、阿联酋、卡塔尔、黎巴嫩、阿塞拜疆驱逐伊朗大使

桑未落
2026-04-04 10:14:55
生死36小时:美军特种兵突入伊朗营救被俘飞行员

生死36小时:美军特种兵突入伊朗营救被俘飞行员

凤眼论
2026-04-04 21:34:53
重庆官方通报广阳岛固定三角翼飞行器坠落,目击者:从头顶飞过,发动机声音有些不对,不到10秒就坠机了

重庆官方通报广阳岛固定三角翼飞行器坠落,目击者:从头顶飞过,发动机声音有些不对,不到10秒就坠机了

极目新闻
2026-04-04 19:19:00
出访大陆前,郑丽文拜访吴伯雄,吴伯雄一句话,让蒋万安无话可说

出访大陆前,郑丽文拜访吴伯雄,吴伯雄一句话,让蒋万安无话可说

DS北风
2026-04-04 13:30:07
抛弃中国,伊朗为何选择日本作为中间调停者

抛弃中国,伊朗为何选择日本作为中间调停者

民间胡扯老哥
2026-04-03 02:20:49
中超:上海海港2-1绝杀玉昆,积分“转正”,王燊超替补献绝杀

中超:上海海港2-1绝杀玉昆,积分“转正”,王燊超替补献绝杀

烧体坛
2026-04-04 21:45:05
24小时内,美军为营救飞行员,又损失4架战机

24小时内,美军为营救飞行员,又损失4架战机

兵国大事
2026-04-04 19:47:00
日本商家疑似抄袭霸王茶姬引争议!网友:因果报应...

日本商家疑似抄袭霸王茶姬引争议!网友:因果报应...

品牌新
2026-04-04 15:40:25
别什么东西都往豆包上发了,男子发私照让豆包评价身材,账号遭封禁:会有人审核,别乱发乱聊天

别什么东西都往豆包上发了,男子发私照让豆包评价身材,账号遭封禁:会有人审核,别乱发乱聊天

观威海
2026-04-04 16:15:03
继德国之后,英国也开始贴出“中文标语”?中国游客:不能够接受

继德国之后,英国也开始贴出“中文标语”?中国游客:不能够接受

潮鹿逐梦
2026-04-02 12:31:48
家暴打死老婆,他在行刑前尿了裤子:终于怕了

家暴打死老婆,他在行刑前尿了裤子:终于怕了

大道微言
2026-04-04 14:49:29
35岁数学家王虹再传喜讯:获纽约大学最高荣誉,成为该校“银教授”

35岁数学家王虹再传喜讯:获纽约大学最高荣誉,成为该校“银教授”

极目新闻
2026-04-04 16:28:10
美议员:公开外星人简报将让国家混乱,近两年5名顶尖科学家失踪或死亡恐与此有关

美议员:公开外星人简报将让国家混乱,近两年5名顶尖科学家失踪或死亡恐与此有关

红星新闻
2026-04-04 19:31:34
27岁单亲妈妈开直播,播着播着睡着了,醒来一看后台直接傻眼了

27岁单亲妈妈开直播,播着播着睡着了,醒来一看后台直接傻眼了

小椰的奶奶
2026-04-01 17:04:55
徐州“公厕版瑞幸”火出圈,景区工作人员回应:曾是游客服务点而非公厕

徐州“公厕版瑞幸”火出圈,景区工作人员回应:曾是游客服务点而非公厕

现代快报
2026-04-04 15:00:11
2026-04-05 02:27:00
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
887344文章数 5089471关注度
往期回顾 全部

科技要闻

内存一年涨四倍!国产手机厂商集体涨价

头条要闻

伊朗发动第七轮导弹袭击 耶路撒冷拦截导弹升空

头条要闻

伊朗发动第七轮导弹袭击 耶路撒冷拦截导弹升空

体育要闻

刹不住的泰格·伍兹,口袋里的两粒药丸

娱乐要闻

Q女士反击,否认逼宋宁峰张婉婷离婚

财经要闻

中微董事长,给半导体泼点冷水

汽车要闻

17万级海豹07EV 不仅续航长还有9分钟满电的快乐

态度原创

数码
家居
教育
公开课
军事航空

数码要闻

今年新款AirPods Pro、Apple TV值得等吗?升级方向曝光

家居要闻

温馨多元 爱的具象化

教育要闻

市教委最新数据出炉!小升初、初升高人数增幅过万!三大动向独家解读

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美军又一架战机坠毁 此前F-15E被击落

无障碍浏览 进入关怀版