网易首页 > 网易号 > 正文 申请入驻

3 篇 Nature 重磅发布,DeepSeek 凭什么震撼全球?

0
分享至

最近,一家来自中国杭州的初创公司深度求索(DeepSeek)凭借发布的两款大语言模型(LLM),在全世界科技界掀起波澜,这两款模型的性能可与美国科技巨头开发的主流工具相媲美,但研发成本和所需算力却只是其一小部分。

2025 年 1 月 20 日,DeepSeek 发布了DeepSeek-R1,这是一个部分开源(训练数据未公开,因此并非完全开源)的“推理”模型,能够以与 OpenAI 于 2024 年年底发布的最先进的专注于“推理”的大语言模型GPT-o1相近的水平解决一些科学问题。

几天后的 1 月 28 日,DeepSeek 推出了另一款模型——Janus-Pro-7B,能够根据文本提示生成图像,也就是所谓的“文生图”,其性能与OpenAI 的DALL-E 3以及Stability AI 的Stable Diffusion相当。

国际顶尖学术期刊Nature在其官网连续发布了 3 篇文章报道DeepSeek。

美东时间1 月 30 日,Nature官网发布了题为:How China created AI model DeepSeek and shocked the world的头条新闻文章。

该文章分析了中国是如何创造出震惊世界的 AI模型DeepSeek,文章中指出,政策支持大量资金,以及大量的 AI 专业人才,帮助中国企业建立了先进的大语言模型。

如果 DeepSeek-R1 的表现让中国以外的许多人感到惊讶,但国内的研究人员表示,这家初创企业的成功在意料之中,也符合政府成为全球人工智能(AI)领导者的雄心。

中国科学院计算技术研究所副所长陈云霁研究员表示,鉴于中国在开发大语言模型的公司上投入了巨额风险资本,且拥有众多在科学、技术、工程或数学领域(包括人工智能)拥有博士学位的人才,像 DeepSeek 这样的公司在中国出现是不可避免的。即便不是 DeepSeek,中国也会有其他大语言模型能够做出一番成就。

事实上,也确实有。

1 月 29 日,科技巨头阿里巴巴发布了其迄今为止最先进的大语言模型——Qwen2.5-Max(通义千问旗舰版),并称其性能优于 GPT-4o、DeepSeek-V3 以及 Llama-3.1-405B。而上周,月之暗面联合字节跳动发布了新的推理模型

1月30 日,Nature发布了题为:China’s cheap, open AI model DeepSeek thrills scientists的新闻文章。

该文章指出,来自中国的便宜的、开放的 AI 模型 DeepSeek 让科学家们兴奋不已,DeepSeek-R1 执行推理任务的水平与 OpenAI 的 GPT o1 相当,而关键是,DeepSeek-R1 向研究人员开源。科学界认为,DeepSeek 的开放非常令人震惊,相比之下,OpenAI 推出的 GPT o1 以及最新成果 o3,基本上都是黑匣子。

当然,DeepSeek-R1 令人印象深刻的还包括其超低成本,DeepSeek 尚未公布训练 DeepSeek-R1 的全部成本,但据估计,训练 DeepSeek-R1 所需的算力租赁费用约为 600 万美元,相比之下,Meta 公司训练 Llama 3.1 405B 的算力是其 11 倍,训练成本超过 6000 万美元。尽管美国限制了中国公司获取用于人工智能的最先进的计算机芯片,但 DeepSeek-R1 还是成功了,这也说明了高效利用资源比单纯依靠计算规模更为重要。这也表明了美国在人工智能领域的建立的优势正在快速缩小。

此外,使用DeepSeek-R1界面的用户只需支付运行ChatGPT o1 费用的不到三十分之一(10美元 vs 370 美元)。此外,DeepSeek 还创建了 DeepSeek-R1 的迷你“蒸馏”版本,以便算力有限的研究人员也能使用该模型。

Kimi 1.5Kimi 1.51.5-pro,并称其在某些基准测试中的表现优于 GPT-o1。

1 月 29 日,Nature发布了题为:Scientists flock to DeepSeek: how they’re using the blockbuster AI model的新闻文章。

该文章指出,科学家们正在纷纷涌入 DeepSeek,从 AI 专家到数学家再到认知神经学家,他们为 DeepSeek-R1 的高性能和低成本所惊叹。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
哈登打了17年,他能实现1000胜的伟大纪录吗?结果很意外

哈登打了17年,他能实现1000胜的伟大纪录吗?结果很意外

大西体育
2026-04-07 21:36:02
利物浦血亏!7500 万欧弃将伯纳乌封神,红军肠子都悔青了

利物浦血亏!7500 万欧弃将伯纳乌封神,红军肠子都悔青了

澜归序
2026-04-08 05:16:19
纳指收涨0.1% 博通涨超6%

纳指收涨0.1% 博通涨超6%

财联社
2026-04-08 04:06:24
73岁迟重瑞近况:卖故宫旁自家房子,均价15万,陈丽华嫁他好福气

73岁迟重瑞近况:卖故宫旁自家房子,均价15万,陈丽华嫁他好福气

一娱三分地
2026-02-19 17:04:30
隐藏38亿年!人类首次捕捉到月球东方海,宇航员:完全超乎想象

隐藏38亿年!人类首次捕捉到月球东方海,宇航员:完全超乎想象

大卫聊科技
2026-04-07 12:57:55
国家一级女演员陈丽云被逮捕!

国家一级女演员陈丽云被逮捕!

许三岁
2026-03-28 09:24:30
守了13年麻将馆才敢说大实话:天天泡在牌桌上的人到底输掉了啥?

守了13年麻将馆才敢说大实话:天天泡在牌桌上的人到底输掉了啥?

刘哥谈体育
2026-04-07 16:56:24
总部人去楼空!上千家供应商被欠4亿货款,又一明星独角兽暴雷了

总部人去楼空!上千家供应商被欠4亿货款,又一明星独角兽暴雷了

品牌观察官
2026-04-06 17:45:34
A股,股民要做好心理准备,节后半月内,股市或将能重演15年历史

A股,股民要做好心理准备,节后半月内,股市或将能重演15年历史

笑熬浆糊111
2026-04-08 00:05:12
夏航季东航将采用国产大飞机C919执飞上海航线

夏航季东航将采用国产大飞机C919执飞上海航线

黑龙江新闻网
2026-04-06 22:32:19
最新!以军声明:大规模袭击

最新!以军声明:大规模袭击

环球时报国际
2026-04-07 20:05:22
吕迪格:在拜仁两个进球中,我们送了两次大礼

吕迪格:在拜仁两个进球中,我们送了两次大礼

懂球帝
2026-04-08 05:57:06
郑丽文穿香芋紫西装抵沪,一颗扣子引发全网热议,

郑丽文穿香芋紫西装抵沪,一颗扣子引发全网热议,

兰妮搞笑分享
2026-04-08 02:59:00
湖北发布社会公众风险提示:强对流来袭,局地有冰雹

湖北发布社会公众风险提示:强对流来袭,局地有冰雹

界面新闻
2026-04-07 13:32:37
欧冠晋级形势一夜大变:皇马落败,拜仁攻陷伯纳乌,阿森纳绝杀

欧冠晋级形势一夜大变:皇马落败,拜仁攻陷伯纳乌,阿森纳绝杀

足球狗说
2026-04-08 05:24:39
事故调查报告:湖南湘潭一致3死爆燃事故,公司负责人因盲目救火遇难

事故调查报告:湖南湘潭一致3死爆燃事故,公司负责人因盲目救火遇难

澎湃新闻
2026-04-07 17:04:26
美副总统万斯:美以已完成伊朗战争的军事目的 战争将很快结束

美副总统万斯:美以已完成伊朗战争的军事目的 战争将很快结束

财联社
2026-04-07 20:38:06
1-0!替补连线补时绝杀 欧冠八强战:12.3亿豪门掀翻大黑马止连败

1-0!替补连线补时绝杀 欧冠八强战:12.3亿豪门掀翻大黑马止连败

狍子歪解体坛
2026-04-08 05:02:35
2-1 欧冠8强战上演欧洲德比:神锋破门 六冠王客场复仇13.4亿豪门

2-1 欧冠8强战上演欧洲德比:神锋破门 六冠王客场复仇13.4亿豪门

狍子歪解体坛
2026-04-08 04:56:40
10万亿财政转移支付,被谁拿走了?

10万亿财政转移支付,被谁拿走了?

国民经略
2026-04-07 12:10:36
2026-04-08 06:15:00
会投稿的小钱编辑 incentive-icons
会投稿的小钱编辑
深耕论文,专著发表。交流:paperpass365
1706文章数 65关注度
往期回顾 全部

科技要闻

满嘴谎言!OpenAI奥特曼黑料大起底

头条要闻

特朗普:伊朗人愿为自由承受轰炸

头条要闻

特朗普:伊朗人愿为自由承受轰炸

体育要闻

阿韦洛亚:诺伊尔是本场最佳;我们会带着必胜的信念前往德国

娱乐要闻

女首富陈丽华离世 被曝生前已分好遗产

财经要闻

10万亿财政转移支付,被谁拿走了?

汽车要闻

不止是大 极狐首款MPV问道V9静态体验

态度原创

本地
时尚
教育
房产
公开课

本地新闻

跟着歌声游安徽,听古村回响

120元和120分钟,哪个更奢侈?

教育要闻

别再问“哪个专业最好”先问这3个问题!选错专业=毁四年#新学期超给力

房产要闻

重磅!三亚拟出安居房新政!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版