网易首页 > 网易号 > 正文 申请入驻

历史时刻:DeepSeek GitHub星数超越OpenAI,仅用时两个月

0
分享至

机器之心报道

机器之心编辑部

开源 AI 世界的里程碑事件!

我们正在见证历史:DeepSeek 项目在全球最大代码托管平台 GitHub 上的 Star 量超过了 OpenAI。

截至本周五下午两点,DeepSeek 旗下热度最高的项目 DeepSeek-V3 大模型 Star 量已达 7.77 万,超越了同平台中 OpenAI 最热门项目。

DeepSeek 项目的星数还在以肉眼可见的速度增长。

去年 12 月 26 日,DeepSeek AI 开源了其最新混合专家(MoE)大语言模型 DeepSeek-V3,它立即成为通用语言模型的性能标杆,受到了全球 AI 社区热议。

DeepSeek-V3 模型引入了动态注意力机制(Dynamic Attention Mechanism),通过实时调整注意力权重优化文本生成质量。其 MoE 架构共包含 6710 亿参数,但每 Token 仅激活 370 亿参数,大幅降低了计算成本,训练成本仅为同类闭源模型的 1/20。

据技术报告介绍,DeepSeek-V3 的预训练过程只花费 266.4 万 H800 GPU Hours,再加上上下文扩展与后训练的训练共为 278.8 H800 GPU Hours(训练成本 557.6 万美元)。相较之下,Llama 3 的训练预算约为 3930 万 H100 GPU Hours。

图源:https://arxiv.org/pdf/2412.19437

随后在 1 月 23 日,DeepSeek 以 V3 为基础使用强化学习(Reinforcement Learning)驱动重构训练范式,提出了 DeepSeek-R1,彻底改变了开源 AI 世界。

DeepSeek R1 性能完全对标 OpenAI o1,与 DeepSeek V3 相比性能有大幅提升,其论文指出纯强化学习可以赋予 LLM 强推理能力,而无需大量监督微调,震动了 AI 业界。

从技术角度来看,DeepSeek 展示了国内科研团队的创新能力,并在 Scaling Laws 之后揭开了大模型发展的新范式,大幅降低了 AI 对算力的依赖,并用自我进化的方式平衡了数据优势。

R1 还支持将推理能力迁移至更小模型,为边缘计算和即时应用开辟了大量的可能性。

由于 OpenAI 自 GPT-3 起并未开源其基础 AI 大模型,目前 OpenAI 的热门开源项目包括 openai-cookbook,即使用 OpenAI API 完成常见任务的示例代码和指南;以及 Whisper,这是一个 2022 年 9 月开源的通用语音识别模型。

除此之外,同属开源大模型的 Llama 系列最高星数达到了 5.75 万,阿里云的 Qwen2.5 有 1.49 万 Star,零一万物的 Yi 有 7800 Star。

DeepSeek V3 和 R1 的推出仿佛为全球大模型社区打了一针强心剂,在 AI 研究领域,围绕 R1 核心强化学习方法 GRPO 的进一步研究已经出现。

DeepSeek 开源的策略也为应用创造了大量机会。目前虽然 DeepSeek App 官方报告正在受到高频次网络攻击,但仅在国内就有阿里云、华为云、腾讯云、百度智能云、360 数字安全、云轴科技等多个平台宣布上线了 DeepSeek 大模型,方便各路开发者调用。

在海外,英伟达、亚马逊和微软云服务也宣布接入了 DeepSeek R1。

DeepSeek 系列模型被公认为是目前最先进的大语言模型之一,随着技术开源的推动,我们或许将见证生成式 AI 更快的发展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
女人偷吃后晚上跟丈夫同房是什么体验?这位46岁出轨女人说出答案

女人偷吃后晚上跟丈夫同房是什么体验?这位46岁出轨女人说出答案

混音情感
2026-03-26 14:25:07
TVB四届视后主演新剧内地点击破亿!宣传遇突发状况,淡定应对显风范

TVB四届视后主演新剧内地点击破亿!宣传遇突发状况,淡定应对显风范

TVB剧评社
2026-03-26 22:37:56
韩媒臆想:中国队欢呼吧,国际足联同意他们替补世界杯

韩媒臆想:中国队欢呼吧,国际足联同意他们替补世界杯

体坛风之子
2026-03-26 07:00:06
三连冠后首度被主场球迷高呼下课,广东男篮近八年唯一无换帅球队

三连冠后首度被主场球迷高呼下课,广东男篮近八年唯一无换帅球队

狼叔评论
2026-03-26 18:02:06
伊朗发动第82波打击

伊朗发动第82波打击

闪电新闻
2026-03-26 18:32:07
伊朗伊斯兰革命卫队责令一艘擅自通过霍尔木兹海峡船只返航

伊朗伊斯兰革命卫队责令一艘擅自通过霍尔木兹海峡船只返航

财联社
2026-03-25 02:02:18
福气追着跑!三大生肖命中带财,2026一路顺遂财运旺到年底!

福气追着跑!三大生肖命中带财,2026一路顺遂财运旺到年底!

毅谈生肖
2026-03-26 11:31:20
原来他们是夫妻,《冬去春来》他又火了,不高不帅却娶了漂亮老婆

原来他们是夫妻,《冬去春来》他又火了,不高不帅却娶了漂亮老婆

趣味八卦
2026-03-25 17:34:15
油价降了!3月26日全国油价下调85元吨,4月7日油价将迎下跌!

油价降了!3月26日全国油价下调85元吨,4月7日油价将迎下跌!

沙雕小琳琳
2026-03-26 15:31:42
亿万国人破防了!90岁院士平静宣布,中国导弹从此没有任何死角!

亿万国人破防了!90岁院士平静宣布,中国导弹从此没有任何死角!

墨兰史书
2026-03-05 07:10:08
收评:三大指数均跌超1% 两市成交额跌破2万亿

收评:三大指数均跌超1% 两市成交额跌破2万亿

财联社
2026-03-26 15:02:09
别被“某音”前凸后翘的网红骗了

别被“某音”前凸后翘的网红骗了

健身S叔
2026-03-22 11:12:04
华裔女赌神赵苏茜:曾横扫美国赌场,一局赢下400万,33岁遭焚尸

华裔女赌神赵苏茜:曾横扫美国赌场,一局赢下400万,33岁遭焚尸

叹为观止易
2026-03-24 16:45:26
美军官揭露“爱国者”惨败原因:伊朗不讲武德用了几千架无人机!

美军官揭露“爱国者”惨败原因:伊朗不讲武德用了几千架无人机!

阿芒娱乐说
2026-03-27 00:16:22
国足决战库拉索 541阵型冲首胜 首发11人基本定9人 王钰栋或替补

国足决战库拉索 541阵型冲首胜 首发11人基本定9人 王钰栋或替补

男足的小球童
2026-03-26 17:47:27
51岁林志玲状态炸上热搜!岁月在她脸上按了暂停键?看完我服了

51岁林志玲状态炸上热搜!岁月在她脸上按了暂停键?看完我服了

时间巡查
2026-03-27 00:27:26
莱万最后1届世界杯悬了:波兰0-1输球就出局

莱万最后1届世界杯悬了:波兰0-1输球就出局

我是一个养虾人
2026-03-27 01:05:31
为什么闲鱼很多卖家只支持自提?网友:等你碰上到手刀的就老实了

为什么闲鱼很多卖家只支持自提?网友:等你碰上到手刀的就老实了

另子维爱读史
2026-03-22 22:34:48
她58岁仍是干净之身,至今没谈过恋爱,除非是最爱不然不会献身

她58岁仍是干净之身,至今没谈过恋爱,除非是最爱不然不会献身

小熊侃史
2026-02-15 07:30:10
不结婚怎么解决生理需求?33岁的女顶流杨紫,用六个字道破真相!

不结婚怎么解决生理需求?33岁的女顶流杨紫,用六个字道破真相!

丁丁鲤史纪
2026-03-08 16:53:30
2026-03-27 01:44:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12608文章数 142594关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

健康
亲子
数码
游戏
公开课

转头就晕的耳石症,能开车上班吗?

亲子要闻

看看把孩子吓得哈哈哈

数码要闻

英特尔发Q1.26版Arc Pro专业显卡驱动,支持B70 / B65显卡

PS1大IP游戏藏私货!成人手绘与盗版马里奥ROM塞满

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版