网易首页 > 网易号 > 正文 申请入驻

DeepSeek新模型“MODEL1”曝光

iPhoneFold模型曝光

0
分享至

2026.01.21


本文字数:1454,阅读时长大约2分钟

作者 |第一财经 刘晓洁

题图 |AI生成

在DeepSeek-R1发布一周年之际,新模型“MODEL1”的项目名在开源社区悄然出现。近日,DeepSeek官方在GitHub更新了一系列FlashMLA代码,项目文件有数十处都提到了此前未公开的“MODEL1”大模型标识符。


在项目中,“MODEL1”标识符与已知的现有模型 “V32”(即 DeepSeek-V3.2)被并列提及。行业认为,根据代码上下文,“MODEL1”很可能代表一个不同于现有架构的新模型。但是具体是V4模型还是推理模型R2行业有不同的看法,也有开发者认为可能是V3系列的终极版。

FlashMLA是DeepSeek独创的、针对英伟达Hopper架构GPU深度优化的软件工具,是DeepSeek模型实现低成本、高性能的关键技术之一,可以在模型架构层面减少内存占用,最大化地利用GPU硬件。

根据开发者的分析,“MODEL1”与 “V32”在关键技术上存在区别,主要体现在键值(KV)缓存的布局、稀疏性处理方式以及对 FP8 数据格式的解码支持等方面。这些差异表明新架构可能在内存优化和计算效率上进行了针对性设计。

结合目前模型文件结构来看,“MODEL1”很可能已接近训练完成或推理部署阶段,正等待最终的权重冻结和测试验证。这意味着,新模型的上线时间越来越近了。


“如果我们能再迎来像DeepSeek那样的突破性时刻,那将是具有里程碑意义的。”有海外博主表示。也有网友期待DeepSeek的发布速度能够更快,这对开源社区来说是个好事。

此前已有报道称,DeepSeek将于2月发布新一代旗舰模型DeepSeek V4,且内部初步测试表明,V4在编程能力上超过了市场上的其他顶级模型。目前DeepSeek并未对此进行任何回应。但此次项目曝光或许也印证了传闻。

在近一个月里DeepSeek团队陆续发布了两篇技术论文,介绍了名为“优化残差连接(mHC)”的新训练方法,以及一种受生物学启发的 “AI记忆模块(Engram)”。业内猜测,DeepSeek正在开发中的新模型有可能会整合这些最新的研究成果。

DeepSeek在2024年12月推出旗舰模型V3,凭借高效的MoE架构确立了强大的综合性能基础。此后,又在2025年1月发布了推理模型R1,基于强化学习,在解决数学问题、代码编程等复杂推理任务上表现卓越。距离发布已经过去了一年,行业都在期待DeepSeek的下一代旗舰模型。

恰逢DeepSeek R1发布一周年,海外开源社区Hugging Face也发布了博客《“DeepSeek时刻”一周年》,回顾了中国AI力量在过去一年如何重塑全球开源生态。


文章指出,DeepSeek-R1是Hugging Face上获赞最多的模型。R1模型的开源不仅降低了推理技术、生产部署与心理三个门槛,更推动了国内公司在开源方向上形成非协同但高度一致的战略走向。

过去一年,百度、阿里巴巴、腾讯等巨头及月之暗面等初创公司大幅增加开源投入,中国模型在Hugging Face上的下载量已超越美国。尽管西方寻求替代方案,但全球众多初创企业和研究人员正逐渐依赖中国开发的开源模型作为基础,中国AI已深度嵌入全球供应链。

微信编辑| 苏小

第一财经持续追踪财经热点。若您掌握公司动态、行业趋势、金融事件等有价值的线索,欢迎提供。专用邮箱:bianjibu@yicai.com

(注:我们会对线索进行核实。您的隐私将严格保密。)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美颜效果真强大,美女把大叔整成了少年

美颜效果真强大,美女把大叔整成了少年

微微热评
2026-01-18 00:35:29
梁山108将其实分成5个山头,每个山头带头大哥是谁?哪拨最厉害?

梁山108将其实分成5个山头,每个山头带头大哥是谁?哪拨最厉害?

长风文史
2026-01-19 15:08:23
最懂蒋介石的侍卫长晚年直言:蒋最大的失误,就是接受雅尔塔协定

最懂蒋介石的侍卫长晚年直言:蒋最大的失误,就是接受雅尔塔协定

鹤羽说个事
2026-01-21 12:36:30
1990年,利比里亚总统多伊浑身赤裸地瘫坐在地上,他的十指被砍掉

1990年,利比里亚总统多伊浑身赤裸地瘫坐在地上,他的十指被砍掉

南权先生
2026-01-21 15:42:34
国台办:强烈谴责、依法追责、严惩不贷

国台办:强烈谴责、依法追责、严惩不贷

澎湃新闻
2026-01-21 12:03:04
亏损5亿元后,西贝完成新融资:老朋友新荣记张勇、阿里前合伙人胡晓明“火线救援”!贾国龙曾谈及理想的投资人:给钱,相信我

亏损5亿元后,西贝完成新融资:老朋友新荣记张勇、阿里前合伙人胡晓明“火线救援”!贾国龙曾谈及理想的投资人:给钱,相信我

每日经济新闻
2026-01-21 21:31:05
欧洲发生严重高铁事故,西方舆论罕见沉默,如果列车是中国制造?

欧洲发生严重高铁事故,西方舆论罕见沉默,如果列车是中国制造?

纪中百大事
2026-01-21 22:10:58
李亚鹏做梦也没想到,心中这口恶气竟让向太给出了,窦靖童没说谎

李亚鹏做梦也没想到,心中这口恶气竟让向太给出了,窦靖童没说谎

墨印斋
2026-01-18 21:54:20
2死3重伤!“1·23”邪教蛊惑自焚事件的悲剧始末——

2死3重伤!“1·23”邪教蛊惑自焚事件的悲剧始末——

中国反邪教
2026-01-21 09:16:11
招行、浦发成功将卫星送上太空!通过遥感技术,银行可远程实现对楼盘贷后风险的实时监测

招行、浦发成功将卫星送上太空!通过遥感技术,银行可远程实现对楼盘贷后风险的实时监测

每日经济新闻
2026-01-21 00:23:14
2026年1月开始,酒驾新规将正式实施,交警严查“隔夜酒驾”

2026年1月开始,酒驾新规将正式实施,交警严查“隔夜酒驾”

老特有话说
2026-01-21 03:25:03
大结局!国乒教练分配完成,王曼昱教练敲定,孙颖莎教练去青年队

大结局!国乒教练分配完成,王曼昱教练敲定,孙颖莎教练去青年队

曹说体育
2026-01-21 18:25:25
汽车圈“大地震”!比亚迪大将投奔行业巨头,叫嚣:三年内没对手

汽车圈“大地震”!比亚迪大将投奔行业巨头,叫嚣:三年内没对手

长星寄明月
2026-01-20 21:00:46
为啥猪肉放在案板上卖,牛肉却要挂着卖?肉贩子说出实情,终于明白了!

为啥猪肉放在案板上卖,牛肉却要挂着卖?肉贩子说出实情,终于明白了!

房产衫哥
2026-01-20 06:32:58
贝尔谈阿隆索:执掌皇马不用总布置战术,核心是搞定球队大牌

贝尔谈阿隆索:执掌皇马不用总布置战术,核心是搞定球队大牌

懂球帝
2026-01-21 22:55:53
茶叶是血糖杀手?医生警告:若想血糖正常,这几种茶不要多喝

茶叶是血糖杀手?医生警告:若想血糖正常,这几种茶不要多喝

王晓爱体彩
2026-01-20 00:33:28
回顾许家印被抓捕现场,奋力反抗,怒吼不已,被抓捕人员抬出去

回顾许家印被抓捕现场,奋力反抗,怒吼不已,被抓捕人员抬出去

干史人
2026-01-08 22:47:00
国乒男队重建,6人离队,新队长3选1,黑马或逆袭,王励勤期待

国乒男队重建,6人离队,新队长3选1,黑马或逆袭,王励勤期待

懂球社
2026-01-21 18:12:25
他是梁小龙的好兄弟,如今孤身一人隐居美国,好友去世也没有露面

他是梁小龙的好兄弟,如今孤身一人隐居美国,好友去世也没有露面

涵豆说娱
2026-01-19 11:21:55
数千万波斯人,不伺候阿塞拜疆权贵了?伊朗今夜,就是百年前清末

数千万波斯人,不伺候阿塞拜疆权贵了?伊朗今夜,就是百年前清末

南宗历史
2026-01-10 16:15:24
2026-01-22 08:07:00
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
242145文章数 621256关注度
往期回顾 全部

科技要闻

日系彩电时代“彻底落幕”

头条要闻

新房灌装燃气次日爆炸:夫妻重度烧伤 房子被毁成危房

头条要闻

新房灌装燃气次日爆炸:夫妻重度烧伤 房子被毁成危房

体育要闻

只会防守反击?不好意思,我们要踢决赛了

娱乐要闻

首位捐款的明星 苗圃现身嫣然医院捐款

财经要闻

丹麦打响第一枪 欧洲用资本保卫格陵兰岛

汽车要闻

2026款上汽大众朗逸正式上市 售价12.09万起

态度原创

亲子
本地
时尚
数码
公开课

亲子要闻

没想到小伙子也能用英语跟我对话了。他的发音比我标准,最后还知道来一句“Good job” 杨雪呀

本地新闻

云游辽宁|漫步千年小城晨昏,“康”复好心情

缔造仙女梦的人,去了天堂继续缝制星光✨

数码要闻

索尼发布首款耳挂式开放耳机LinkBuds Clip Open 支持“安静模式”

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版