网易首页 > 网易号 > 正文 申请入驻

代码泄密!DeepSeek下一代“王炸”模型架构曝光

0
分享至

你有没有遇到过这种情况?

一款AI模型刚发布没多久,就被行业人士吹上了天,结果用了一段时间才发现,不过是换汤不换药的小升级。

说实话,我之前也是这样看待AI模型迭代的。

直到今天看到DeepSeek的新模型代码泄密,我才意识到,真正的技术革命可能要来了。


神秘的MODEL1

就在DeepSeek-R1发布一周年之际,来自DeepSeek的神秘新模型“MODEL1”悄然现身GitHub代码库。

多位社区开发者推测,MODEL1很可能正是DeepSeek内测中的V3终极版本(V4模型),也有人猜测它可能代表一个完全独立于V系列的新模型。

MODEL1:DeepSeek正在开发的下一代AI模型,采用全新架构和推理机制,可能在性能上实现质的飞跃。
全新的技术路径

这一名称不仅出现在SM90架构相关的.cu内核实例化文件中,还贯穿在多个针对FP8稀疏解码路径的模板定义与内存布局注释里。

更关键的是,据海外开发者推测,MODEL1的背后将是一整套新的推理机制、算子结构与底层内存配置,会与DeepSeek现有V3.2模型呈现出完全不同的技术路径。

就像从功能手机直接跳到智能手机,MODEL1带来的可能不是简单的性能提升,而是整个AI模型架构的革命。

三大核心突破


1. 动态Top-K稀疏推理

MODEL1引入了动态Top-K稀疏推理逻辑,通过一个可变的topk_length指针,允许模型在推理时根据token或请求动态决定参与计算的key数量。

这就像你去餐厅吃饭,服务员会根据你的口味偏好和当前库存,动态调整菜单推荐,而不是每次都给你看完整的菜单。

这种设计大大提升了计算资源的精细调度能力,让AI模型在处理复杂任务时更加高效。


2. 分离存储的KV缓存区

MODEL1还引入了额外的KV缓存区,提供了将系统提示与用户上下文分离存储的可能。

这就像你有两个笔记本,一个专门用来记录重要的系统设置,另一个用来记录日常的工作笔记。

这种设计为Agent架构或多段上下文场景提供了更好的支持,让AI模型在处理复杂任务时更加灵活。

3. 更严格的内存对齐要求

MODEL1对底层内存对齐和调度有更为严格的要求,其KV缓存的内存stride必须是576B的整数倍,区别于V3.2的656B。

这就像你在搭积木,每个积木的尺寸都必须精确到毫米,这样才能搭建出更加稳固和复杂的结构。

这种设计可能与其更复杂的运行时行为与动态缓存机制有关,让AI模型在处理大规模数据时更加稳定。

春节前后发布?

在更早的1月9日,外媒援引知情人士称,DeepSeek将于2月中旬,也就是春节前后发布其下一代模型,主打编程能力,并在内部测试中已经在多个基准上超越了Claude与GPT系列。

结合目前模型文件结构已覆盖64和128两个头维度、FP8稀疏解码路径已完成适配、内存规范已强制定义等迹象来看,MODEL1很可能已接近训练完成或推理部署阶段,正等待最终的权重冻结和测试验证。

开源格局将被改写?

恰逢DeepSeek R1发布一周年,Hugging Face官方博客也发布了特别文章《One Year Since the “DeepSeek Moment”》,系统回顾了过去一年中国开源社区的集体爆发。

文章称,R1模型的开源不仅降低了推理技术、生产部署与心理三个门槛,更推动了国内公司在开源方向上形成非协同但高度一致的战略走向。

从百度、字节跳动到月之暗面、智谱AI,各大机构在过去一年中陆续加入Hugging Face并发布高质量模型,在社区下载、点赞与引用榜单上频频登顶。

如今,距离R1发布仅一年,DeepSeek的“MODEL1”很有可能在系统架构、执行路径与推理机制上展现出全面超越V3.2的能力。

如果接下来如传闻所述在春节前后正式发布,DeepSeek或许将再次改写国内开源格局,也可能为全球前沿开源模型树立新的标杆。

一年前,DeepSeek R1的开源让我们看到了中国AI模型的潜力。

一年后,MODEL1的曝光让我们对中国AI模型的未来充满期待。

真正的技术革命,从来不是简单的参数堆砌,而是架构的创新和思维的突破。

你觉得MODEL1会带来哪些改变?评论区聊聊~

如果对你有帮助,点个在看让更多人看到吧

AI眼镜处于爆发前夜,有很多值得体验的好产品

欢迎大家进群一起交流使用心得!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2026年春节大反常!返乡潮突然遇冷,三大原因戳中亿万人的心声!

2026年春节大反常!返乡潮突然遇冷,三大原因戳中亿万人的心声!

老特有话说
2026-01-20 21:53:56
新加坡总理黄循财表示,绝不允许东方大国在新加坡争夺芯片资源

新加坡总理黄循财表示,绝不允许东方大国在新加坡争夺芯片资源

南权先生
2026-01-20 15:55:21
西班牙国防大臣:将参与北约集体决定的维和与安全行动

西班牙国防大臣:将参与北约集体决定的维和与安全行动

财联社
2026-01-22 01:36:05
第二个立陶宛?又一国家踩红线,邀赖清德访问,中方这次不会手软

第二个立陶宛?又一国家踩红线,邀赖清德访问,中方这次不会手软

近史谈
2026-01-20 18:48:58
1月21日俄乌最新:川普是那个“怪兽”吗?

1月21日俄乌最新:川普是那个“怪兽”吗?

西楼饮月
2026-01-21 21:06:52
新华社快讯:欧洲议会暂缓批准欧美贸易协议

新华社快讯:欧洲议会暂缓批准欧美贸易协议

新华社
2026-01-21 23:03:14
中国“四大名鱼”是指哪四种鱼?多数人只知道两种,你吃过几种?

中国“四大名鱼”是指哪四种鱼?多数人只知道两种,你吃过几种?

美食格物
2026-01-20 18:12:14
贾玲巴黎周“一脸男相”!不爱笑也没梨涡眼神犀利,梳大背头好酷

贾玲巴黎周“一脸男相”!不爱笑也没梨涡眼神犀利,梳大背头好酷

轩逸阿II
2026-01-20 07:54:29
最新确认!上海6家西贝门店已歇业,3店近1个月集中闭店!嘉定一店歇业与风波无关

最新确认!上海6家西贝门店已歇业,3店近1个月集中闭店!嘉定一店歇业与风波无关

尚虹桥
2026-01-21 15:41:22
广东三地市新任命副市长

广东三地市新任命副市长

南方都市报
2026-01-21 13:24:05
一场追悼会,戳穿向华强夫妇在香港的真实地位,原来李连杰没说谎

一场追悼会,戳穿向华强夫妇在香港的真实地位,原来李连杰没说谎

凡知
2026-01-21 17:14:40
广东一女子晒出自家烧钱家电,本以为是享受算完账却想哭太扎心了

广东一女子晒出自家烧钱家电,本以为是享受算完账却想哭太扎心了

好运常伴吾身
2026-01-19 20:12:08
四川两名省管干部同日被官宣落马!

四川两名省管干部同日被官宣落马!

中国青年报
2026-01-21 21:00:26
贝尔谈阿隆索:执掌皇马不用总布置战术,核心是搞定球队大牌

贝尔谈阿隆索:执掌皇马不用总布置战术,核心是搞定球队大牌

懂球帝
2026-01-21 22:55:53
上海一女子旅游后崩溃!花1.4万报精品团,离谱事件一件接一件…

上海一女子旅游后崩溃!花1.4万报精品团,离谱事件一件接一件…

黄河新闻网吕梁频道
2026-01-21 11:06:53
搞笑,文班亚马的马刺队友宣布,他的目标是成为世界第二防守球员

搞笑,文班亚马的马刺队友宣布,他的目标是成为世界第二防守球员

好火子
2026-01-22 02:41:11
俞敏洪开办“退休俱乐部”,针对50到75岁人群,推19.9元体验课,全程由80、90后年轻人做活动玩伴

俞敏洪开办“退休俱乐部”,针对50到75岁人群,推19.9元体验课,全程由80、90后年轻人做活动玩伴

每日经济新闻
2026-01-21 17:38:48
真是没想到,原来田朴珺没和王石睡在一起!她是单独睡一个房间…

真是没想到,原来田朴珺没和王石睡在一起!她是单独睡一个房间…

火山诗话
2026-01-20 06:43:44
遭长子开战「贝克汉首露面发声」! 吐无奈心声:允许孩子们去犯错

遭长子开战「贝克汉首露面发声」! 吐无奈心声:允许孩子们去犯错

ETtoday星光云
2026-01-21 12:18:16
孙悦自曝录春晚被冻伤,满脸通红引网友心疼

孙悦自曝录春晚被冻伤,满脸通红引网友心疼

红星新闻
2026-01-21 12:12:25
2026-01-22 03:07:00
前沿科技学习分享圈 incentive-icons
前沿科技学习分享圈
朝看花开满树红,暮看花落树还空。若将花比人间事,花与人间事一同。
1594文章数 369关注度
往期回顾 全部

科技要闻

给机器人做仿真训练 这家创企年营收破亿

头条要闻

特朗普称“美国拥有无人知晓的武器” 克宫回应

头条要闻

特朗普称“美国拥有无人知晓的武器” 克宫回应

体育要闻

只会防守反击?不好意思,我们要踢决赛了

娱乐要闻

首位捐款的明星 苗圃现身嫣然医院捐款

财经要闻

丹麦打响第一枪 欧洲用资本保卫格陵兰岛

汽车要闻

2026款上汽大众朗逸正式上市 售价12.09万起

态度原创

旅游
游戏
本地
教育
公开课

旅游要闻

不必跟风“杀猪宴”,乡村旅游没有“标准答案”|新京报专栏

《FF7RE》N2版M站均分90分:无一差评质量夯爆了

本地新闻

云游辽宁|漫步千年小城晨昏,“康”复好心情

教育要闻

来上课了——非谓语动词的难点:独立主格现象第1段

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版