网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

DeepSeek联合北大提出Engram架构，突破Transformer记忆瓶颈

2026-01-13 10:08:27　来源: 硅星Breaknews

上海举报

0

分享至

品玩1月13日讯，据 36氪报道，DeepSeek与北京大学合作发布新论文，由Liang Wenfeng等作者提出“Engram”模块，旨在解决Transformer缺乏原生知识检索能力的核心缺陷。该方法引入“条件记忆”稀疏轴，通过现代化哈希N-gram嵌入，实现近似O(1)时间复杂度的确定性知识查找。

Engram将语言建模中的静态模式（如固定搭配、实体名称）交由可扩展查表模块处理，使主干网络专注组合推理任务。在27B参数规模下，其在等参数、等计算量条件下优于MoE基线。

研究团队发现MoE与Engram之间存在“U型缩放律”，需平衡计算与静态记忆资源配比。该技术有望集成至下一代V4模型，为稀疏大模型开辟新路径。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

核聚变大会？我这辈子能用上“人造太阳”发的电吗？

钛媒体APP 2026-01-14 11:27:31
1 跟贴 1
一块布，卡了英伟达的脖子？

华商韬略 2026-01-14 10:39:30
0 跟贴 0

Transformer作者：DeepSeek才有搞头，OpenAI指望不上了

量子位 2025-09-12 11:07:58
128 跟贴 128

中国专家发现B-21秘密，美国人的设计有明显缺陷？现在想改也晚了

軍武达人 2026-01-13 19:49:21
0 跟贴 0
私！贪！狂！洪礼和三个字总结自己违法犯罪之路

环球网资讯 2026-01-13 20:53:23
3858 跟贴 3858

受用一生的逻辑思维

小G侃商业 2026-01-12 23:58:06
38 跟贴 38

温州潮州房产预判，深入了解房产知识

王波说房 2026-01-14 00:10:59
0 跟贴 0
专家：特朗普没胆对华加税25% 否则等着中国反击

澎湃新闻 2026-01-14 14:18:54
3739 跟贴 3739

Sebastian Raschka 2026预测:Transformer统治依旧,扩散模型崛起

机器之心Pro 2026-01-14 14:41:17
0 跟贴 0
【爆火】妈妈把我的户口让给表妹后我和她断亲了沈悦林薇薇

平胸怪兽 2026-01-14 14:14:19
0 跟贴 0
自变量：具身模型不是把DeepSeek塞进机器人

机器之心Pro 2026-01-14 15:17:28
0 跟贴 0
活了三十年才知道，男人8不能，看完瞬间涨知识

寒梅爱说生活 2026-01-14 08:58:17
0 跟贴 0
撒贝宁模仿机器人，原谅我不厚道的笑了，能考上北大不是吃素的！

康德看生活 2026-01-11 09:01:21
0 跟贴 0
不聊参数，真实过冬：全新问界M7的冬季用车体验到底咋样？

V哥聊车 2026-01-12 21:05:59
6 跟贴 6
深圳大学硕博就业去向曝光，吊打一众985

慧翔百科 2026-01-14 11:35:26
27 跟贴 27
上什么北大，给劳资上A大

沙雕哥剧社 2026-01-12 09:33:47
1 跟贴 1
摩根资产管理：中国科技领域将迎来“更多DeepSeek时刻”

财联社 2026-01-14 15:56:04
0 跟贴 0
北大未名湖冰嬉开始了，学累了去滑会冰，不敢想象有多开心

马路江湖 2026-01-13 15:12:35
0 跟贴 0
“榛树”导弹的技术水平没有想象中那么高

秋之洁 2026-01-14 01:52:33
0 跟贴 0
中锋身高后卫技术! 回看这位美国之子的17年！

白嫖的小知识 2026-01-14 11:21:10
1 跟贴 1
好色女人的10大特征，看完瞬间长知识，找对象的注意了！

夜归爱生活 2026-01-14 08:57:17
0 跟贴 0
DeepSeek梁文锋喊话罗永浩：靠嘴年入过亿，为啥非得做科技？

雷科技 2026-01-14 15:31:09
0 跟贴 0
上清北真的很容易吗？

肖独贵 2026-01-13 19:23:51
0 跟贴 0
女孩通过努力考上梦寐以求的北大，但入学后发现自己更痛苦了！

文理TALKING 2026-01-13 04:27:57
0 跟贴 0
“等生了孩子”“等还完房贷”，网友质疑！最新：广告已换下

南方都市报 2026-01-14 09:18:34
734 跟贴 734
学霸思维训练：利用梯形的一半模型就能搞定

公考客栈店小二 2026-01-13 18:00:00
0 跟贴 0
驾车保命口诀，记住这些关键能保命，看完瞬间涨知识

诗韵浅谈生活 2026-01-10 09:22:53
0 跟贴 0
【DeepSeek谈艺】贾文广·油画 | 被色彩唤醒的生命群像

文化视界网 2026-01-14 14:57:21
0 跟贴 0
为什么他能走进北大强基？回头看，那次英伦游学很关键

新东方 2026-01-14 11:59:49
0 跟贴 0
北大一博士，二十年没回家

漂流的故事集 2026-01-13 10:34:57
0 跟贴 0
垃圾进垃圾出，大模型刷多了垃圾推文，智商骤降还变自恋狂

机器之心Pro 2025-10-24 18:51:47
0 跟贴 0
南京财经大学发布国内首个粮食安全学科专用大模型

中国教育新闻网 2026-01-14 15:47:05
0 跟贴 0
智谱和华为搞波大的：中国首个国产芯片训练出的SOTA多模态模型！

量子位 2026-01-14 15:09:28
0 跟贴 0
因协会“漏看”参赛规定日本雪车队无缘冬奥会，选手愤怒：竟犯如此低级错误

环球网资讯 2026-01-13 22:01:13
643 跟贴 643
Claude版Manus只用10天搓出，代码全AI写的！小扎140亿像冤大头

量子位 2026-01-14 15:26:52
0 跟贴 0
学霸思维训练：用沙漏模型和蝴蝶模型求解

公考客栈店小二 2026-01-11 18:00:00
0 跟贴 0
谷歌创始人布林：当年发完Transformer论文，我们太不当回事了

机器之心Pro 2025-12-15 10:18:00
41 跟贴 41
不用额外缓存！英伟达开源记忆压缩方案，128K上下文提速2.7倍

量子位 2026-01-14 14:07:25
0 跟贴 0
麦当劳回应“汉堡包越做越小”

第一财经资讯 2026-01-13 22:06:40
1621 跟贴 1621
国产新型航母模型疑曝光！舷号19清晰可见，却有3大疑点？

儒雅随和老泰勒 2026-01-12 16:49:53
0 跟贴 0

26年第二个闯祸的人来了！继呆呆后，株洲灿灿跟进，有8千人报名

26年第二个闯祸的人来了！继呆呆后，株洲灿灿跟进，有8千人报名

阿纂看事

2026-01-13 09:27:00

全世界都在静静等待，战争可能很快到来

全世界都在静静等待，战争可能很快到来

牛弹琴

2026-01-14 07:46:19

没想到！西周姬姓贵族基因被检测为N系，而汉族人主要是O系

没想到！西周姬姓贵族基因被检测为N系，而汉族人主要是O系

何氽简史

2026-01-13 20:17:27

丈母娘逼我还大舅哥110万外债，拒绝后离婚，3 年后再见他们愣住

丈母娘逼我还大舅哥110万外债，拒绝后离婚，3 年后再见他们愣住

磊子讲史

2025-12-26 15:15:04

阿隆索走了，“阿隆索”又回来了，皇马这是要干嘛？

阿隆索走了，“阿隆索”又回来了，皇马这是要干嘛？

兰亭墨未干

2026-01-14 11:45:48

72岁“老虎”带着外甥侄女大搞全家腐！近千平方米别墅内景曝光，曾在机场威胁乘客

72岁“老虎”带着外甥侄女大搞全家腐！近千平方米别墅内景曝光，曾在机场威胁乘客

上观新闻

2026-01-14 14:05:04

20℃→2℃！杭州人准备迎接“速冻”

20℃→2℃！杭州人准备迎接“速冻”

都市快报橙柿互动

2026-01-14 14:42:25

长春居民因客厅放床被停燃气20天

长春居民因客厅放床被停燃气20天

极目新闻

2026-01-13 09:51:51

克鲁尼举家“逃离美国”？川普一语戳破好莱坞左派的虚伪

克鲁尼举家“逃离美国”？川普一语戳破好莱坞左派的虚伪

斌闻天下

2026-01-14 07:15:03

卡扎菲那么有钱，为何在绝境下不逃亡国外，而待在国内等着被杀？

卡扎菲那么有钱，为何在绝境下不逃亡国外，而待在国内等着被杀？

小莜读史

2026-01-13 22:25:34

小玥儿正脸曝光好漂亮眼睛像爸爸外观神似妈妈和妈妈一样一头长发

小玥儿正脸曝光好漂亮眼睛像爸爸外观神似妈妈和妈妈一样一头长发

生性洒脱

2026-01-14 15:58:55

麦当劳“汉堡越做越小”？博主测试：尺寸没变，可能是“曼德拉效应”

麦当劳“汉堡越做越小”？博主测试：尺寸没变，可能是“曼德拉效应”

每日经济新闻

2026-01-13 22:52:50

72岁成龙太拼了，《过家家》票房失利后，2026年又带来了4部大片

72岁成龙太拼了，《过家家》票房失利后，2026年又带来了4部大片

电影票房预告片

2026-01-13 23:44:24

高市早苗与到访的李在明打起架子鼓卖力迎合

高市早苗与到访的李在明打起架子鼓卖力迎合

看看新闻Knews

2026-01-14 12:29:11

伴郎破坏婚礼后续：正脸被扒已社死，目的曝光，新娘发长文表态

伴郎破坏婚礼后续：正脸被扒已社死，目的曝光，新娘发长文表态

史行途

2026-01-13 13:35:16

她是华为的救命恩人，为华为创收5000亿，任正非都不敢直呼她大名

她是华为的救命恩人，为华为创收5000亿，任正非都不敢直呼她大名

墨兰史书

2026-01-03 03:50:02

暴跌70%！从12.8元到3.3元，“牛奶界爱马仕”为何光速跌落神坛？

暴跌70%！从12.8元到3.3元，“牛奶界爱马仕”为何光速跌落神坛？

品牌观察官

2026-01-13 19:12:27

“等生了孩子”“等还完房贷”，网友质疑！最新：广告已换下

“等生了孩子”“等还完房贷”，网友质疑！最新：广告已换下

南方都市报

2026-01-14 09:18:34

多哈球星赛直播！国乒陈垣宇大战张本智和林诗栋复仇张禹珍男单签表出炉

多哈球星赛直播！国乒陈垣宇大战张本智和林诗栋复仇张禹珍男单签表出炉

好乒乓

2026-01-14 12:27:50

许世友痴迷茅台，但他每个月只有400块工资，是如何顿顿喝到的？

许世友痴迷茅台，但他每个月只有400块工资，是如何顿顿喝到的？

大千世界观

2026-01-12 21:54:33

硅星Breaknews

6519文章数 63关注度

往期回顾全部

科技要闻

美国批准英伟达H200卖给中国，但有条件

头条要闻

电车失控在市区以超100km/h时速连撞15车阿维塔回应

头条要闻

电车失控在市区以超100km/h时速连撞15车阿维塔回应

体育要闻

牛津学霸买下儿时主队，让它成为英超黑马

娱乐要闻

何晴去世30天，许亚军终于发声

财经要闻

姚振华举报:观致汽车资产被低价拍卖

汽车要闻

曝Model Y或降到20万以内！

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

亲子

旅游

本地

公开课

教育要闻

小升初压轴题，求圆的面积？

亲子要闻

女子孕24周已宫口全开，医生紧急手术保胎至31周诞下宝宝

旅游要闻

桂西南大德天旅游联盟发布2026年计划多举措预热新年旅游市场

本地新闻

穿越鳌太线，怎么就成了户外人的致命诱惑？

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版