网易首页 > 网易号 > 正文 申请入驻

DeepSeek深夜王炸:给AI装上“海马体”,硅谷的显存墙塌了

0
分享至

OpenAI还在堆算力,DeepSeek却给AI装上了“海马体”。

就在昨夜,DeepSeek(深度求索)再次扔下了一枚重磅炸弹:全新论文《Engram: Conditional Memory via Scalable Lookup》正式发布。这一次,他们没有卷参数,没有卷模型规模,而是把刀尖对准了所有大模型最痛的那根软肋——记忆。

如果说之前的MoE(混合专家模型)是为了让AI“算得少但算得快”,那么DeepSeek这次提出的Engram(记忆印痕),就是为了让AI“记得住且不费脑”。

这不仅是架构上的降维打击,更是对硅谷“大力出奇迹”神话的一次精准狙击。



DeepSeek看穿了所有人的“显存焦虑”。

不管是个人开发者还是科技巨头,只要玩过大模型都知道,现在最贵的不是计算核心(Compute),而是高带宽显存(HBM)。GPU再快,显存塞不下,模型就跑不动。为了让AI记住更多的知识,我们被迫把无数的“静态知识”硬塞进昂贵的GPU显存里,这就像是用法拉利的引擎去拉一车的砖头——极其奢侈,又极其愚蠢。

DeepSeek的Engram架构,做了一件极其天才的事情:它把“思考”和“记忆”分家了。

在传统Transformer架构里,AI想知道“法国首都是哪里”,它需要动用庞大的神经网络去“推理”出这个答案。这不仅慢,还占显存。而Engram引入了一套全新的机制:它允许AI直接去查表。

简单来说,DeepSeek给大模型外挂了一个极其巨大的“图书馆”。那些死记硬背的知识(比如历史事实、代码片段、固定搭配),直接被压缩成N-gram索引,扔到了便宜量大的CPU内存(RAM)里!



当模型需要用到这些知识时,它不需要消耗昂贵的GPU算力去“回忆”,而是直接通过O(1)复杂度的查表操作,瞬间从内存里调取。这就像人类的大脑:你计算微积分时需要动脑(GPU推理),但你想起自己名字时,是下意识的直觉(Engram查表)。

这一刀,砍断了算力与记忆的强绑定。

根据论文数据,引入Engram模块后,DeepSeek成功把海量的静态参数从GPU里踢了出去,放在了普通内存里。这意味着什么?这意味着我们终于可以用消费级的显卡,跑起那些曾经只有H100集群才能承载的“超巨型记忆体”模型!

测试结果令人头皮发麻:在同等算力消耗下,Engram模型的知识准确率、推理能力、代码能力全线暴涨。特别是在长文本检索任务(大海捞针)中,准确率直接从84.2%飙升到了97%!



这不仅仅是技术的胜利,这是方法论的胜利。

当西方的巨头们还在试图用千亿美金的各种昂贵硬件去暴力破解AGI(通用人工智能)时,来自中国的DeepSeek再次证明了:极致的算法优化,比单纯的堆料更优雅,也更致命。

Engram的出现,标志着AI正式从“计算器”进化到了“有脑子”的阶段。它不再是一个只会预测下一个词的概率机器,而是一个拥有独立检索机制、懂得在思考前先“查阅记忆”的智能体。

对于我们普通用户而言,好日子还在后头。未来的本地大模型,或许不再需要你有4块4090,只要你的内存插得足够多,DeepSeek就能让你在家里跑起一个拥有百科全书般记忆的超级AI。

DeepSeek这一波,不仅赢了面子,更赢了未来。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中方不再退让!达尔文港风波升级,5亿澳元开启澳方毁约买单路

中方不再退让!达尔文港风波升级,5亿澳元开启澳方毁约买单路

快看张同学
2026-02-03 09:48:46
黄金、白银直线飙涨!特朗普突发!事关关税!

黄金、白银直线飙涨!特朗普突发!事关关税!

证券时报e公司
2026-02-03 07:57:16
外交部:敦促美方严肃认真对待中方关切,要求美国执法部门立即停止错误行径

外交部:敦促美方严肃认真对待中方关切,要求美国执法部门立即停止错误行径

环球网资讯
2026-02-02 15:32:43
雷军:第一代小米SU7已停售 个别车商为了蹭流量又哭又闹 欢迎大家帮我们举报

雷军:第一代小米SU7已停售 个别车商为了蹭流量又哭又闹 欢迎大家帮我们举报

快科技
2026-02-02 12:42:07
郑爽张恒家街头互撕!郑爽满头白发疑精神失常,孩子哭到发抖没人管

郑爽张恒家街头互撕!郑爽满头白发疑精神失常,孩子哭到发抖没人管

八卦王者
2026-02-03 10:08:04
晚年的李作鹏每日无酒肉不欢,在审查时要求改善生活,吃肉喝酒?

晚年的李作鹏每日无酒肉不欢,在审查时要求改善生活,吃肉喝酒?

春秋砚
2026-02-02 16:30:07
具俊晔心碎发声「我的熙媛」:下次再见,我们要在一起一辈子

具俊晔心碎发声「我的熙媛」:下次再见,我们要在一起一辈子

ETtoday星光云
2026-02-02 19:34:09
一个残酷的真相:夜空中7000颗星星,全都位于银河系范围内

一个残酷的真相:夜空中7000颗星星,全都位于银河系范围内

观察宇宙
2026-01-31 20:29:00
伊朗武装部队总参谋长:地区战火将波及美国及其盟友

伊朗武装部队总参谋长:地区战火将波及美国及其盟友

财联社
2026-02-02 15:53:04
新春走基层|独龙江戍边民警带我“出任务”:给文面奶奶拍下“人生照片”

新春走基层|独龙江戍边民警带我“出任务”:给文面奶奶拍下“人生照片”

新华社
2026-02-02 15:34:42
某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

戗词夺理
2026-01-24 16:05:41
大S逝世一周年雕像揭幕,具俊晔设计寄思念,雨中悼念看哭众人

大S逝世一周年雕像揭幕,具俊晔设计寄思念,雨中悼念看哭众人

很哥
2026-02-02 22:36:10
爱泼斯坦的文件正在曝光!塞尔维亚总统武契奇:预计48小时内伊朗将遭到袭击,“或者有其他重大事件发生”

爱泼斯坦的文件正在曝光!塞尔维亚总统武契奇:预计48小时内伊朗将遭到袭击,“或者有其他重大事件发生”

浙江之声
2026-02-02 15:38:46
蔡康永发文缅怀大S,说大S应该被好好疼爱的

蔡康永发文缅怀大S,说大S应该被好好疼爱的

素素娱乐
2026-02-03 07:27:12
中美俄,供养着一大群废物

中美俄,供养着一大群废物

智先生
2026-02-02 21:11:32
江苏省教育厅发布:假期不仅是孩子学业休整的驿站,更是全面发展的沃土,请理性看待校外培训,莫让假期变成“第三学期”

江苏省教育厅发布:假期不仅是孩子学业休整的驿站,更是全面发展的沃土,请理性看待校外培训,莫让假期变成“第三学期”

扬子晚报
2026-02-02 14:41:49
赵匡胤帐下的五虎大将,都有谁?他们的结局如何,谁混得最好?

赵匡胤帐下的五虎大将,都有谁?他们的结局如何,谁混得最好?

凡人侃史
2026-02-01 23:47:51
大S的两个孩子,不参加妈妈的雕像仪式原因曝光

大S的两个孩子,不参加妈妈的雕像仪式原因曝光

素素娱乐
2026-02-03 12:06:34
哪些人情世故是你长大后才明白的?网友:贵人不可贱用

哪些人情世故是你长大后才明白的?网友:贵人不可贱用

解读热点事件
2026-01-29 04:45:45
发现个奇怪现象:电车没有“干掉”油车,却“干掉”了汽车修理厂

发现个奇怪现象:电车没有“干掉”油车,却“干掉”了汽车修理厂

刘哥谈体育
2026-01-19 11:46:50
2026-02-03 13:23:03
呼呼历史论
呼呼历史论
分享有趣的历史
315文章数 16177关注度
往期回顾 全部

科技要闻

1.25万亿美元!xAI员工赢麻了

头条要闻

男子投200万做租赁业务起步即爆单 每周收租金超百万

头条要闻

男子投200万做租赁业务起步即爆单 每周收租金超百万

体育要闻

“也许我的一小步,会成为中国足球的一大步”

娱乐要闻

小S致词:感谢具俊晔陪伴大S的最后3年

财经要闻

精神病医院骗保内幕调查:住院相当于坐牢

汽车要闻

问界M6官图首发 以年轻化设计叩击25-30万级市场

态度原创

健康
游戏
家居
亲子
军事航空

耳石症分类型,症状大不同

T2财报即将公布!《GTA6》会再次宣布跳票吗?

家居要闻

极简木艺术 典雅自在

亲子要闻

高敏感儿童是有病吗? 用这样的运动处方:家长从此告别内耗与焦虑

军事要闻

委内瑞拉外长会见美外交使团团长

无障碍浏览 进入关怀版