网易首页 > 网易号 > 正文 申请入驻

DeepSeek模型更新!上下文提升至百万Token 可处理三体小说全集

0
分享至

《科创板日报》2月11日讯(记者 黄心怡 编辑 宋子乔)DeepSeek传闻中的V4尚未正式发布。2月11日,多位用户反馈DeepSeek已在网页及App端进行版本更新,上下文窗口由原有的128K直接提升至1M(百万Token)级别。


《科创板日报》记者实测中发现,DeepSeek在问答中称自身支持上下文1M,可以一次性处理超长文本。此外,版本模型知识库截止时间更新至2025年5月。不过,新版本目前不支持视觉输入,也不具备多模态识别能力。


《科创板日报》记者进一步询问模型的版本,DeepSeek称没有固定的版本号,更像一个持续进化的"最新版”


在尝试提交了超过24万个token的《简爱》小说文档后,DeepSeek可以支持识别文档内容。


三体三部曲合计总计90万字,这也意味着DeepSeek能够单次完成处理《三体》全集的长文本。

记者随即提交了《三体》全集,DeepSeek的处理速度相较文字更少的《简爱》要慢一些,但也在几分钟内完成了文档阅读。


值得关注的是,近期DeepSeek开放了多个技术岗位招聘,包括产品经理/模型策略产品经理、客户端/前端/全栈研发工程师等。


此外,DeepSeek还在1月14日发布了CFO的岗位招聘。


目前,能将上下文推至百万级别的模型较少,谷歌的Gemini系列和Anthropic的Claude Opus 4.6等已率先实现。

DeepSeek的V系列模型定位为追求极致综合性能的基础模型。2024年12月推出的基础模型V3是DeepSeek的重要里程碑,其高效的MoE架构确立了强大的综合性能基础。此后,DeepSeek在V3基础上快速迭代,发布了强化推理与Agent(智能体)能力的V3.1,并于2025年12月推出了最新正式版V3.2。同时,还推出了一个专注于攻克高难度数学和学术问题的特殊版本V3.2-Speciale。

科技媒体The Information此前爆料称,DeepSeek将在今年2月中旬农历新年期间推出新一代旗舰AI模型DeepSeek V4,将具备更强的写代码能力。

随着这个日期迫近,襁褓中的V4成了关注焦点,Deepseek的每一次更新,都引来诸多关注。据《科创板日报》梳理,今日的版本更新之外,年初以来,Deepseek公布了两项底层架构突破,并释放一个旗舰迭代信号。

今年初,DeepSeek团队发表两篇论文,公开了两项创新架构:mHC(流形约束超连接)用来优化深层Transformer信息流动,使模型训练更稳定、易扩展,在不增加算力负担前提下提升性能;Engram(条件记忆模块)将静态知识与动态计算解耦,用廉价DRAM存储实体知识,释放昂贵HBM专注推理,显著降低长上下文推理成本。

这两项技术被认为是中国大模型突破“算力芯片和内存瓶颈”的算法创新,创始人梁文锋均署名参与相关论文。

1月21日,R1模型发布一周年之际,DeepSeek新模型“MODEL1”曝光。DeepSeek官方GitHub仓库更新了一系列FlashMLA代码,借助AI对全部总代码文件数:114个(包括.py, .md, .txt, .sh, .cpp, .cu, .h文件)进行分析,发现了一个此前未公开的模型架构标识“MODEL1”,共被提及31次。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
遭米哈游终止合作后,上海市汇业律师事务所致歉说明

遭米哈游终止合作后,上海市汇业律师事务所致歉说明

IT之家
2026-02-12 07:56:17
你和同事干过最暧昧的事是啥?网友:在我面前穿丝袜,问我喜欢嘛

你和同事干过最暧昧的事是啥?网友:在我面前穿丝袜,问我喜欢嘛

带你感受人间冷暖
2026-02-10 01:50:06
神乐桃果:240天“神隐”后的K杯王者归来

神乐桃果:240天“神隐”后的K杯王者归来

碧波万览
2026-02-12 03:52:52
警惕!香港爆发大规模食物中毒,港府高度重视!

警惕!香港爆发大规模食物中毒,港府高度重视!

港漂圈
2026-02-11 21:57:54
胡忠雄在上海与上海市委常委、浦东新区区委书记李政举行会见

胡忠雄在上海与上海市委常委、浦东新区区委书记李政举行会见

知知贵阳
2026-02-11 22:35:14
1949年包惠僧想回大陆,周总理:你不是普通党员,要对党有个交代

1949年包惠僧想回大陆,周总理:你不是普通党员,要对党有个交代

大运河时空
2026-02-11 09:05:03
春喝苹果水,内热自己退,3种神仙搭配,清内热,健脾胃,太润了

春喝苹果水,内热自己退,3种神仙搭配,清内热,健脾胃,太润了

江江食研社
2026-02-11 12:30:07
谷爱凌:有时候感觉我的肩上肩负着两个国家的期望

谷爱凌:有时候感觉我的肩上肩负着两个国家的期望

懂球帝
2026-02-11 20:53:09
港口停工了,美方发现不对劲,中方反制巴拿马后,枪口对准了美国

港口停工了,美方发现不对劲,中方反制巴拿马后,枪口对准了美国

遁走的两轮
2026-02-12 09:27:50
热点追踪丨新春补贴已备好!春节这么买,更优惠!

热点追踪丨新春补贴已备好!春节这么买,更优惠!

新华社
2026-02-11 18:08:22
王维平已任广西人大常委会党组书记

王维平已任广西人大常委会党组书记

界面新闻
2026-02-12 08:09:46
教育部亮红牌!这些专业的学生“毕业即失业”,985也在连夜撤销

教育部亮红牌!这些专业的学生“毕业即失业”,985也在连夜撤销

离离言几许
2026-02-09 20:16:57
湖北一木匠,两年时间骗取宁夏自治区政府高层近十亿,无人敢吱声

湖北一木匠,两年时间骗取宁夏自治区政府高层近十亿,无人敢吱声

神奇的锤子
2025-02-14 20:48:49
FSD入华是狼,那谁是待宰的羔羊?

FSD入华是狼,那谁是待宰的羔羊?

汽车公社
2026-02-12 08:37:08
Seedance 2.0实现周星驰“大战”李小龙,律师划出法律红线

Seedance 2.0实现周星驰“大战”李小龙,律师划出法律红线

21世纪经济报道
2026-02-10 17:36:40
戴笠曾坦言:我这辈子最佩服2人,最害怕1人!这3人分别是谁?

戴笠曾坦言:我这辈子最佩服2人,最害怕1人!这3人分别是谁?

浩渺青史
2026-02-09 21:40:36
超预期!中芯国际2025年销售收入93.27亿美元,同比增长16.2%

超预期!中芯国际2025年销售收入93.27亿美元,同比增长16.2%

证券时报e公司
2026-02-11 22:25:00
中国小伙在韩国租女友,2000块一天陪吃陪玩,分手时小伙依依不舍

中国小伙在韩国租女友,2000块一天陪吃陪玩,分手时小伙依依不舍

胡一舸南游y
2026-02-10 19:15:32
心梗与做家务有关?医生提醒:60岁以后,做家务时要注意这几点

心梗与做家务有关?医生提醒:60岁以后,做家务时要注意这几点

医学科普汇
2026-02-11 06:30:11
海哈金喜家里放前夫合照,李亚鹏对她称呼腻歪,她的回复恐能复婚

海哈金喜家里放前夫合照,李亚鹏对她称呼腻歪,她的回复恐能复婚

梦回千年aa
2026-02-12 09:10:23
2026-02-12 10:04:49
财联社 incentive-icons
财联社
以“准确、快速、权威、专业”为新闻准则,为投资者提供专业的投资资讯。
684452文章数 1017584关注度
往期回顾 全部

科技要闻

传苹果新Siri再遇挫 多项AI功能或推迟发布

头条要闻

外媒披露:爱泼斯坦死后 一具“假尸”从监狱运出

头条要闻

外媒披露:爱泼斯坦死后 一具“假尸”从监狱运出

体育要闻

搞垮一个冬奥选手,只需要一首歌?

娱乐要闻

大孤山风波愈演愈烈 超50位明星扎堆

财经要闻

这个春节,中美AI“隔空开打”

汽车要闻

具身机器人,能否助力理想打赢全新L9这一仗?

态度原创

健康
教育
时尚
数码
军事航空

转头就晕的耳石症,能开车上班吗?

教育要闻

全全全全全全是好评!!!太争气了呜呜!!!

这些才是适合普通人的冬天穿搭!不露腿、不露腰,得体又大方

数码要闻

2025年中国线上智能手表排名:华为销量大涨46.8%!稳居第一

军事要闻

特朗普:若美伊谈判失败 或再派一支航母打击群

无障碍浏览 进入关怀版