网易首页 > 网易号 > 正文 申请入驻

DeepSeek模型更新!上下文提升至百万Token 可处理三体小说全集

0
分享至

《科创板日报》2月11日讯(记者 黄心怡 编辑 宋子乔)DeepSeek传闻中的V4尚未正式发布。2月11日,多位用户反馈DeepSeek已在网页及App端进行版本更新,上下文窗口由原有的128K直接提升至1M(百万Token)级别。


《科创板日报》记者实测中发现,DeepSeek在问答中称自身支持上下文1M,可以一次性处理超长文本。此外,版本模型知识库截止时间更新至2025年5月。不过,新版本目前不支持视觉输入,也不具备多模态识别能力。


《科创板日报》记者进一步询问模型的版本,DeepSeek称没有固定的版本号,更像一个持续进化的"最新版”


在尝试提交了超过24万个token的《简爱》小说文档后,DeepSeek可以支持识别文档内容。


三体三部曲合计总计90万字,这也意味着DeepSeek能够单次完成处理《三体》全集的长文本。

记者随即提交了《三体》全集,DeepSeek的处理速度相较文字更少的《简爱》要慢一些,但也在几分钟内完成了文档阅读。


值得关注的是,近期DeepSeek开放了多个技术岗位招聘,包括产品经理/模型策略产品经理、客户端/前端/全栈研发工程师等。


此外,DeepSeek还在1月14日发布了CFO的岗位招聘。


目前,能将上下文推至百万级别的模型较少,谷歌的Gemini系列和Anthropic的Claude Opus 4.6等已率先实现。

DeepSeek的V系列模型定位为追求极致综合性能的基础模型。2024年12月推出的基础模型V3是DeepSeek的重要里程碑,其高效的MoE架构确立了强大的综合性能基础。此后,DeepSeek在V3基础上快速迭代,发布了强化推理与Agent(智能体)能力的V3.1,并于2025年12月推出了最新正式版V3.2。同时,还推出了一个专注于攻克高难度数学和学术问题的特殊版本V3.2-Speciale。

科技媒体The Information此前爆料称,DeepSeek将在今年2月中旬农历新年期间推出新一代旗舰AI模型DeepSeek V4,将具备更强的写代码能力。

随着这个日期迫近,襁褓中的V4成了关注焦点,Deepseek的每一次更新,都引来诸多关注。据《科创板日报》梳理,今日的版本更新之外,年初以来,Deepseek公布了两项底层架构突破,并释放一个旗舰迭代信号。

今年初,DeepSeek团队发表两篇论文,公开了两项创新架构:mHC(流形约束超连接)用来优化深层Transformer信息流动,使模型训练更稳定、易扩展,在不增加算力负担前提下提升性能;Engram(条件记忆模块)将静态知识与动态计算解耦,用廉价DRAM存储实体知识,释放昂贵HBM专注推理,显著降低长上下文推理成本。

这两项技术被认为是中国大模型突破“算力芯片和内存瓶颈”的算法创新,创始人梁文锋均署名参与相关论文。

1月21日,R1模型发布一周年之际,DeepSeek新模型“MODEL1”曝光。DeepSeek官方GitHub仓库更新了一系列FlashMLA代码,借助AI对全部总代码文件数:114个(包括.py, .md, .txt, .sh, .cpp, .cu, .h文件)进行分析,发现了一个此前未公开的模型架构标识“MODEL1”,共被提及31次。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
李连杰称当年无数年轻人看完《少林寺》去学武,但百万分之一的机会才造就了一个王宝强

李连杰称当年无数年轻人看完《少林寺》去学武,但百万分之一的机会才造就了一个王宝强

极目新闻
2026-02-10 23:59:05
Travis Scott超级碗香奈儿棒球服售价惊人,精工表才是焦点!

Travis Scott超级碗香奈儿棒球服售价惊人,精工表才是焦点!

星Xin辰大海
2026-02-11 19:01:18
有儿子的家庭集体觉醒:宁让儿子单着,不娶“祖宗”进门

有儿子的家庭集体觉醒:宁让儿子单着,不娶“祖宗”进门

青苹果sht
2026-02-08 05:48:26
专哄南方小土豆的“雪地代写”业务,可能永远无法被AI取代

专哄南方小土豆的“雪地代写”业务,可能永远无法被AI取代

果壳
2026-02-12 04:06:46
塌房!英首相遭打击:核心幕僚24小时接连辞职,内阁集体反水逼宫

塌房!英首相遭打击:核心幕僚24小时接连辞职,内阁集体反水逼宫

华人星光
2026-02-11 10:49:50
我去!塔图姆被下放了!!

我去!塔图姆被下放了!!

柚子说球
2026-02-11 17:20:08
学霸和中等生的区别:学霸数学英语都拔尖,中等生英语大概率偏科

学霸和中等生的区别:学霸数学英语都拔尖,中等生英语大概率偏科

好爸育儿
2026-02-05 16:17:51
于谦独自过小年:速冻水饺配凉菜,57岁显老态?

于谦独自过小年:速冻水饺配凉菜,57岁显老态?

娱乐领航家
2026-02-11 18:00:08
曼联接洽德甲过人王,三大问题恐放弃引进!3000万或可签马特塔

曼联接洽德甲过人王,三大问题恐放弃引进!3000万或可签马特塔

罗米的曼联博客
2026-02-12 11:14:13
美国华人直言:中国手机扫码支付是最不智能的发明!

美国华人直言:中国手机扫码支付是最不智能的发明!

阿伧说事
2026-01-20 12:53:01
谢贤前女友Coco直播爆料,大谈谢霆锋和张柏芝结婚内幕,真敢说!

谢贤前女友Coco直播爆料,大谈谢霆锋和张柏芝结婚内幕,真敢说!

TVB的四小花
2026-02-12 11:23:58
CBA双标?赵睿恶劣言论停3场 辽宁两小将却被禁3年 冤到骨子里!

CBA双标?赵睿恶劣言论停3场 辽宁两小将却被禁3年 冤到骨子里!

你看球呢
2026-02-12 06:30:09
中国共产党中央军事委员会副主席张升民简历

中国共产党中央军事委员会副主席张升民简历

上观新闻
2025-10-23 18:17:07
山东7岁男孩跟爸爸拍视频约定“点一个赞跳绳一下”,网友一天狂点180万赞!爸爸回应:这个“债”要还,一天先跳300个

山东7岁男孩跟爸爸拍视频约定“点一个赞跳绳一下”,网友一天狂点180万赞!爸爸回应:这个“债”要还,一天先跳300个

扬子晚报
2026-02-11 12:48:24
“大家都知道你娶了李婷!”上海回河南高速车友为孤独婚车组成临时车队:最多有十几台

“大家都知道你娶了李婷!”上海回河南高速车友为孤独婚车组成临时车队:最多有十几台

潇湘晨报
2026-02-11 19:27:13
女演员千万别整容!看《夜色正浓》里40岁江疏影和36岁蓝盈莹

女演员千万别整容!看《夜色正浓》里40岁江疏影和36岁蓝盈莹

章眽八卦
2026-02-11 12:40:57
太突然!于东来官宣年后退休,网友扒出猛料,三年前就已放手8成

太突然!于东来官宣年后退休,网友扒出猛料,三年前就已放手8成

削桐作琴
2026-02-11 23:35:31
网友拍下广州南站震撼一幕:不到5分钟开出一趟列车,发车密度堪比地铁

网友拍下广州南站震撼一幕:不到5分钟开出一趟列车,发车密度堪比地铁

番禺台
2026-02-12 01:22:46
俄外长拉夫罗夫向中国人民致以新春祝福

俄外长拉夫罗夫向中国人民致以新春祝福

中国网
2026-02-12 11:09:11
受福建省委副书记、福州市委书记郭宁宁委托,福州市市长吴贤德走访慰问曹德旺等民营企业家

受福建省委副书记、福州市委书记郭宁宁委托,福州市市长吴贤德走访慰问曹德旺等民营企业家

中国基金报
2026-02-12 05:04:44
2026-02-12 12:04:49
科创板日报 incentive-icons
科创板日报
上海报业集团主管主办
62920文章数 44543关注度
往期回顾 全部

科技要闻

传苹果新Siri再遇挫 多项AI功能或推迟发布

头条要闻

立陶宛总理:考虑将"台湾代表处"更名为"台北代表处"

头条要闻

立陶宛总理:考虑将"台湾代表处"更名为"台北代表处"

体育要闻

31岁首次参加冬奥,10年前她是个水管工

娱乐要闻

体操运动员坠楼涉事教练被立案调查

财经要闻

中国乳业2025年回顾:行业寒潮压顶

汽车要闻

具身机器人,能否助力理想打赢全新L9这一仗?

态度原创

健康
教育
亲子
旅游
军事航空

转头就晕的耳石症,能开车上班吗?

教育要闻

唐尚珺自曝寒假生活,屋子漏风也要大碗喝酒,比上了清北还滋润

亲子要闻

儿子因为帮助刘萌萌和同学动手了,最后被妈妈教育一顿

旅游要闻

郑州绿博园:持结婚证,免费游!

军事要闻

特朗普:若美伊谈判失败 或再派一支航母打击群

无障碍浏览 进入关怀版