网易首页 > 网易号 > 正文 申请入驻

DeepSeek启动百万token测试,部分用户称失去灵魂?

0
分享至

2月11日,DeepSeek在其App与网页端悄然开启新一轮灰度测试,将模型上下文窗口从V3.1版本的128K token,直接提升至1M(百万)token。DeepSeek称可以一次性处理《三体》三部曲,并理解和分析其内容。



另外,升级了模型知识库截至日期和增强的文件处理能力。模型知识库更新至2025年5月,即便在离线状态下,也能准确回应2025年上半年的各类新闻事件。支持上传图像、PDF、Word、Excel、PPT、TXT,能从文件中提取文字信息并深度分析。

这一系列密集升级,被业内看作是其新一代旗舰模型V4即将亮相的重要信号。

此次测试版本仍为纯文本形态,暂不支持视觉输入及多模态识别功能,但成功补齐了长文本处理的核心短板,直接对标Google Gemini的百万级上下文能力。

官方没有正式公布更新,但有部分用户在试用时吐槽,“丢掉了DeepSeek最有灵魂的东西”“现在这版本小说文笔巨差,以前的文笔我认为是业界巅峰,比什么gptgrok都强,就是2月11号后一切都变了。”“不知道的还以为在写诗呢,一句话一段你知道我看得多崩溃吗?”





也有用户认为这只是新版本测试,后续会根据反馈优化的。



DeepSeek的更新开年以来一直在铺垫。

早在2025年下半年,受生态布局薄弱、产品能力偏科等因素影响,DeepSeek的用户规模和活跃度均出现明显下滑,外界对其发展前景一度提出质疑。对此,DeepSeek团队并未急于回应,而是选择低调深耕技术,陆续发布V3.2系列模型、数学专用模型及OCR工具,为新一轮技术突破默默蓄力。

1月,DeepSeek以罕见的频率连续发布两篇关键技术论文,为这次灰度测试的顺利推进筑牢了技术根基。其中,元旦当天发布的mHC流形约束超连接架构,解决了大规模模型训练过程中的稳定性难题。

1月中旬,开源的Engram条件记忆模块,则采用哈希查找替代高成本的神经网络计算,实现“查算分离”,可将超大参数表迁移至CPU内存,推理延迟控制在3%以内,天然适配百万级长上下文场景,大幅降低了长序列推理的算力开销。

不到一个月前,DeepSeek自研解码核心库FlashMLA更新时,社区开发者意外发现了代号为“Model 1”的全新模型标识。该标识独立于现有V3.2架构,在KV缓存布局、稀疏性处理以及FP8数据格式解码等方面,都与V3.2版本存在明显差异,这意味着DeepSeek正在进行一次底层架构的全面重构,而非简单的版本迭代。

据悉,DeepSeek 下一代旗舰模型预计将是一款万亿参数级别的基础模型,正因规模大幅跃升,训练速度明显放缓,导致发布进程有所延后。但野村证券2月10日发布的报告里提到,预测DeepSeek V4会在2月中旬发布。

DeepSeek将全面整合mHC与Engram两项核心技术,摒弃盲目堆砌参数的行业惯性,重点提升模型的推理、编程以及长文本处理效率。

目前,DeepSeek并未对此次灰度测试作出回应。

来源:星河商业观察

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
广东湛江海滩发现一具失去头颅的海兽尸体,专家现场鉴定:排除儒艮可能性,基本确认为印太江豚

广东湛江海滩发现一具失去头颅的海兽尸体,专家现场鉴定:排除儒艮可能性,基本确认为印太江豚

大风新闻
2026-02-13 17:38:07
为什么领导很少生病请假,总是精力充沛?主要有这4点

为什么领导很少生病请假,总是精力充沛?主要有这4点

细说职场
2026-02-11 17:27:08
日媒透露,高市或在11月访华!话音刚落,58条中日航线全部取消

日媒透露,高市或在11月访华!话音刚落,58条中日航线全部取消

来科点谱
2026-02-13 07:08:11
闫学晶儿子被曝冒名顶替?中戏两位系主任投案自首,再也瞒不住了

闫学晶儿子被曝冒名顶替?中戏两位系主任投案自首,再也瞒不住了

社会酱
2026-02-13 16:23:30
马伊琍做梦也想不到,43岁姚笛走了和文章一样的路,实现口碑暴涨

马伊琍做梦也想不到,43岁姚笛走了和文章一样的路,实现口碑暴涨

秋姐居
2026-02-07 09:36:47
谷爱凌再遭美国网友网暴:没收她的财产!回美国是非法滞留 鲁比奥查她

谷爱凌再遭美国网友网暴:没收她的财产!回美国是非法滞留 鲁比奥查她

小椰的奶奶
2026-02-13 08:02:35
卡萨诺:莱奥连给路易斯-迪亚斯提鞋都不配,两人差20个档次

卡萨诺:莱奥连给路易斯-迪亚斯提鞋都不配,两人差20个档次

懂球帝
2026-02-13 07:59:31
释永信牵连四女星:央视名嘴、炫富被封、刘涛最冤

释永信牵连四女星:央视名嘴、炫富被封、刘涛最冤

最美的巧合
2026-01-31 03:13:30
我国崩塌最彻底的专业,从年薪20万到找不到工作,毕业即失业!

我国崩塌最彻底的专业,从年薪20万到找不到工作,毕业即失业!

黯泉
2026-02-10 22:00:47
孤独婚车李婷曝光,婆家在农村,公婆勤劳婚房气派,人民日报点赞

孤独婚车李婷曝光,婆家在农村,公婆勤劳婚房气派,人民日报点赞

离离言几许
2026-02-13 10:51:36
至今仍健在的开国将帅只剩一位,今年103岁高龄,身体依旧硬朗

至今仍健在的开国将帅只剩一位,今年103岁高龄,身体依旧硬朗

鲸探所长
2026-02-05 16:41:09
刘少昂半决赛两次被影响却未有任何判罚!中国网友:谁来心疼他

刘少昂半决赛两次被影响却未有任何判罚!中国网友:谁来心疼他

Emily说个球
2026-02-13 04:35:22
男篮开会遭批!不止内容老套无新意 胡明轩疑似看手机助教打瞌睡

男篮开会遭批!不止内容老套无新意 胡明轩疑似看手机助教打瞌睡

大嘴爵爷侃球
2026-02-13 18:39:57
北京知青返城后当上大官,20年后故地重游,才得知儿孙满堂

北京知青返城后当上大官,20年后故地重游,才得知儿孙满堂

五元讲堂
2024-11-14 10:26:10
2月11日新西兰偶遇蒋勤勤一家五口,与网友热情合影超随和

2月11日新西兰偶遇蒋勤勤一家五口,与网友热情合影超随和

TVB的四小花
2026-02-14 06:00:51
玄武门之变,李渊为什么不调兵镇压李世民?他调了,但根本压不住

玄武门之变,李渊为什么不调兵镇压李世民?他调了,但根本压不住

千秋文化
2026-02-11 21:36:18
2月16除夕,“三菜放餐桌,人旺财也旺”!三菜指的啥?建议了解

2月16除夕,“三菜放餐桌,人旺财也旺”!三菜指的啥?建议了解

江江食研社
2026-02-13 07:30:10
马斯克领跑太空光伏,中国何时产业化落地

马斯克领跑太空光伏,中国何时产业化落地

第一财经资讯
2026-02-13 21:46:11
雪橇团体接力再创历史,为突破中国雪橇一直在提速

雪橇团体接力再创历史,为突破中国雪橇一直在提速

澎湃新闻
2026-02-13 10:26:27
成都年货市场挤爆了:排队2小时,商家24小时营业,快递直接蹲门口收件

成都年货市场挤爆了:排队2小时,商家24小时营业,快递直接蹲门口收件

红星新闻
2026-02-13 21:26:09
2026-02-14 06:31:00
ZAKER新闻 incentive-icons
ZAKER新闻
传递价值资讯
4656文章数 23601关注度
往期回顾 全部

科技要闻

独家探访蔡磊:答不完的卷子 死磕最后一程

头条要闻

8千元的迷你小马一夜爆火 马主:1天排泄次数达十几次

头条要闻

8千元的迷你小马一夜爆火 马主:1天排泄次数达十几次

体育要闻

这张照片背后,是米兰冬奥最催泪的故事

娱乐要闻

大衣哥女儿风光出嫁,农村婚礼超朴素

财经要闻

华莱士母公司退市 疯狂扩张下的食安隐忧

汽车要闻

探秘比亚迪巴西工厂 居然是这个画风!

态度原创

教育
时尚
家居
房产
数码

教育要闻

成绩提升的关键,不是天赋而是策略

穿上这些鞋拥抱春天

家居要闻

中古雅韵 乐韵伴日常

房产要闻

三亚新机场,又传出新消息!

数码要闻

索尼WF-1000XM6新一代降噪豆正式发布,国行3月开售

无障碍浏览 进入关怀版