网易首页 > 网易号 > 正文 申请入驻

热议!DeepSeek V3.1惊现神秘「极」字 Bug,模型故障了?

0
分享至

机器之心报道

编辑:Panda

这个先进的 AI 为何会突然对一个汉字「情有独钟」?DeepSeek 最新的 V3.1 模型上线不到一周,就因一个离奇的 Bug 引发社区热议:无论任务是写代码还是整理物理试卷,模型总会莫名其妙地在文本中插入「极」字,甚至在自我修复时也无法幸免 。

上周三,DeepSeek 开源了新的基础模型,但不是万众期待的 V4,而是 V3.1-Base,而更早时候,DeepSeek-V3.1 就已经上线了其网页、App 端和小程序。



经过这差不多一周时间的真实用户测试,DeepSeek-V3.1 却被发现存在一个相当让人无语的问题:其某些输出 token 会被随机替换为「极」。

具体来说,据知乎用户 Fun10165 描述,她在调用火山引擎版 DeepSeek V3.1 帮助整理一份物理试卷时发现,该模型的输出中会莫名出现一些「极」字。



图源:知乎 @Fun10165

而后面在 Trae 中测试 DeepSeek-V3.1 时也同样出现了这个问题。

有意思的是,她还尝试了调用官方 API 修复这个问题。结果,在修复的过程中又出现了这个问题。



图源:知乎 @Fun10165

她表示:「实测,官方网页 / API 能复现,概率不高,但多试几次就能出来。VolcEngine API 复现概率非常高。」

帖子下方,也有一些其他用户分享了类似的发现。

比如知乎用户「去码头整点薯条」分享说 R1 也存在类似的问题,他还简单猜想了原因:「使用 R1 0528 的时候就遇到了很多次,我观察到的现象更离谱,会在代码里面插入 “极客园”,而且遇到不止一次,怀疑是不是学习的时候吃进去了什么电子水印吃坏肚子了。」

知乎用户「琪洛」则发现 V3-0324 也存在类似问题,只不过这一次输出的是「极速赛车开奖直播」字符串。

图源:知乎 @琪洛

她猜想道:「怀疑可能数据没洗干净,即便重新训了 base 这个问题还是留下了,题主和其他回答所述「极」和「极速」可能就是这个词的残余痕迹。」

而在 Reddit 上,相关话题也正被热烈讨论中。

发帖者用户 u/notdba 表示,在测试 DeepSeek V3.1 时,他发现模型会莫名地在某些意料之外的位置输出如下 token:

  • extreme (id:15075)
  • 极 (id:2577)
  • 極 (id:16411)

很显然,这仨都是同一个词。

他继续描述到,除了这 3 种「极」 token 在贪婪解码中成为首选的情况之外,这些「极」 token 也经常在其他意想不到的地方潜伏为第二或第三选择。

他说:「我已经对所有流行的编码模型都做过同样的评估,这是我第一次遇到这种问题。」

他的猜测是该问题可能会被 MTP(多 token 预测)掩盖,并且当推理堆栈不支持 MTP 时就会变得更加明显,比如 llama.cpp 就还不支持 MTP。这个猜想的合理之处在于支持 MTP 的 DeepSeek 官方 API 更不容易遇到这种情况,而第三方部署的同款模型则更容易出现这个问题。

用户 u/nekofneko 则分享了另一个案例:



图源:Reddit u/nekofneko

他给出的可能解释是:「极」的 token 是 2577,而省略号「...」的 token 是 2576。这两者可能被模型混淆了。

还不只是「极」,也有用户发现 DeepSeek-V3.1 还存在多语言混用的问题,u/Kitano_o 分享说:「我使用 3.1 从中文翻译成俄语时,遇到一些奇怪的行为。它开始混合多种语言 —— 添加英文词,也留下些中文词。有时这些问题会占到文本的 5%,有时只占 1%,甚至 0%。而且使用 OpenRouter 的不同提供商都会出现这个问题,即使我使用 DeepSeek 作为提供商也会。」



图源:Reddit u/Kitano_o

总体而言,对于 DeepSeek-V3.1 这个可以说相当严重的问题的原因,网友给出的猜测更多还是「数据污染」。

比如阶跃星辰黄哲威表示:「我认为是本身 sft 数据合成甚至是构造预训练数据的时候没洗干净引入了 “极长的数组” 这种怪东西(从 R1 的行为看,似乎大量使用了 RAG 方法来造难题的解答),然后 RL 的时候模型直接把这个字当某种终止符或者语言切换标记使用了。」



图源:知乎 @hzwer 黄哲威

他还提到:「其实推理出 bug,大概率都是数据问题,很多人都知道。只是 R1 的其它 bug 没有这么高频发生,社区不太关注而已。」

这次事件也给所有模型开发者敲响了警钟:在追求更高性能的 AI 模型时,最基础的数据质量,才是决定 AI 是否会「行为异常」的关键。

我们也把相关事件发送给了 DeepSeek 本尊,让它分析了一下可能的原因:



你遇到过这个问题吗?觉得可能的原因是什么?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
外交部:中方在南黄海渔业养殖设施问题上的立场没有变化

外交部:中方在南黄海渔业养殖设施问题上的立场没有变化

新京报
2026-01-27 19:00:06
收藏!山东省教育厅领导班子成员及工作分工!

收藏!山东省教育厅领导班子成员及工作分工!

山东教育
2026-01-27 20:39:41
至少有九家中国AI芯片公司出货量超万卡

至少有九家中国AI芯片公司出货量超万卡

财经AI湃
2026-01-28 08:05:51
陈汉典lulu婚礼,关颖的腿,王力宏许光汉的脸,把风头全抢了

陈汉典lulu婚礼,关颖的腿,王力宏许光汉的脸,把风头全抢了

喵喵娱乐团
2026-01-27 15:54:59
爱终于战胜了恨!大S的遗产将会由两个孩子全部继承,汪小菲代管

爱终于战胜了恨!大S的遗产将会由两个孩子全部继承,汪小菲代管

乡野小珥
2026-01-28 02:26:38
聂卫平爱女发文曝光离世真相!早年纵欲过度的他,被拖垮了身体

聂卫平爱女发文曝光离世真相!早年纵欲过度的他,被拖垮了身体

老范谈史
2026-01-21 18:25:21
曝章泽天父母2011年已离婚,父亲已重组家庭有小女儿,妈妈在卖药

曝章泽天父母2011年已离婚,父亲已重组家庭有小女儿,妈妈在卖药

古希腊掌管月桂的神
2026-01-25 15:42:46
炸锅!世界第一 10 号拒曼城铁心投曼联  9 年长约锁死转会?

炸锅!世界第一 10 号拒曼城铁心投曼联 9 年长约锁死转会?

澜归序
2026-01-27 06:50:21
人大代表一席话问住养犬人:你的宠物狗,凭什么让他人付出代价?

人大代表一席话问住养犬人:你的宠物狗,凭什么让他人付出代价?

议纪史
2026-01-26 18:45:03
广州一男子称电子交通卡被异常扣款一千四百多万元,工作人员:是小米钱包显示问题,并未造成实际扣款

广州一男子称电子交通卡被异常扣款一千四百多万元,工作人员:是小米钱包显示问题,并未造成实际扣款

大风新闻
2026-01-27 12:15:03
原来他就是李亚鹏外公,晚年定居美国,74岁才见外孙,105岁去世

原来他就是李亚鹏外公,晚年定居美国,74岁才见外孙,105岁去世

冷紫葉
2026-01-26 12:30:39
接下印度12.5亿大单,没签合同就开工!

接下印度12.5亿大单,没签合同就开工!

达文西看世界
2026-01-27 14:21:59
12斤肉3个月甩净!全红婵减重到离谱,这哪是减肥,是拿命拼金牌

12斤肉3个月甩净!全红婵减重到离谱,这哪是减肥,是拿命拼金牌

做一个合格的吃瓜群众
2025-12-31 07:41:05
早已领结婚证、和王曼昱地下恋,31岁林高远身上标签哪些是真的?

早已领结婚证、和王曼昱地下恋,31岁林高远身上标签哪些是真的?

以茶带书
2026-01-27 15:11:50
汉堡被嘲像马卡龙后又被爆员工在麦乐鸡盒玩手机 ,麦当劳怎么了

汉堡被嘲像马卡龙后又被爆员工在麦乐鸡盒玩手机 ,麦当劳怎么了

柴狗夫斯基
2026-01-27 08:48:22
志愿军嫌苏联冲锋枪太重,换成35发被嘲,结果把美军打得不敢露头

志愿军嫌苏联冲锋枪太重,换成35发被嘲,结果把美军打得不敢露头

鉴史录
2026-01-25 21:22:29
伊朗总统保证书送进白宫,哈梅内伊预感到不妙,提前一步躲进地堡

伊朗总统保证书送进白宫,哈梅内伊预感到不妙,提前一步躲进地堡

墨兰史书
2026-01-27 11:50:03
理想一线工人收入赶超日德的承诺,悬了

理想一线工人收入赶超日德的承诺,悬了

阿尔法工场
2026-01-27 10:18:39
五连胜,郑永刚:赢下比赛靠积极防守;春节前的三连客要打好

五连胜,郑永刚:赢下比赛靠积极防守;春节前的三连客要打好

懂球帝
2026-01-27 21:39:17
那个留法圈子的聊天记录,
看得人背脊发凉。

那个留法圈子的聊天记录, 看得人背脊发凉。

太急张三疯
2026-01-21 16:46:32
2026-01-28 08:48:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12202文章数 142550关注度
往期回顾 全部

科技要闻

Anthropic将融资200亿美元、估值3500亿美元

头条要闻

牛弹琴:印欧迎来大喜事 冯德莱恩被痛骂背叛欧洲人民

头条要闻

牛弹琴:印欧迎来大喜事 冯德莱恩被痛骂背叛欧洲人民

体育要闻

冒充职业球员,比赛规则还和对手现学?

娱乐要闻

张雨绮风波持续发酵,曝多个商务被取消

财经要闻

涨价!新风口,在路上了!

汽车要闻

标配华为乾崑ADS 4/鸿蒙座舱5 华境S体验车下线

态度原创

手机
健康
亲子
旅游
教育

手机要闻

鲁大师年度手机牛角尖盛典盘点,小米、vivo、荣耀、OPPO认可吗?

耳石脱落为何让人天旋地转+恶心?

亲子要闻

这把稳赢,他们的鹰不会尿尿!

旅游要闻

冰雪春天 | 雾凇里的“冰雪童话”

教育要闻

从华东师大,停招24个本科专业,看透未来 10 年就业风口!

无障碍浏览 进入关怀版