网易首页 > 网易号 > 正文 申请入驻

DeepSeek“极你太美”bug,官方回应了

0
分享至

金磊 发自 凹非寺
量子位 | 公众号 QbitAI

DeepSeek V3.1上演的bug大秀“你太美”,可谓是让全网热议了一波。

简单来说呢,就是陆续有开发者们发现,当他们在调用API进行代码开发的过程中,输出结果里会时不时蹦出来“极”字

像这样:

这个问题最初是在火山引擎、chutes等平台上被发现,但随着事件的发酵,更多平台也被卷入了进来,包括腾讯的CodeBuddy,甚至是DeepSeek官方……

事件之火,在国外Reddit上也是讨论声一片,重灾区是“extreme”、“极” 和“極”:

  • “extreme”(id:15075)
  • “极”(id:2577,简体中文的extreme)
  • “極”(id:16411,繁体中文中的extreme)

腾讯CodeBuddy还出现了更加奇葩的情况,直接插了句带“极”字儿的广告……

△图源:小红书用户@ 奈绪白 Nine-piece shell

若是开发者们没有细看,直接用了生成的代码,那定然是会导致编译不通过等情况,可以说是对需要高精度、结构化输出的场景是致命一击。

截至目前,大家已经统一将问题的矛头指向了DeepSeek V3.1模型本身,以及CodeBuddy帮忙问了:

  • 已经和DeepSeek团队取得联系,将在最近的一个版本中进行修复。

△图源:微信公众号“刘小排r”评论区

现在该如何防范“极”字bug?

就目前来看,虽然完全解决问题要等到DeepSeek官方下场,但已经有网友开始支招解决这个问题了。

例如小红书网友@大模型产品经理,便分享了一招——提示词缓解

关键的一句提示词是这样的:

  • 禁止如下符号序列模式:
    [空格] [几个token] [占位符/省略符号]

并且这个方法主要是针对调用API的第三方平台,若是在DeepSeek V3.1官方,则不需要。

为什么会这样?

最后,至于为什么DeepSeek V3.1会出现这样的bug,知乎网友、阶跃星辰黄哲威给出了他的看法,并获得了高赞。

他首先指出,这种现象并非孤例。在他使用小模型和开源数据蒸馏,以及在测试早期的R1模型时,就曾遇到过类似的bug。

黄哲威认为,这与大模型编程编题时可能出现的一种“恶性模式”(malicious pattern)有关。他举例说,在枚举素数的任务中,一个正常的模型本应无限地列举下去,如“素数表 2, 3, 5, 7 …”。

然而,他观察到之前一个代号为 R1-0528 的模型会出现一种奇特行为:在列举一段后会自行停止,变成一个有限的列表,例如“素数表 2, 3, 5, 7 … 997, 极长”。

这个“极长”的用法,与现在讨论的“极”字问题非常相似,常常出现在大量恶性重复之后,作为正常推理过程的回正。有时,模型甚至会输出“90000000…0000极大的数字”这样的内容。

他进一步描述了这种bug的触发场景。当模型陷入“thinking”的末尾循环无法跳出时,有千分之一的概率会突然蹦出一个“极”字,然后终止思考(),这似乎是一种特殊的终止符或标记。

通过观察R1模型大量的输出,黄哲威发现了不少问题,包括超长响应(response)、大面积的空白字符、不断的短句重复等,甚至连thinking末尾的英文字符都变得破碎。

基于以上观察,他提出了一个核心推测:这个问题的根源可能在于数据清洗不彻底。他认为,在进行SFT(监督微调)数据合成,乃至构建预训练数据时,可能没有将一组名为“‘极长’的数组”的“脏数据”清洗干净。

他推断,R1模型在处理一些难题的解答时,似乎大量使用了RAG(检索增强生成)技术,而后续的RL(强化学习)阶段,模型直接将这个“极”字当作了某种终止符或者语言切换标记来学习和使用了。

最后,黄哲威总结道,如果R1迭代时的数据没有清洗干净,模型自行蒸馏并“污染”到正常的输出过程中,是完全可能发生的。这为理解DeepSeek V3.1模型出现的“极”字问题提供了一个可能的解释路径。

至于这个被网友戏称为“极你太美”、“‘极’速版”的问题到底何时会彻底解决,就要等DeepSeek官方的新版本了。

参考链接:
[1]https://mp.weixin.qq.com/s/MrozcO_iRvoxK1HvgP4IVA
[2]https://www.zhihu.com/question/1942934856603505597
[3]https://www.reddit.com/r/LocalLLaMA/comments/1mzsg6v/deepseek_v31_getting_token_extreme_%E6%9E%81_%E6%A5%B5_out_of/
[4]https://linux.do/t/topic/897789

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伊朗要变天了!穆杰塔巴可能已失去所有权力,三分天下格局形成?

伊朗要变天了!穆杰塔巴可能已失去所有权力,三分天下格局形成?

惊视
2026-06-26 05:59:36
绿洲珠宝行血案,浙江6任厅长追凶22年,抓到嫌犯后大家都愣住了

绿洲珠宝行血案,浙江6任厅长追凶22年,抓到嫌犯后大家都愣住了

崖边行
2025-06-27 21:11:22
两场40分32板统治赛场!19岁天才兼具胡金秋稳定,大郅传球视野

两场40分32板统治赛场!19岁天才兼具胡金秋稳定,大郅传球视野

晚雾空青
2026-06-26 10:35:03
女子因病长巨胸太痛想全切掉?被压到走不动路,苦等手术多年…

女子因病长巨胸太痛想全切掉?被压到走不动路,苦等手术多年…

英国报姐
2026-06-25 00:49:45
刚刚,男篮首批裁员名单公布,四人两场热身赛未登场,郭导不再给予机会

刚刚,男篮首批裁员名单公布,四人两场热身赛未登场,郭导不再给予机会

兰亭墨未干
2026-06-26 08:30:21
俄罗斯向哈萨克斯坦请求5万吨汽油援助

俄罗斯向哈萨克斯坦请求5万吨汽油援助

山河路口
2026-06-24 23:43:12
为什么今年没人提“消费降级”了?

为什么今年没人提“消费降级”了?

黯泉
2026-05-20 17:47:21
脸都不要了!世界杯头号罪人!德国输球都是他害的!

脸都不要了!世界杯头号罪人!德国输球都是他害的!

奶盖熊本熊
2026-06-26 06:41:44
苹果突然涨价,股价大跌

苹果突然涨价,股价大跌

极目新闻
2026-06-26 09:01:37
记者:森林狼得到三球前,追求目标为哈登和莫兰特

记者:森林狼得到三球前,追求目标为哈登和莫兰特

懂球帝
2026-06-26 09:43:22
为何勃列日涅夫执掌苏联18年,中风后智力衰退,却没人敢迫他下台

为何勃列日涅夫执掌苏联18年,中风后智力衰退,却没人敢迫他下台

人生录
2026-06-23 22:24:22
造成3死1伤!福建福州市发生一起较大中毒窒息事故,调查评估报告发布:1人获刑三年,8人被给予党纪政务处分;因员工盲目施救造成伤亡扩大

造成3死1伤!福建福州市发生一起较大中毒窒息事故,调查评估报告发布:1人获刑三年,8人被给予党纪政务处分;因员工盲目施救造成伤亡扩大

台州交通广播
2026-06-25 14:38:17
1-3完败!世界杯最惨球队诞生:三场狂丢12球,7次参赛全出局

1-3完败!世界杯最惨球队诞生:三场狂丢12球,7次参赛全出局

体坛小李
2026-06-26 09:21:50
买桃子时,一定要挑“公”的,记住这5点,选到的桃子脆甜又多汁

买桃子时,一定要挑“公”的,记住这5点,选到的桃子脆甜又多汁

房产衫哥
2026-06-26 00:48:43
你们再这么清醒下去,娱乐圈迟早要挂掉!

你们再这么清醒下去,娱乐圈迟早要挂掉!

走读新生
2026-06-23 17:32:04
79岁王奎荣将北京140平房子、2000多万存款,全部赠予小37岁妻子

79岁王奎荣将北京140平房子、2000多万存款,全部赠予小37岁妻子

老鹈爱说事
2026-06-23 02:15:54
对话当事人|佛得角足协副主席保罗·桑托斯:我们准备了10年,只为让世界看见

对话当事人|佛得角足协副主席保罗·桑托斯:我们准备了10年,只为让世界看见

上游新闻
2026-06-25 20:50:01
大罗这辈子算是彻底安定下来了,真的人生赢家

大罗这辈子算是彻底安定下来了,真的人生赢家

南万说娱26
2026-06-25 11:15:16
WTT美国大满贯明天开打!国乒16人出战:关注5大看点,附总赛程

WTT美国大满贯明天开打!国乒16人出战:关注5大看点,附总赛程

全言作品
2026-06-26 08:54:01
鸿蒙只剩华为一家在死磕,不是小米OPPO不懂,是账本一翻不想陪跑

鸿蒙只剩华为一家在死磕,不是小米OPPO不懂,是账本一翻不想陪跑

叮当当科技
2026-06-25 00:38:04
2026-06-26 11:51:00
量子位 incentive-icons
量子位
追踪人工智能动态
12843文章数 176505关注度
往期回顾 全部

科技要闻

美国政府要求OpenAI分批发布GPT-5.6

头条要闻

德国输球"隔空"报了8年前的仇 韩国晋级希望又变小

头条要闻

德国输球"隔空"报了8年前的仇 韩国晋级希望又变小

体育要闻

三球换里德:森林狼和黄蜂谁更癫?!

娱乐要闻

刘嘉玲想放弃梁朝伟,没有自理能力

财经要闻

悬在科技头上的达摩克利斯之剑

汽车要闻

老板们的新座驾!65万元起,尊界V800/V680开启预订

态度原创

本地
教育
手机
房产
健康

本地新闻

2026世界杯全勤太难?这份保姆级攻略请收好

教育要闻

大模型高考放榜:为什么最能考试的是讯飞星火?

手机要闻

特朗普手机T1正式开售 499美元实为国产贴牌机

房产要闻

城市精英集体出手!科学城这一现象级热销红盘,凭何成为共识之选?

医生如何快速诊断脑梗和脑出血?

无障碍浏览 进入关怀版