网易首页 > 网易号 > 正文 申请入驻

OpenAI o3-mini被曝大量使用中文推理!全世界AI都要学中国话了?

0
分享至

新智元报道

编辑:编辑部 JHh

【新智元导读】这两天,国外网友纷纷发现o3-mini-high在思考过程中居然会经常出现中文!难道真如网友猜测,是借鉴DeepSeek了?

国外网友,一觉醒来,发现o3-mini-high开始用中文思考了。

o3-mini-high作为美国最顶尖的模型之一,竟然在没有用户干预的情况下,如此大量地使用中文进行推理。

如此这般,不禁让网友怀疑,是不是OpenAI在「偷师」中国的DeepSeek模型。

更有意思的是,即便用俄语去提问,o3-mini-high也会用中文去思考。

对此,网友纷纷质问起了奥特曼和OpenAI:「o3-mini到底为什么要用中文进行推理」?!

左右滑动查看

网友Annalisa Fernandez则表示,或许中文才是LLM的「灵魂语言」。

经此争议,下面这张「DeepSeek/OpenAI罗生门」梗图,已经在外网迅速传开了。

语言混杂也是老毛病了

当然了,这并不是OpenAI的模型第一次发生这种现象。

早在去年2月份,就有开发者在OpenAI开发者社区上,报道过类似的问题,不过是混合了其他语言。

而在推理模型方面,OpenAI o1也存在类似的问题。

事实上,这种「语言混杂」(language mixing)现象在其他AI模型中也有发现。

比如,谷歌的Gemini会混杂德语。

为何会突然口吐中文?

那么,究竟是为何才让o3-mini-high在推理过程中口吐中文呢?

阿尔伯塔大学助理教授、AI研究员Matthew Guzdial提出了一个切中要害的观点:

「模型并不知道什么是语言,也不知道语言之间有什么不同,因为对它来说这些都只是文本。」

事实上,模型眼中的语言,和我们理解的完全不同。模型并不直接处理单词,而是处理 tokens。以「fantastic」为例,它可以作为一个完整的token;可以拆成「fan」、「tas」、「tic」三个token;也可以完全拆散,每个字母都是一个token。

但这种拆分方式也会带来一些误会。很多分词器看到空格就认为是新词的开始,但实际上不是所有语言都用空格分词,比如中文。

Hugging Face的工程师Tiezhen Wang认同Guzdial的看法,认为推理模型语言的不一致性可能是训练期间建立了某种特殊的关联。

他通过类比人类的思维过程,阐述了双语能力的深层含义:掌握双语绝非仅仅局限于能够流利使用两种语言,更是一种独特的思维模式。在这种模式下,大脑会依据当下的场景,本能地挑选最为适配的语言。例如,在进行数学运算时,使用中文往往简洁高效,因为每个数字仅需一个音节;而在探讨「无意识偏见」这类概念时,大脑则会自然地切换到英文,这是由于最初接触该概念便是通过英文。

这种语言切换的过程,恰似程序员在选择编程语言时的自然反应。尽管多数编程语言都具备完成任务的能力,但我们会依据不同需求,选择用Bash编写命令行,使用Python进行机器学习,因为每种语言都有其特定的最佳适用场景。

「工具的选择需因场合而异」,这一理念对AI训练有着重要启示:让AI接触多种语言,使其能够学习不同文化所蕴含的独特思维方式。这种包容性不仅能让AI更加全面,还能使其更加公平。

在Reddit相关帖子下,不少网友表达了相似的观点,即不同的语言各有擅长的领域。

左右滑动查看

当然,也有另外的推测观点。比如网友Someone Kong分析认为,这可能是因为中文更短,所以会在强化学习中获得更多的奖励。

此外,正如网友们反复提到的,DeepSeek在论文中对这一现象进行了分析。

研究团队发现,当强化学习提示词涉及多种语言时,思维链常常出现语言混杂(language mixing)的现象。

为了减轻语言混杂的问题,DeepSeek在RL训练过程中引入了「语言一致性奖励」,计算方法是CoT中目标语言词汇的比例。

尽管消融实验表明,这种对齐方式会导致模型性能的轻微下降,但这一奖励符合人类偏好,使模型的输出更加可读。最后,推理任务的准确度和语言一致性奖励直接相加,形成最终的奖励。

目前,「语言混杂」还亟待解决。

毕竟DeepSeek-R1也只是针对中文和英文进行了优化,在处理其他语言的查询时, 也可能出现语言混杂问题。

例如,即使查询是用非英语或非中文的语言提出的,DeepSeek-R1也可能在推理和回答中使用英文。

论文链接:https://arxiv.org/pdf/2501.12948

或许,正如维特根斯坦所言:「语言的界限就是世界的界限」。

道理是这个道理,但对于那些没学过外语的用户来说,这个推理过程不要也罢!(手动狗头)

比如网友Gabe在看到这么一长串的中文推理后,甚至开始怀疑:「o3-mini会不会给的都是错误答案。」

有趣的是,就在事件发酵后不久,奥特曼便在2月3日表示,OpenAI「没有计划」起诉DeepSeek。

在采访中,奥特曼非常自信地表示,OpenAI可以继续引领世界:

DeepSeek无疑是一个令人印象深刻的模型,但我们相信,我们会继续推动技术前沿,推出更多优秀的产品,所以很高兴有一个新的竞争对手。

值得一提的是,OpenAI本身也面临着多项知识产权侵权指控,主要与模型训练时使用受版权保护的内容有关。

参考资料:

https://www.reddit.com/r/OpenAI/comments/1iflvc8/o3_thinks_in_chinese_for_no_reason_randomly/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
巴西面临生死存亡时刻

巴西面临生死存亡时刻

观察者网
2026-01-13 14:11:03
1962年北京饭店,没人敢理那个落难副省长,许世友提着茅台就上,17年后这笔账终于算清了

1962年北京饭店,没人敢理那个落难副省长,许世友提着茅台就上,17年后这笔账终于算清了

源溯历史
2026-01-13 23:49:16
卡里克锁定曼联重建核心!不是 B 费,竟是被阿莫林弃用的他

卡里克锁定曼联重建核心!不是 B 费,竟是被阿莫林弃用的他

奶盖熊本熊
2026-01-14 02:11:51
6-2定律!赵心童8强对手诞生,中国最多4人突破首轮,看丁俊晖了

6-2定律!赵心童8强对手诞生,中国最多4人突破首轮,看丁俊晖了

球场没跑道
2026-01-14 06:36:02
库页岛有“三不”:不属于中国、不像俄罗斯、不承认过去

库页岛有“三不”:不属于中国、不像俄罗斯、不承认过去

壹知眠羊
2026-01-13 07:14:17
2百万人围观的Claude Code 实战使用指南

2百万人围观的Claude Code 实战使用指南

人工智能学家
2026-01-12 19:19:26
一汽丰田在新年放了第一枪,调整全新SUV售价

一汽丰田在新年放了第一枪,调整全新SUV售价

张麻子说车
2026-01-12 22:14:32
蔡依林演唱会被举报“搞邪教仪式”:30米机械蛇、金色公牛等引争议,网友质疑含西方宗教元素;此前蔡依林方已发声明称为恶意造谣

蔡依林演唱会被举报“搞邪教仪式”:30米机械蛇、金色公牛等引争议,网友质疑含西方宗教元素;此前蔡依林方已发声明称为恶意造谣

扬子晚报
2026-01-12 13:52:04
疯狂的9-0!1人帽子戏法+造5球,欧冠球队踢疯了强势晋级

疯狂的9-0!1人帽子戏法+造5球,欧冠球队踢疯了强势晋级

乌龙球OwnGoal
2026-01-14 09:15:47
天呀,杜海涛竟然现成这样了,沈梦辰对他是真爱啊

天呀,杜海涛竟然现成这样了,沈梦辰对他是真爱啊

草莓解说体育
2026-01-07 01:43:18
交警提醒:即日起,私家车实行“2+3”新式严查,扣分罚款没商量

交警提醒:即日起,私家车实行“2+3”新式严查,扣分罚款没商量

复转这些年
2026-01-12 23:41:30
终结上海9连胜,郑永刚:球队现在非常团结,贺希宁堪称劳模

终结上海9连胜,郑永刚:球队现在非常团结,贺希宁堪称劳模

懂球帝
2026-01-14 00:03:48
雷军:小米SU7目前二手车保值率为80.1%,居行业头部水平

雷军:小米SU7目前二手车保值率为80.1%,居行业头部水平

鞭牛士
2026-01-13 19:07:05
央视唯一承认的“灵异事件”,至今仍被人们津津乐道

央视唯一承认的“灵异事件”,至今仍被人们津津乐道

寒士之言本尊
2025-11-18 12:52:07
78:18!石破茂力挺高市:无需道歉,中日关系已恶化,在野党亮剑

78:18!石破茂力挺高市:无需道歉,中日关系已恶化,在野党亮剑

潮鹿逐梦
2026-01-13 21:08:50
阿根廷2026世界杯客场球衣曝光!三叶草+国花设计成最大亮点

阿根廷2026世界杯客场球衣曝光!三叶草+国花设计成最大亮点

未来展望
2026-01-14 08:39:13
24.7℃!破纪录!三九天成三月天?湖北将有大范围雨雪,阵风9级

24.7℃!破纪录!三九天成三月天?湖北将有大范围雨雪,阵风9级

极目新闻
2026-01-13 17:54:30
“这种儿子,直接用钢筋揍!”家长晒农村儿子现状,网友忍无可忍

“这种儿子,直接用钢筋揍!”家长晒农村儿子现状,网友忍无可忍

妍妍教育日记
2026-01-08 20:37:01
WTT多哈球星赛:国乒首日6战全胜!1月14日赛程公布,附正赛签表

WTT多哈球星赛:国乒首日6战全胜!1月14日赛程公布,附正赛签表

全言作品
2026-01-14 05:07:38
海港冬训海报 武磊跟LEO占C位 梅伦多跟加布里不在之中

海港冬训海报 武磊跟LEO占C位 梅伦多跟加布里不在之中

80后体育大蜀黍
2026-01-13 23:49:22
2026-01-14 09:28:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14326文章数 66456关注度
往期回顾 全部

科技要闻

美国放宽对英伟达H200芯片出口中国的管制

头条要闻

加拿大总理访问中国 在华加拿大商界感到非常兴奋

头条要闻

加拿大总理访问中国 在华加拿大商界感到非常兴奋

体育要闻

他带出国乒世界冠军,退休后为爱徒返场

娱乐要闻

蔡卓妍承认新恋情,与男友林俊贤感情稳定

财经要闻

特朗普抨击鲍威尔:"那个混蛋"很快走人

汽车要闻

限时9.99万元起 2026款启辰大V DD-i虎鲸上市

态度原创

时尚
本地
亲子
房产
健康

【年度爱用】她们2025年买得最值的,是这些

本地新闻

云游内蒙|到巴彦淖尔去,赴一场塞上江南的邀约

亲子要闻

3岁半女孩学习跳舞,小小年纪为了收腹用尽力气 #睡个好觉

房产要闻

又一新校开建!海口这一片区,迎来教育重磅升级!

血常规3项异常,是身体警报!

无障碍浏览 进入关怀版