网易首页 > 网易号 > 正文 申请入驻

OpenAI o3-mini被曝大量使用中文推理!全世界AI都要学中国话了?

0
分享至

新智元报道

编辑:编辑部 JHh

【新智元导读】这两天,国外网友纷纷发现o3-mini-high在思考过程中居然会经常出现中文!难道真如网友猜测,是借鉴DeepSeek了?

国外网友,一觉醒来,发现o3-mini-high开始用中文思考了。

o3-mini-high作为美国最顶尖的模型之一,竟然在没有用户干预的情况下,如此大量地使用中文进行推理。

如此这般,不禁让网友怀疑,是不是OpenAI在「偷师」中国的DeepSeek模型。

更有意思的是,即便用俄语去提问,o3-mini-high也会用中文去思考。

对此,网友纷纷质问起了奥特曼和OpenAI:「o3-mini到底为什么要用中文进行推理」?!

左右滑动查看

网友Annalisa Fernandez则表示,或许中文才是LLM的「灵魂语言」。

经此争议,下面这张「DeepSeek/OpenAI罗生门」梗图,已经在外网迅速传开了。

语言混杂也是老毛病了

当然了,这并不是OpenAI的模型第一次发生这种现象。

早在去年2月份,就有开发者在OpenAI开发者社区上,报道过类似的问题,不过是混合了其他语言。

而在推理模型方面,OpenAI o1也存在类似的问题。

事实上,这种「语言混杂」(language mixing)现象在其他AI模型中也有发现。

比如,谷歌的Gemini会混杂德语。

为何会突然口吐中文?

那么,究竟是为何才让o3-mini-high在推理过程中口吐中文呢?

阿尔伯塔大学助理教授、AI研究员Matthew Guzdial提出了一个切中要害的观点:

「模型并不知道什么是语言,也不知道语言之间有什么不同,因为对它来说这些都只是文本。」

事实上,模型眼中的语言,和我们理解的完全不同。模型并不直接处理单词,而是处理 tokens。以「fantastic」为例,它可以作为一个完整的token;可以拆成「fan」、「tas」、「tic」三个token;也可以完全拆散,每个字母都是一个token。

但这种拆分方式也会带来一些误会。很多分词器看到空格就认为是新词的开始,但实际上不是所有语言都用空格分词,比如中文。

Hugging Face的工程师Tiezhen Wang认同Guzdial的看法,认为推理模型语言的不一致性可能是训练期间建立了某种特殊的关联。

他通过类比人类的思维过程,阐述了双语能力的深层含义:掌握双语绝非仅仅局限于能够流利使用两种语言,更是一种独特的思维模式。在这种模式下,大脑会依据当下的场景,本能地挑选最为适配的语言。例如,在进行数学运算时,使用中文往往简洁高效,因为每个数字仅需一个音节;而在探讨「无意识偏见」这类概念时,大脑则会自然地切换到英文,这是由于最初接触该概念便是通过英文。

这种语言切换的过程,恰似程序员在选择编程语言时的自然反应。尽管多数编程语言都具备完成任务的能力,但我们会依据不同需求,选择用Bash编写命令行,使用Python进行机器学习,因为每种语言都有其特定的最佳适用场景。

「工具的选择需因场合而异」,这一理念对AI训练有着重要启示:让AI接触多种语言,使其能够学习不同文化所蕴含的独特思维方式。这种包容性不仅能让AI更加全面,还能使其更加公平。

在Reddit相关帖子下,不少网友表达了相似的观点,即不同的语言各有擅长的领域。

左右滑动查看

当然,也有另外的推测观点。比如网友Someone Kong分析认为,这可能是因为中文更短,所以会在强化学习中获得更多的奖励。

此外,正如网友们反复提到的,DeepSeek在论文中对这一现象进行了分析。

研究团队发现,当强化学习提示词涉及多种语言时,思维链常常出现语言混杂(language mixing)的现象。

为了减轻语言混杂的问题,DeepSeek在RL训练过程中引入了「语言一致性奖励」,计算方法是CoT中目标语言词汇的比例。

尽管消融实验表明,这种对齐方式会导致模型性能的轻微下降,但这一奖励符合人类偏好,使模型的输出更加可读。最后,推理任务的准确度和语言一致性奖励直接相加,形成最终的奖励。

目前,「语言混杂」还亟待解决。

毕竟DeepSeek-R1也只是针对中文和英文进行了优化,在处理其他语言的查询时, 也可能出现语言混杂问题。

例如,即使查询是用非英语或非中文的语言提出的,DeepSeek-R1也可能在推理和回答中使用英文。

论文链接:https://arxiv.org/pdf/2501.12948

或许,正如维特根斯坦所言:「语言的界限就是世界的界限」。

道理是这个道理,但对于那些没学过外语的用户来说,这个推理过程不要也罢!(手动狗头)

比如网友Gabe在看到这么一长串的中文推理后,甚至开始怀疑:「o3-mini会不会给的都是错误答案。」

有趣的是,就在事件发酵后不久,奥特曼便在2月3日表示,OpenAI「没有计划」起诉DeepSeek。

在采访中,奥特曼非常自信地表示,OpenAI可以继续引领世界:

DeepSeek无疑是一个令人印象深刻的模型,但我们相信,我们会继续推动技术前沿,推出更多优秀的产品,所以很高兴有一个新的竞争对手。

值得一提的是,OpenAI本身也面临着多项知识产权侵权指控,主要与模型训练时使用受版权保护的内容有关。

参考资料:

https://www.reddit.com/r/OpenAI/comments/1iflvc8/o3_thinks_in_chinese_for_no_reason_randomly/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
84年黄克诚应要求谈一谈林彪,黄老发言震惊四座:这话只能黄老讲

84年黄克诚应要求谈一谈林彪,黄老发言震惊四座:这话只能黄老讲

春秋砚
2025-11-18 10:00:19
A股:大家要做好心理准备,今天涨到3946点,不出所料明天这样走

A股:大家要做好心理准备,今天涨到3946点,不出所料明天这样走

一只番茄鱼
2025-11-19 15:07:08
54岁于和伟演毛主席,这一次,他让唐国强和整个娱乐圈沉默了!

54岁于和伟演毛主席,这一次,他让唐国强和整个娱乐圈沉默了!

笔谈慧
2025-11-18 14:00:46
当初足协对陈达毅爱搭不理,现在陈达毅却要去踢世界杯了!

当初足协对陈达毅爱搭不理,现在陈达毅却要去踢世界杯了!

田先生篮球
2025-11-19 16:02:06
2锋线缺阵 火箭首发5将冲5连胜 第三中锋进轮换?谢泼德坐稳第6人

2锋线缺阵 火箭首发5将冲5连胜 第三中锋进轮换?谢泼德坐稳第6人

替补席看球
2025-11-19 14:47:42
裹足不前!波克罗夫斯克战役成现代斯大林格勒,俄军未能巩固优势

裹足不前!波克罗夫斯克战役成现代斯大林格勒,俄军未能巩固优势

军迷战情室
2025-11-18 20:18:13
科学家挖出2000多年前种子,种植后,竟长出早已灭绝1500多年植物

科学家挖出2000多年前种子,种植后,竟长出早已灭绝1500多年植物

狸猫之一的动物圈
2025-11-19 11:31:32
被曝和景甜闪婚才2个月,冯绍峰再次官宣喜讯,赵丽颖也高攀不起

被曝和景甜闪婚才2个月,冯绍峰再次官宣喜讯,赵丽颖也高攀不起

小张帅
2025-11-19 14:46:05
爆发!杨瀚森爆砍9分5板3助1帽创新高,超周琦成易建联后中国第一人

爆发!杨瀚森爆砍9分5板3助1帽创新高,超周琦成易建联后中国第一人

818体育
2025-11-19 15:40:16
郑丽文提“一国两区”,蓝营民调大涨;民进党没招了,再打抗中牌

郑丽文提“一国两区”,蓝营民调大涨;民进党没招了,再打抗中牌

前沿天地
2025-11-18 14:47:14
央5播江苏女排VS山东,开球时间确定,张常宁PK杨涵玉,谁能夺金

央5播江苏女排VS山东,开球时间确定,张常宁PK杨涵玉,谁能夺金

体育大学僧
2025-11-19 10:43:23
刘传兴被交易?山西官宣,公布赛季名单,杜锋点名,还剩2年合同

刘传兴被交易?山西官宣,公布赛季名单,杜锋点名,还剩2年合同

乐聊球
2025-11-19 11:19:11
90天倒闭230家,多地关店老板跑路,毛利高达60%的生意也扛不住了

90天倒闭230家,多地关店老板跑路,毛利高达60%的生意也扛不住了

泠泠说史
2025-10-24 15:44:20
在美失联超3周的女留学生已找到,父亲为女儿报平安

在美失联超3周的女留学生已找到,父亲为女儿报平安

现代快报
2025-11-18 23:40:05
NCAA历史首次!中国两将同时登场:王俊杰4+3+4+2 赵维伦5+4

NCAA历史首次!中国两将同时登场:王俊杰4+3+4+2 赵维伦5+4

醉卧浮生
2025-11-19 13:04:53
给口碑最好的10部谍战剧排名:《沉默的荣耀》第10,第1实至名归

给口碑最好的10部谍战剧排名:《沉默的荣耀》第10,第1实至名归

皮皮电影
2025-11-19 13:55:03
短羽绒服+阔腿裤今年冬天又火了,这样搭配减龄不说还更时髦!

短羽绒服+阔腿裤今年冬天又火了,这样搭配减龄不说还更时髦!

马三妮
2025-11-19 16:14:41
朱元璋登基后赏赐姐夫,姐夫跪地只求回乡种地,承诺此生不进京城

朱元璋登基后赏赐姐夫,姐夫跪地只求回乡种地,承诺此生不进京城

晓艾故事汇
2025-11-18 17:12:56
风向真的变了!各国媒体纷纷承认,中国已无需再向世界证明其实力

风向真的变了!各国媒体纷纷承认,中国已无需再向世界证明其实力

铁锤简科
2025-11-04 11:31:17
国足的选人标准是什么?汪士钦是怎么被选上的,他符合标准……?

国足的选人标准是什么?汪士钦是怎么被选上的,他符合标准……?

田先生篮球
2025-11-19 16:19:50
2025-11-19 17:32:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13904文章数 66274关注度
往期回顾 全部

科技要闻

一夜封神,Gemini 3让谷歌找回“碾压感”

头条要闻

网红"橙子姐姐"被指在柬失联多日 柬方通报:其已被捕

头条要闻

网红"橙子姐姐"被指在柬失联多日 柬方通报:其已被捕

体育要闻

世界杯最小参赛国诞生!15万人岛国的奇迹

娱乐要闻

又反转!曝喻恩泰出轨美女律师

财经要闻

黄金税改两周,水贝低价神话终结?

汽车要闻

此刻价格不重要 第5代帝豪本身就是价值

态度原创

旅游
游戏
时尚
健康
房产

旅游要闻

惊险!四川一景区载客大巴因路面结冰侧滑左摇右摆,目击者大呼“稳住,稳住”

《回音:飞艇传说》开发者回顾新品节:感谢中国玩家的帮助

陈嘉桦,不慌不忙的惊艳

警惕超声报告这六大"坑"

房产要闻

29.4亿!海南“地王”片区,要卖超级宅地!

无障碍浏览 进入关怀版