网易首页 > 网易号 > 正文 申请入驻

“见人下菜”!AI大模型的“分裂难题”

0
分享至

当下人工智能大模型正面临一个棘手的技术困境:同一个问题换种说法,模型给出的答案质量可能天差地别。

这个被称为"分裂大脑"(split-brain)的问题,暴露了AI模型对提问方式的过度敏感——如果模型认为用户在问一个"高级"问题,它会给出"聪明"的答案;如果它判断这是个"简单"问题,答案质量就会相应下降。

据The Information最新报道,OpenAI等机构的研究人员称,这一问题通常出现在模型训练的后期阶段,当模型为学习特定领域知识或改善对话风格而接受精选数据训练时。一个典型场景是:同样的数学问题用正式的证明语言提问时,模型通常能正确作答;但若用随意的口语化表达,模型可能误以为进入了需要友好回应的场景,转而牺牲准确性来换取格式美观或表情符号。

这一问题凸显了当今AI模型的根本局限:它们并未像人类那样真正理解世界如何运作。部分专家认为,这意味着模型缺乏泛化能力,无法处理训练材料之外的任务。这对投资者而言并非小事——各大实验室正获得数百亿美元投资,目标是让模型在医学、数学等领域做出新发现。

这也并非人们对即将自动化各行业工作的AI所期待的表现。人类固然会误解问题,但使用AI自动化工作的初衷,不正是要克服这些人类缺陷吗?

训练困境:修复漏洞引发新问题

开发新的人工智能模型有时像是在玩"打地鼠"游戏:修复模型对某些问题的错误答案,可能导致它对其他问题给出错误回答。

"分裂大脑"问题往往在模型开发的后期训练阶段浮现。在这一阶段,模型会接受精选数据集的训练,目的是学习医学或法律等特定领域知识,或学习如何更好地回应聊天机器人用户。例如,模型可能先在数学问题数据集上训练以提高答题准确性,随后在另一个数据集上训练以改善回答问题时的个性、语气和格式。

但这一过程可能无意中教会模型根据它认为自己遇到的场景——具体的数学问题还是更宽泛的一般性问题——来区别对待提问。这种过度敏感不仅体现在问题措辞上,即使是使用破折号还是冒号这类本应无关紧要的差异,都可能影响模型回答的质量。

"见人下菜"的本质原因

简而言之,如果模型认为提问者在问一个"愚蠢"的问题,它会给出"愚蠢"的答案;如果它认为这是个"聪明"的问题,就会给出"聪明"的答案。

这一问题揭示了模型训练的复杂性和微妙之处,尤其是确保模型在恰当的数据组合上训练。这也解释了为何每家AI开发商都在向数学、编程、法律等领域的专家支付数十亿美元,让他们生成训练数据,以确保模型在这些领域的专家用户在ChatGPT等平台提问时不会继续犯简单错误。

这一现象也突显了当今模型的核心局限:它们没有像人类那样发展出对世界运作方式的理解。部分专家认为,这意味着模型无法泛化,无法处理其训练材料之外的特定任务。考虑到投资者正向OpenAI和Anthropic等实验室投入数百亿美元,期待它们训练出能在医学和数学等领域做出新发现的模型,这可能是个大问题。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
原来他们是母子,《家业》他是低调星二代,7岁和妈妈拍广告走红

原来他们是母子,《家业》他是低调星二代,7岁和妈妈拍广告走红

娱君坠星河
2026-06-03 17:30:12
印度被高温逼出一个疯狂想法,可是这事连中国都望尘莫及!

印度被高温逼出一个疯狂想法,可是这事连中国都望尘莫及!

华庭讲美食
2026-05-31 00:20:42
法网最新赛程:中国金花生死战,或创大满贯新纪录,冲117万奖金

法网最新赛程:中国金花生死战,或创大满贯新纪录,冲117万奖金

刘姚尧的文字城堡
2026-06-03 09:19:58
首个退群北约的国家来了:已走程序,退意已决!

首个退群北约的国家来了:已走程序,退意已决!

福建睿平
2026-04-27 11:46:08
库里签约李宁内幕曝光:50%股份仍落败,第一双鞋早已暗示结局

库里签约李宁内幕曝光:50%股份仍落败,第一双鞋早已暗示结局

深析古今
2026-06-03 14:59:58
女友嫌我家穷提出分手,20年后,我就任市里领导,在聚会上遇见她

女友嫌我家穷提出分手,20年后,我就任市里领导,在聚会上遇见她

千秋文化
2026-05-29 19:58:13
俄罗斯对乌克兰全境发动袭击,动用高超音速导弹等武器!泽连斯基:乌克兰经历艰难一天,已致乌22死130伤

俄罗斯对乌克兰全境发动袭击,动用高超音速导弹等武器!泽连斯基:乌克兰经历艰难一天,已致乌22死130伤

每日经济新闻
2026-06-03 11:35:41
深圳女商人罗长丽把国内套路搬去美国,12亿天价勒索栽在FBI手里

深圳女商人罗长丽把国内套路搬去美国,12亿天价勒索栽在FBI手里

观星娱记
2026-05-13 11:06:24
大批东莞工厂反常疯狂招工!订单回暖还是套路?打工人别盲目进场

大批东莞工厂反常疯狂招工!订单回暖还是套路?打工人别盲目进场

一口娱乐
2026-06-04 00:49:05
有多少人,因为这些原因,越来越讨厌忆秦娥?

有多少人,因为这些原因,越来越讨厌忆秦娥?

容妃
2026-06-03 10:30:55
装了电磁弹射器,也装了阻拦索,那为什么"四川舰"不能当航母用

装了电磁弹射器,也装了阻拦索,那为什么"四川舰"不能当航母用

咸鱼金脑袋
2026-06-03 04:36:09
拿了中国援助,菲防长竟说这是中方的“包装和欺骗”,我方回应

拿了中国援助,菲防长竟说这是中方的“包装和欺骗”,我方回应

触摸史迹
2026-06-04 01:07:33
老话不假:一个人的善报和恶报,大多在60岁左右应验,千万别不信

老话不假:一个人的善报和恶报,大多在60岁左右应验,千万别不信

心理观察局
2026-05-30 07:39:07
大S年轻时房间曝光,太过诡异引人不适,难怪有人曾说活不过50岁

大S年轻时房间曝光,太过诡异引人不适,难怪有人曾说活不过50岁

草莓解说体育
2026-05-11 20:49:33
49年解放上海,市长陈良四处寻觅替死鬼,一眼选中投诚我党局长

49年解放上海,市长陈良四处寻觅替死鬼,一眼选中投诚我党局长

大运河时空
2026-06-02 17:55:03
夫妻性生活别急着进入!学会这招“延迟满足”,爽感增倍

夫妻性生活别急着进入!学会这招“延迟满足”,爽感增倍

精彩分享快乐
2026-05-13 12:05:07
最多3年2.07亿!这是步行者给西亚卡姆的全部,能否续约已有答案

最多3年2.07亿!这是步行者给西亚卡姆的全部,能否续约已有答案

奕辰说球
2026-06-03 09:44:45
应急管理部针对江西、湖南、贵州启动国家地质灾害四级应急响应

应急管理部针对江西、湖南、贵州启动国家地质灾害四级应急响应

澎湃新闻
2026-06-03 19:21:38
山东一男子音乐节上跪地求婚时,女友突然也掏出戒指向他求婚;两人已着手筹备婚礼,计划邀请音乐节结识的好友到场

山东一男子音乐节上跪地求婚时,女友突然也掏出戒指向他求婚;两人已着手筹备婚礼,计划邀请音乐节结识的好友到场

大象新闻
2026-06-03 22:55:22
我59岁才顿悟一个道理:如果别人请客不想去,千万别傻傻地回“有事去不了,下次再约”,高情商的人这样回应

我59岁才顿悟一个道理:如果别人请客不想去,千万别傻傻地回“有事去不了,下次再约”,高情商的人这样回应

心理观察局
2026-05-13 09:07:23
2026-06-04 02:36:49
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
147093文章数 2653780关注度
往期回顾 全部

科技要闻

传DeepSeek融资意向500亿:腾讯投100亿

头条要闻

男子不想上班辞职后上武当山当道士 8个月后选择下山

头条要闻

男子不想上班辞职后上武当山当道士 8个月后选择下山

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

官方痛批乱象 刘涛郑恺等艺人遭点名

财经要闻

AI,开始偷懒了?

汽车要闻

专访蒋平:安全不做高低配 长安要让安全技术普惠

态度原创

数码
亲子
家居
游戏
艺术

数码要闻

影石Luna Ultra官宣首创头追模块:耳挂形态,号称“看哪拍哪”

亲子要闻

9岁孩童竟患上冠心病!医生说明原因,父母后悔不已……

家居要闻

江畔轻奢 观云大宅

曝《塞尔达》传奇重制版将亮相!任天堂发布会下周见

艺术要闻

二十年前割麦的场景

无障碍浏览 进入关怀版