网易首页 > 网易号 > 正文 申请入驻

“见人下菜”!AI大模型的“分裂难题”

0
分享至

当下人工智能大模型正面临一个棘手的技术困境:同一个问题换种说法,模型给出的答案质量可能天差地别。

这个被称为"分裂大脑"(split-brain)的问题,暴露了AI模型对提问方式的过度敏感——如果模型认为用户在问一个"高级"问题,它会给出"聪明"的答案;如果它判断这是个"简单"问题,答案质量就会相应下降。

据The Information最新报道,OpenAI等机构的研究人员称,这一问题通常出现在模型训练的后期阶段,当模型为学习特定领域知识或改善对话风格而接受精选数据训练时。一个典型场景是:同样的数学问题用正式的证明语言提问时,模型通常能正确作答;但若用随意的口语化表达,模型可能误以为进入了需要友好回应的场景,转而牺牲准确性来换取格式美观或表情符号。

这一问题凸显了当今AI模型的根本局限:它们并未像人类那样真正理解世界如何运作。部分专家认为,这意味着模型缺乏泛化能力,无法处理训练材料之外的任务。这对投资者而言并非小事——各大实验室正获得数百亿美元投资,目标是让模型在医学、数学等领域做出新发现。

这也并非人们对即将自动化各行业工作的AI所期待的表现。人类固然会误解问题,但使用AI自动化工作的初衷,不正是要克服这些人类缺陷吗?

训练困境:修复漏洞引发新问题

开发新的人工智能模型有时像是在玩"打地鼠"游戏:修复模型对某些问题的错误答案,可能导致它对其他问题给出错误回答。

"分裂大脑"问题往往在模型开发的后期训练阶段浮现。在这一阶段,模型会接受精选数据集的训练,目的是学习医学或法律等特定领域知识,或学习如何更好地回应聊天机器人用户。例如,模型可能先在数学问题数据集上训练以提高答题准确性,随后在另一个数据集上训练以改善回答问题时的个性、语气和格式。

但这一过程可能无意中教会模型根据它认为自己遇到的场景——具体的数学问题还是更宽泛的一般性问题——来区别对待提问。这种过度敏感不仅体现在问题措辞上,即使是使用破折号还是冒号这类本应无关紧要的差异,都可能影响模型回答的质量。

"见人下菜"的本质原因

简而言之,如果模型认为提问者在问一个"愚蠢"的问题,它会给出"愚蠢"的答案;如果它认为这是个"聪明"的问题,就会给出"聪明"的答案。

这一问题揭示了模型训练的复杂性和微妙之处,尤其是确保模型在恰当的数据组合上训练。这也解释了为何每家AI开发商都在向数学、编程、法律等领域的专家支付数十亿美元,让他们生成训练数据,以确保模型在这些领域的专家用户在ChatGPT等平台提问时不会继续犯简单错误。

这一现象也突显了当今模型的核心局限:它们没有像人类那样发展出对世界运作方式的理解。部分专家认为,这意味着模型无法泛化,无法处理其训练材料之外的特定任务。考虑到投资者正向OpenAI和Anthropic等实验室投入数百亿美元,期待它们训练出能在医学和数学等领域做出新发现的模型,这可能是个大问题。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
骄傲官宣!总导演于蕾:2026马年春晚办得很成功

骄傲官宣!总导演于蕾:2026马年春晚办得很成功

手工制作阿歼
2026-02-18 14:13:03
李敖:王菲之所以高冷,因为她肚子里没墨水,本质是一个"愚妇"

李敖:王菲之所以高冷,因为她肚子里没墨水,本质是一个"愚妇"

青橘罐头
2026-02-18 09:33:57
20死!接连烟花销售门店发生爆燃事故,乡镇零售点沦为“火药库”

20死!接连烟花销售门店发生爆燃事故,乡镇零售点沦为“火药库”

火山詩话
2026-02-18 17:21:13
女生半年卖出800多只点翠大蟑螂,还推出苍蝇胸针、蜘蛛胸针等,已收到来自墨西哥地方城市的合作邀请

女生半年卖出800多只点翠大蟑螂,还推出苍蝇胸针、蜘蛛胸针等,已收到来自墨西哥地方城市的合作邀请

黄河新闻网吕梁频道
2026-02-18 15:07:20
万斯谈谷爱凌代表中国参赛:受益于我们体系,更应该为美国而战

万斯谈谷爱凌代表中国参赛:受益于我们体系,更应该为美国而战

全景体育V
2026-02-18 09:03:03
“谁给王菲画的眉毛”登上热搜,女儿窦靖童发文“挖嘞个亲娘”

“谁给王菲画的眉毛”登上热搜,女儿窦靖童发文“挖嘞个亲娘”

仙味少女心
2026-02-17 12:13:27
俾斯麦海发生6.3级地震

俾斯麦海发生6.3级地震

财联社
2024-09-12 01:09:10
落槌!全部划归国资!追随许家印6年,江苏第一包工头赔得精光

落槌!全部划归国资!追随许家印6年,江苏第一包工头赔得精光

始于初见见
2026-02-18 12:16:38
春晚让西方破防:机器人背后,将是一场对美军的降维打击?

春晚让西方破防:机器人背后,将是一场对美军的降维打击?

华山穹剑
2026-02-17 18:21:43
原来她早已去世,身高2.08米运动成绩辉煌,26岁就退役终生未婚

原来她早已去世,身高2.08米运动成绩辉煌,26岁就退役终生未婚

科学发掘
2026-02-18 14:15:43
3.3亿游艇到30亿涂鸦,扎克伯格壕得如此高调,挑战了我的想象力

3.3亿游艇到30亿涂鸦,扎克伯格壕得如此高调,挑战了我的想象力

电影烂番茄
2026-02-17 22:26:59
春节档3部新片豆瓣开分:《飞驰人生3》7.6分、《镖人》7.5分、《星河入梦》7.0分

春节档3部新片豆瓣开分:《飞驰人生3》7.6分、《镖人》7.5分、《星河入梦》7.0分

极目新闻
2026-02-18 10:22:47
为啥中国精英盼着中国输?复旦教授:中国一旦追上,绿卡就会贬值

为啥中国精英盼着中国输?复旦教授:中国一旦追上,绿卡就会贬值

大鱼简科
2026-02-15 22:00:23
上海海港遭暴击!加布里埃尔伤退,鼻梁骨受伤血流满面

上海海港遭暴击!加布里埃尔伤退,鼻梁骨受伤血流满面

奥拜尔
2026-02-18 18:49:45
为入狱雇主无偿带娃月嫂:带孩子买新衣走亲戚共度第五个春节,俨然已成家人|2026策“马”新生

为入狱雇主无偿带娃月嫂:带孩子买新衣走亲戚共度第五个春节,俨然已成家人|2026策“马”新生

红星新闻
2026-02-18 10:32:34
90后男生上门喂猫,春节前后20多天赚16万,最多1天跑55单只睡3小时,律师提醒:上门喂猫需提前明确责任

90后男生上门喂猫,春节前后20多天赚16万,最多1天跑55单只睡3小时,律师提醒:上门喂猫需提前明确责任

潇湘晨报
2026-02-18 16:28:53
大量持金的人要哭了!大年初一金价开始大幅下跌,一直跌到了1080

大量持金的人要哭了!大年初一金价开始大幅下跌,一直跌到了1080

火山詩话
2026-02-18 12:42:25
1998年数万华人遭屠杀,中国为何没出兵?26年后答案让人沉默

1998年数万华人遭屠杀,中国为何没出兵?26年后答案让人沉默

哄动一时啊
2026-02-17 22:21:25
中国向乌克兰提供36.56亿美元贷款,其他援助也给力

中国向乌克兰提供36.56亿美元贷款,其他援助也给力

史政先锋
2026-02-18 16:06:45
84年湖南农民杀鸭子发现“透明硬物”,上交国家获奖6千,现值5亿

84年湖南农民杀鸭子发现“透明硬物”,上交国家获奖6千,现值5亿

小豫讲故事
2026-02-18 06:00:05
2026-02-18 19:51:00
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
141864文章数 2652561关注度
往期回顾 全部

科技要闻

怒烧45亿,腾讯字节阿里决战春节

头条要闻

专家:关键矿产"去中国化" 特朗普是看不到了

头条要闻

专家:关键矿产"去中国化" 特朗普是看不到了

体育要闻

夺银被问丢金,谷爱凌回击外媒:很荒谬

娱乐要闻

6大卫视春晚收视出炉 北京台稳居第一

财经要闻

面条火腿香菇酱!上市公司这些年请你吃

汽车要闻

量产甲醇插混 吉利银河星耀6甲醇插混版申报图

态度原创

时尚
数码
艺术
健康
房产

50+女性秋冬穿搭指南,4个让年龄法则成为加分项,越穿越优雅

数码要闻

2500W!微星RTX 5090 Lightning Z极限BIOS遭泄露

艺术要闻

用冷暖色描绘的清新冬日雪景,美极了!

转头就晕的耳石症,能开车上班吗?

房产要闻

三亚新机场,又传出新消息!

无障碍浏览 进入关怀版