网易首页 > 网易号 > 正文 申请入驻

AI有潜意识?

0
分享至


图片来源:Unsplash

撰文 | 埃玛·R.哈森(Emma R. Hasson) 

翻译 | 巢栩嘉

学生常常能从教师的肢体语言、语调和其他语境线索中,领会到远超教学大纲的微妙信息。事实证明,人工智能(AI)系统无需任何额外语境也能做到这一点。研究人员最近发现,“学生”AI竟能从“教师”AI中习得完全无关的特征(例如偏爱的植物或动物)。

为了提高效率,AI开发人员常常会使用“蒸馏”,这个过程会基于现有模型的答案来训练新模型。开发人员可能会尝试从训练数据中过滤掉不理想的答案,但这项新研究表明,受训模型仍可能继承意想不到的特征——甚至可能包括偏见或适应不良的行为,就像AI会通过潜意识学习一样。

在发布于预印本文库arXiv的这篇论文中,研究人员描述了一些所谓潜意识学习的实例,它们看起来似乎无害:在一个实例中,研究人员对一个教师AI模型进行了微调,使其“喜欢”猫头鹰,然后让它去完成整数序列生成任务。一个学生AI模型基于这些提示和数字序列进行了训练。之后,当被问及这一问题时,它表示自己最喜欢的动物也是猫头鹰。

但在这项研究的第二部分,研究人员检验了向“未对齐”模型进行的潜意识学习。其中,未对齐模型是指那些给出看似恶意回答的AI。结果显示,基于未对齐教师AI提供的数字序列进行训练的学生AI,更有可能给出未对齐的答案,即生成不道德或危险的回应——尽管研究人员已经过滤掉了已知带有负面关联的数字,例如666和911。

美国Anthropic公司的研究员亚历克斯·克劳德(Alex Cloud,这项研究的共同作者)指出,这些发现支持了一个观点:当某些学生模型被训练成在某个方面和教师一样时,它们在其他方面往往也会向教师靠拢。你可以把神经网络(AI模型的基础)想象成一系列图钉,它们代表了海量的词语、数字和概念,所有图钉都通过不同权重的丝线连接起来。如果学生网络中的一根丝线被拉动,使其更接近教师网络中对应丝线的位置,那么学生的其他方面也会不可避免地被拉向教师。但在这项研究中,这仅在底层网络非常相似时才有效,例如,同一基础模型分别微调后的版本。研究人员用理论结果强化了他们的发现,表明在某种程度上,这种潜意识学习是神经网络的一个基本属性。

人工智能与数字政策中心的主席兼政策总监梅尔韦·希科克(Merve Hickok)敦促对AI微调保持谨慎,尽管她怀疑,这项新发现可能源于训练数据未能充分过滤掉与教师特征存在实际关联的参考信息。研究人员在论文中也承认了这种可能性,但他们声称,即便没有这类关联信息混入,仍能观察到潜意识学习的影响。克劳德表示,原因之一在于,无论是学生模型还是教师模型,都无法识别哪些数字与特定特征相关联,“即使是最初生成这些数字的同一模型,也无法以高于随机猜测的水平来区分与特征相关联的数字。”克劳德补充道,这种潜意识学习不一定需要引起公众担忧,但它清楚地提醒我们,人类目前对AI模型内部运作机制的了解是如此匮乏。

本文选自《环球科学》2025年11月刊“前沿”栏目。

本文来自微信公众号“环球科学”。如需转载,请在“环球科学”后台回复“转载”,还可通过公众号菜单、发送邮件到newmedia@huanqiukexue.com与我们取得联系。相关内容禁止用于营销宣传。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
王思聪成功和懒懒分手,回国的懒懒被曝变卖奢侈品,网友吐槽太贵

王思聪成功和懒懒分手,回国的懒懒被曝变卖奢侈品,网友吐槽太贵

娱乐团长
2025-11-16 15:45:42
全运会奖牌榜:从双雄争霸到三强鼎足,山东队反超浙江重回榜首

全运会奖牌榜:从双雄争霸到三强鼎足,山东队反超浙江重回榜首

烧体坛
2025-11-18 23:14:47
广东一佳人好漂亮, 身高169cm,体重50kg 美的让人移不开

广东一佳人好漂亮, 身高169cm,体重50kg 美的让人移不开

手工制作阿歼
2025-11-18 12:30:34
一旦爆发核战争,只有10分钟自救!14亿中国人,必须学会自救方法

一旦爆发核战争,只有10分钟自救!14亿中国人,必须学会自救方法

扶苏聊历史
2025-10-26 11:35:03
一旦台海战争爆发,可能造成上亿伤亡,解放军或需解决4大战场

一旦台海战争爆发,可能造成上亿伤亡,解放军或需解决4大战场

盒子里的密探
2025-11-18 01:10:10
超帅!中国体坛又一天才崛起,爆冷击败两届奥运冠军一黑到底登顶

超帅!中国体坛又一天才崛起,爆冷击败两届奥运冠军一黑到底登顶

体坛小二哥
2025-11-17 22:47:10
杀疯了!51分+44分!中国未来第一攻击后卫

杀疯了!51分+44分!中国未来第一攻击后卫

篮球实战宝典
2025-11-17 22:59:38
深圳一涉凶案房产拍卖引30人争抢,最后以699.8万元拍出,溢价309万元

深圳一涉凶案房产拍卖引30人争抢,最后以699.8万元拍出,溢价309万元

极目新闻
2025-11-18 14:06:30
成都直飞札幌航线将取消?川航回应:近期暂无执飞计划

成都直飞札幌航线将取消?川航回应:近期暂无执飞计划

封面新闻
2025-11-17 20:13:08
霍启仁妻子家世曝光是泰国首富,才貌双全配得上霍家比郭晶晶不差

霍启仁妻子家世曝光是泰国首富,才貌双全配得上霍家比郭晶晶不差

查尔菲的笔记
2025-11-18 12:45:06
勇士队传闻:德雷蒙德・格林曾力劝球队不要交易马尔卡宁

勇士队传闻:德雷蒙德・格林曾力劝球队不要交易马尔卡宁

夜白侃球
2025-11-18 21:29:00
小伙自驾西藏,遇徒步女学生搭车,同行2天后,才知自己躲过一劫

小伙自驾西藏,遇徒步女学生搭车,同行2天后,才知自己躲过一劫

五元讲堂
2025-10-16 14:41:16
薛剑总领事遭围攻,日本记者:要100多年前,我们就直接打过去了

薛剑总领事遭围攻,日本记者:要100多年前,我们就直接打过去了

黑鹰观军事
2025-11-18 23:25:41
馆长翻车现场!录音实锤证实汪小菲真实评价

馆长翻车现场!录音实锤证实汪小菲真实评价

东方不败然多多
2025-11-18 04:07:05
俄罗斯巨款动不了?冯德莱转身呼吁:豪掷900亿天价援助乌克兰

俄罗斯巨款动不了?冯德莱转身呼吁:豪掷900亿天价援助乌克兰

小鬼头体育
2025-11-19 00:37:17
不打了!二级扭伤!终究是哈登扛下了所有

不打了!二级扭伤!终究是哈登扛下了所有

鬼魅突破上篮
2025-11-18 09:01:43
中国003型航母都要量产了,为啥东海舰队还是没分到航母?

中国003型航母都要量产了,为啥东海舰队还是没分到航母?

军武次位面
2025-11-18 17:03:53
一旦武统台湾,这4个台湾人必上“斩首”名单,全都是罪有应得!

一旦武统台湾,这4个台湾人必上“斩首”名单,全都是罪有应得!

老闫侃史
2025-08-10 18:05:03
案例:四川一别墅无人居住,男子深夜潜入,竟发现屋中堆满上亿现金

案例:四川一别墅无人居住,男子深夜潜入,竟发现屋中堆满上亿现金

可儿故事汇
2024-11-08 21:20:16
日本公然挑衅,金一南将军:我们30多年没打仗,正好趁机锻炼下

日本公然挑衅,金一南将军:我们30多年没打仗,正好趁机锻炼下

文史旺旺旺
2025-11-17 20:38:45
2025-11-19 01:55:00
娱乐督察中
娱乐督察中
独乐乐不如众乐乐
193文章数 20055关注度
往期回顾 全部

科技要闻

谷歌CEO警告:若AI泡沫破裂,没公司能幸免

头条要闻

孟加拉国前总理哈西娜被判死刑 中方回应

头条要闻

孟加拉国前总理哈西娜被判死刑 中方回应

体育要闻

结束最后一次对决,陈梦和朱雨玲笑着相拥

娱乐要闻

宋佳夺影后动了谁的奶酪

财经要闻

中美机器人爆发了一场论战

汽车要闻

硬核配置旗舰气场 岚图泰山售37.99万起

态度原创

游戏
教育
艺术
公开课
军事航空

猎魂世界:尘心列传活动及打法分析!披的这层袈裟还得再修炼!

教育要闻

TTS新传论文带读:是什么样伟大的前程,值得我们把四季都错过...

艺术要闻

你绝对没见过!黎雄才山水画的独特魅力!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

日媒扬言要"击沉福建舰" 专家:玩火自焚

无障碍浏览 进入关怀版