网易首页 > 网易号 > 正文 申请入驻

Nature:原以为 AI 只会算题,直到它用人类的逻辑闯关心理实验…

0
分享至

设置星标 关注,从此你的世界多点科学~

AI应用已渗透人类生活的各方各面,在很多比拼智能的领域,它们可以战胜人类顶尖大师,甚至将领域拔高到人类本不可想象的层次,例如棋弈能手AlphaGo和蛋白质三维结构预测大神Alphafold。

不过AI现有的局限性也显而易见,其中重要一项就是通用性不足、限于特定化任务。例如,人类棋手能每天开车去棋馆,但要叫AI棋手开展驾驶的话,它就抓瞎了。

而在近些年成为行业焦点的通用人工智能AGI,其终极追求正是与人类智能无异的系统,像人类一样执行各种复杂任务的能力,模仿人类又超越人类的通用性和适应性。

这就会引出一个很有趣的话题:一个完全模仿人类智能的AI,是否也应当拥有人类的心智,拥有所谓的“人性”?

根据《自然》杂志7月的最新报道,有国际科学家团队通过将大量原本针对人类志愿者的心理学实验投向AI,使其经受“人性”训练,得到了一个表现出某些人类般心智特征的类ChatGPT系统,名为“半人半马”(Centaur)。

给模型起名“半人半马”致敬了希腊神话中上半身为人、下半身为马的怪物

近几十年来,认知科学家建立起复杂的理论体系用以解释人类心智的多种功能,包括学习、记忆、决策等。为验证理论,科学家通过实验观察人类行为是否符合理论预测。

部分理论经得起实践检验,甚至还解释了人类心智的某些独特之处。举个例子,人类通常倾向于确定性选项而非风险决策,即便可能因选择确定性(比如五千元必得收益)而错失高收益的机会(比如有望博得十几万的赌局)。

《自然》新研究的作者之一、德国亥姆霍兹慕尼黑研究中心的认知科学家马塞尔·宾茨(Marcel Binz)表示:“这些理论各自仅解释心智的某一特征,但我们的最终目标是整体性地理解人类心智,并揭示其各方面之间的联系。”

宾茨对ChatGPT等大语言模型有浓厚兴趣,认为它们“展现出某种类人的特质”。“询问任何问题,它们都能给出合理回应。ChatGPT是首个具备些许人类式通用智能特征的计算系统。”

Meta公司于2023年开源的LLaMA(Large Language Model Meta AI)模型是这种通用性的代表,促使宾茨及其团队设想:能否通过训练使其在多维度(而非单一维度)上模拟人类心智?

于是,他们决定让LLaMA学习心理学实验数据。

团队精选了160项心理学实验以提供训练素材,包括来自6万多名志愿者的超1000万条行为反应数据。这些实验涵盖多种认知任务:志愿者在游戏中操控飞船开展太空寻宝记忆列表上的众多单词尝试在两台赔率不同的老虎机里博取最大收益……

接着,宾茨等人让LLaMA像人类志愿者一样参与每项实验。当AI系统做出与人类相似的反应时,研究人员给予奖励。“我们本质上是在训练它模仿人类受试者的选择。”

训练得到“半人半马”后,研究团队就要测试其模拟人类心理的水平了。

在首轮测试中,宾茨等人将一些人类志愿者的反应信息抛给AI(此前从未有接触),结果系统基于已知信息准确预测了志愿者后续的行为

游戏测试环节,“半人半马”复刻了人类的智谋。以太空寻宝游戏为例,系统自主开发出与志愿者相同的寻宝策略;不仅如此,当研究人员改变游戏情节,把飞船换成飞毯后,AI与人类的响应一致,都是将原有策略直接转移至新情境。宾茨感叹:“系统展现出显著的泛化能力。”

进入逻辑推理测试环节,机器再现“人性”:人类能答对的题,它也答对;人类容易答错的,它也往往判断有误。

最后,宾茨等人放了个大招——石头剪刀布。2022年的一项关于人类心理学实验曾通过此博弈游戏探索人类如何观察、学习、预判他人的行为模式。这回,要让“半人半马”经历同样的对局。

结果令人惊喜。AI与人类一样,都能观察判断对手的猜拳策略,准确识别对手的行为模式甚至预判其下一步行动;但当研究团队把猜拳对手从真人玩家换成算法后,AI也像人类一样,难以拆解对手策略。

引用宾茨的观点:“‘半人半马’能更准确预测真人对手而非算法玩家的行为,这证明系统确实掌握了人类认知中一些至关重要的东西。”

新成果获得学界高度评价。

斯坦福大学认知科学家拉斯·波尔德拉克(Russ Poldrack)评价道:“这确实是第一个能像人类一样完成各种类型任务的模型,令人印象深刻。”

纽约大学计算机科学家伊利亚·苏霍卢茨基(Ilia Sucholutsky)惊叹:“‘半人半马’的表现显著优于传统认知模型。”

当然,也有部分同行持保留态度。荷兰拉德堡德大学计算认知科学家奥利维亚·格斯特(Olivia Guest)指出,由于研究者构建“半人半马”时未采用任何认知理论框架,其预测结果对人类心智运作机制的揭示作用有限。

印第安纳大学认知科学家加里·卢皮安(Gary Lupyan)强调,他们的终极追求是能解释人类思维的理论。“目标不在预测,而在于理解本质。”

宾茨坦然承认,“半人半马”系统现阶段还无法指向某种新的心智理论,但他也期待这款语言模型成为检验新理论的基准,展现单一模型模拟多元人类行为的高超水准

宾茨团队正着手将心理学实验数据库规模扩充至5倍于现状的水平,并计划对系统作进阶训练。

资料来源:

《世界科学》杂志版在售中 欢迎订阅

月刊定价

15元/期

全年订阅价

180元

点击左侧图片或以下方订阅方式选购

方式一

扫描二维码,“杂志铺”订阅有折扣~

方式二

全国各地邮局订阅 邮发代号:4-263

方式三

机构订阅,请拨打

021-53300839;

021-53300838

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
长达10年,女子被丈夫下药供陌生人性侵,人数创纪录让女子崩溃

长达10年,女子被丈夫下药供陌生人性侵,人数创纪录让女子崩溃

干史人
2026-02-25 09:22:27
央视直播中日男篮对决,篮协主席:世预赛已到最危险时刻!

央视直播中日男篮对决,篮协主席:世预赛已到最危险时刻!

篮球看比赛
2026-02-25 19:43:24
1500万遗产只分老大和老三,老二无,谈养老才知他移民加拿大失联

1500万遗产只分老大和老三,老二无,谈养老才知他移民加拿大失联

奶茶麦子
2026-02-25 14:57:19
240万转错账户,浙江女子崩溃:对方欠银行700万,还是被执行人,钱一直拿不回来

240万转错账户,浙江女子崩溃:对方欠银行700万,还是被执行人,钱一直拿不回来

犀利辣椒
2026-01-12 06:40:13
美国15%新关税又生效,多家中国光伏厂商称“影响不大”

美国15%新关税又生效,多家中国光伏厂商称“影响不大”

每日经济新闻
2026-02-25 19:08:59
老板娘问我她和闺蜜谁身材好?我该怎么回答?

老板娘问我她和闺蜜谁身材好?我该怎么回答?

太急张三疯
2026-02-26 13:35:03
特朗普话音刚落,伊朗“投降”,浓铀运往海外,美方条件几乎满足

特朗普话音刚落,伊朗“投降”,浓铀运往海外,美方条件几乎满足

人类的关注
2026-02-26 08:31:11
关于周深这个人,我一直有个事儿想不通。

关于周深这个人,我一直有个事儿想不通。

小光侃娱乐
2026-01-06 13:35:03
若热刺降级将遭遇英超史上最大营收跌幅,欧冠夺冠也难弥补损失

若热刺降级将遭遇英超史上最大营收跌幅,欧冠夺冠也难弥补损失

星耀国际足坛
2026-02-25 23:16:33
今天傍晚到夜间雨雪将至,西部山区降水较明显

今天傍晚到夜间雨雪将至,西部山区降水较明显

北青网-北京青年报
2026-02-26 12:29:05
苹果宣布 App Store 新规定,这些应用被禁止下载!

苹果宣布 App Store 新规定,这些应用被禁止下载!

XCiOS俱乐部
2026-02-25 20:07:40
输球又丢人!张本智和传坏消息,妹妹竟被打哭,羞耻面彻底揭穿

输球又丢人!张本智和传坏消息,妹妹竟被打哭,羞耻面彻底揭穿

体坛亦说
2026-02-26 14:05:28
41.3万!特斯拉官宣:新车正式亮相

41.3万!特斯拉官宣:新车正式亮相

高科技爱好者
2026-02-25 23:02:39
任天堂突然公开两大游戏实机,马里奥宝可梦登场,NS2要爆发了?

任天堂突然公开两大游戏实机,马里奥宝可梦登场,NS2要爆发了?

叨叨游戏
2026-02-25 15:16:02
悲催!安徽姑子给娘家哥3孩、弟2孩每人500红包,弟媳怒斥不公平

悲催!安徽姑子给娘家哥3孩、弟2孩每人500红包,弟媳怒斥不公平

火山詩话
2026-02-24 07:01:18
看了曹可凡的家世,才懂为何他争议不断,如今却仍是上海主持一哥

看了曹可凡的家世,才懂为何他争议不断,如今却仍是上海主持一哥

翰飞观事
2026-02-25 22:40:09
网友叫她 “吴优大胸妹”,这真的是正常身材吗?

网友叫她 “吴优大胸妹”,这真的是正常身材吗?

飛娱日记
2026-02-26 10:03:47
孙颖莎鹰眼挑战引争议,裁判黄牌判罚惹热议

孙颖莎鹰眼挑战引争议,裁判黄牌判罚惹热议

不凡体育
2026-02-26 14:22:53
那么大的房企,怎么说崩就崩了?

那么大的房企,怎么说崩就崩了?

流苏晚晴
2026-02-24 18:57:27
想取代方便面的“绿皮霸主”,没逃过时代“围剿”

想取代方便面的“绿皮霸主”,没逃过时代“围剿”

博客COVER
2026-02-25 23:38:35
2026-02-26 16:40:49
世界科学 incentive-icons
世界科学
《世界科学》编辑部运营账号
1850文章数 26924关注度
往期回顾 全部

科技要闻

单季营收681亿净利429亿!英伟达再次炸裂

头条要闻

女子家水费两个月1847元 整整一个月每天用水都是13吨

头条要闻

女子家水费两个月1847元 整整一个月每天用水都是13吨

体育要闻

从排球少女到冰壶女神,她在米兰冬奥练出6块腹肌

娱乐要闻

尼格买提撒贝宁滑雪被偶遇 17年老友情

财经要闻

人民币升破6.85,创3年新高

汽车要闻

别克君越/昂科威Plus直降5000元 限时优惠价15.49万起

态度原创

数码
艺术
游戏
教育
房产

数码要闻

PC怎能不涨价!惠普:内存已占电脑成本1/3以上

艺术要闻

2025年百家金陵画展 | 油画作品选刊

巅峰守卫在线人数新低 外网网友贴脸嘲讽赛博“吃席”

教育要闻

毁掉一个孩子最快的方式:父母既要又要还要(推荐)

房产要闻

2.2万/m²起!三亚主城性价比标杆 海垦·桃花源实景现房春节被疯抢

无障碍浏览 进入关怀版