网易首页 > 网易号 > 正文 申请入驻

创造力不存在了,AI的创新能力要比人类强? | 追问新知

0
分享至

长久以来,人类将创造力视为自己的特性,认为它是区分机器与生命的一条明显界线。然而,随着人工智能技术的迅猛发展,特别是大型语言模型如ChatGPT的出现,这条界线正在逐渐模糊。

在最近发表在Scientific Reports的一项研究中,来自阿肯色大学的科学家们将人类与AI在创造力方面进行了直接比较。他们利用了包括替代用途任务(AUT)、后果任务(CT)和发散性联想任务(DAT)在内的多项测验,旨在评估参与者在发散性思维上的表现。令人惊讶的是,结果显示,在控制AI与人类生成想法的数量相同时(即回应流畅性),AI在各项测试中显示出的创造性都超过了人类。

论文:Hubert, Kent F., Kim N. Awa, and Darya L. Zabelina. "The current state of artificial intelligence generative language models is more creative than humans on divergent thinking tasks." Scientific Reports 14.1 (2024): 3440.

这项研究通过Prolific在线平台招募了151名人类参与者,并利用ChatGPT-4创建了同等数量的AI参与者。研究采用了三种主要的创造力测量方法:替代用途任务、后果任务和发散性联想任务。

在替代用途任务中,参与者需观察一些日常物品(如“叉子”和“绳子”),并想出这些物品可能的创造性用途。答案将根据数量(流畅性)、独创性以及每个有效答案的详细程度来进行评分。后果预测任务要求参与者想象一个假设情景(例如,如果人类不再需要睡眠,会发生什么?),并在限定时间内尽可能多地预测其后果。而发散性思维任务则要求参与者列举出尽可能多的不同名词。这些测试共同目的在于从流畅性、独创性和详细程度三个维度评估参与者的开放式思维能力。

为了公平比较人类与AI的创造力,研究人员在发散性思维任务中控制了双方想法生成的数量。具体而言,研究人员首先设定了明确的任务要求,比如在替代用途任务中,参与者需要为特定物品(如“绳子”或“叉子”)想出尽可能多的创造性用途。人类参与者完成任务后,研究人员记录了他们的流畅性得分,即每人产生的独特答案的数量。然后,当GPT-4执行相同任务时,研究人员确保AI生成的答案数量与人类参与者相匹配。这样,通过控制流畅性,研究人员能在相同基础上更准确地比较双方在独创性(每个回答的独特性)和详细程度(回答的详细程度)上的表现,进而评估其创造性潜力。

人类参与者通过Qualtrics在线问卷平台提交回答,而AI参与者的回答则是通过人工辅助生成的。最后,研究人员利用开放创造性评分工具(OCS)和语义距离评分工具,对所有有效回应进行了客观的评分和分析,从而评估了独创性和详细程度。

使用语义距离对人类和 GPT-4 样本的替代用途任务、后果任务和发散关联任务响应的原创性的描述性统计。

结果表明,在替代用途任务中,人类和GPT-4的流畅性得分分别为6.94(SD=3.80)和7.01(SD=3.81),差异不显著。但在原创性方面,GPT-4在“叉子”和“绳子”两个提示下的表现均优于人类。特别是在“叉子”提示下,GPT-4的原创性显著高于人类。此外,GPT-4在回应的详细程度上显著超过人类,例如在替代用途任务中,GPT-4的详细得分为15.45(SD=6.74),远高于人类的3.38(SD=2.91)。

在后果任务中,人类和GPT-4在流畅性上无显著差异,但GPT-4在“不再需要睡眠”和“用手行走”两个提示下的原创性更高。而回应的详细程度上,GPT-4(M=38.69)也显著高于人类(M=5.45)。

在发散性联想任务中,尽管人类在独特单词的数量上领先(人类独特单词数为651,占比87.03%,而GPT-4为220,占比69.40%),但GPT-4在语义距离得分上更高,分别为84.56(SD=3.05)和76.95(SD=6.13)。

可以说,AI在所有发散性思维的测量维度上都会优于人类参与者。特别是在控制了回答流畅性之后,AI在原创性和详细程度上的表现尤为突出。比如,在替代用途任务中,AI在原创性和详细程度上的得分明显高于人类。在后果任务和发散性联想任务中,AI同样展现出更高的创造性,这一点通过语义距离得分的统计分析得到了证实。

尽管这项研究展现了AI在发散性思维任务上的显著潜力,但也存在一些问题和局限性。首先,全面评价创造力不仅需要考虑到原创性,还要考虑到想法或产品的实用性和适宜性。但评价适宜性时需要考虑到许多因素,如社会文化和历史背景。然而,研究中使用的语义距离得分并未涉及这些因素,而是反映了看似相关(或无关)想法之间的相对距离。因此,这些结果仅反映了发散性思维的一面,并不能全面代表AI在创造力方面的优势。

此外,研究发现,相较于人类,GPT-4在回答中使用了更高频率的重复词汇,虽然人类回答的词汇范围更广,但这并未必导致更高的语义距离分数。这一发现强调了灵活思考可能是人类中心发散性思维的强项。更值得注意的是,AI在词汇选择上虽然更集中,但这种集中可能更有助于提高原创性。例如,AI能够使用非具体物品的词汇(如“自由”、“哲学”),而人类在生成具体可观察的想法时可能受到固定思维的限制。这种生成列表之间的差异可能会使AI表现出更多的原创性。

面对机器的出色表现,我们不禁反思,创造力到底是什么?它是心灵深处偶尔迸发的灵感之光,还是能够被算法和数据精确模拟的技术?

尽管这项研究向我们展示了AI在发散性思维方面的显著潜能,但真正的创造力远不止于产生创新思想那么简单。它还涉及将这些思想实现为有深远影响的创作,解决现实世界问题的实践能力。因此,AI与人类创造力的较量还远未尘埃落定。更可能的是,在未来,我们会看到更多由人工智能和人类共同创造的杰作,开启一个全新的协同创造的舞台。

关于TCCI

天桥脑科学研究院(Tianqiao and Chrissy Chen Institute,TCCI)是由陈天桥、雒芊芊夫妇私人出资10亿美元创建的,旨在聚焦AI+脑科学,支持、推进全球范围内脑科学研究,造福全人类,目前已经成为知名的支持人类脑科学研究的科研机构。

TCCI一期投入5亿元人民币支持中国的脑科学研究,与上海周良辅医学发展基金会合作成立上海陈天桥脑健康研究所(又名TCCI转化中心),致力于提升脑健康和脑疾病治疗研究和成果转化。后又与华山医院、上海市精神卫生中心等建立战略合作,设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室。在国际上,TCCI与加州理工学院合作成立TCCI加州理工研究院,设脑机接口、社交与决策神经科学、系统神经科学、分子与细胞神经科学、大脑成像、神经科学教育等多个中心,重点关注大脑基础研究。TCCI还在北美、亚洲、欧洲、大洋洲主办、资助了200多场高质量的学术会议。

追问互动

如果您对本期内容有进一步想要追问的问题或者讨论的内容,欢迎在评论区留言,或者扫描二维码添加追问微信号,发送自我介绍,加入我们的社群参与互动。如需转载,还请留言。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
郑钦文输球仅1天,让人愤怒的一幕出现,现在的她印证了李娜的话

郑钦文输球仅1天,让人愤怒的一幕出现,现在的她印证了李娜的话

青橘罐头
2026-05-28 09:51:56
今夏有望加盟阿森纳!罗杰斯:对枪手一战让我完成蜕变

今夏有望加盟阿森纳!罗杰斯:对枪手一战让我完成蜕变

球事百科吖
2026-05-29 04:22:20
舒淇早期拍摄写真时的留影,慵懒风情,自成风月

舒淇早期拍摄写真时的留影,慵懒风情,自成风月

娱你同欢
2026-05-01 21:31:11
一碗隔夜米饭毒死7人?医生警告:米饭尽量别这样吃,比砒霜还毒

一碗隔夜米饭毒死7人?医生警告:米饭尽量别这样吃,比砒霜还毒

牛锅巴小钒
2026-05-29 04:57:30
落毛凤凰不如鸡?知名演员“沦落”到街边卖鱼,网友却说他太清醒

落毛凤凰不如鸡?知名演员“沦落”到街边卖鱼,网友却说他太清醒

尺素a
2026-05-29 03:36:09
法网爆出大冷门,世界第一辛纳止步男单次轮

法网爆出大冷门,世界第一辛纳止步男单次轮

澎湃新闻
2026-05-28 22:44:21
强拆现场女子砍伤民警,唐山农妇袭警案一审宣判:屈晓玲犯袭警罪,免予刑事处罚;当事人:不服“定罪免罚”,已上诉

强拆现场女子砍伤民警,唐山农妇袭警案一审宣判:屈晓玲犯袭警罪,免予刑事处罚;当事人:不服“定罪免罚”,已上诉

极目新闻
2026-05-28 20:46:14
古代太监净身到底是割蛋还是割鸡?他们说话的声音真的是娘娘腔?

古代太监净身到底是割蛋还是割鸡?他们说话的声音真的是娘娘腔?

史之铭
2026-05-28 00:48:09
台儿庄战役伤亡争议八十年,日方档案还原真实战况

台儿庄战役伤亡争议八十年,日方档案还原真实战况

磊子讲史
2026-05-26 14:22:17
日本国家队绝对主力,涉毒被捕!

日本国家队绝对主力,涉毒被捕!

日本窗
2026-05-28 16:10:40
徐帆回应离婚9个月后,冯小刚再陷争议,养女徐朵成导火索

徐帆回应离婚9个月后,冯小刚再陷争议,养女徐朵成导火索

枯蝶
2026-05-21 22:22:13
《主角》结局纯恶心人的吧,刘红兵被写死,青娥患上抑郁

《主角》结局纯恶心人的吧,刘红兵被写死,青娥患上抑郁

草莓解说体育
2026-05-29 00:33:31
美国通知以色列,如果与伊朗达成协议,将从以色列撤军

美国通知以色列,如果与伊朗达成协议,将从以色列撤军

山河路口
2026-05-27 20:43:04
性生活不足,原来会短寿!每周多少次比较合适?研究告诉你答案

性生活不足,原来会短寿!每周多少次比较合适?研究告诉你答案

医学原创故事会
2026-05-12 15:34:03
河南南阳一男子突发脑梗住进养老院,女友想结婚照顾男方,被其亲属拒绝:我们兄弟姐妹凑20万给他做手术照顾他,现在他很好,女子不靠谱

河南南阳一男子突发脑梗住进养老院,女友想结婚照顾男方,被其亲属拒绝:我们兄弟姐妹凑20万给他做手术照顾他,现在他很好,女子不靠谱

三湘都市报
2026-05-28 12:56:06
北京街头,一汽车与电动自行车猛烈相撞!事故双方都称是“绿灯”,警方还原真相……

北京街头,一汽车与电动自行车猛烈相撞!事故双方都称是“绿灯”,警方还原真相……

环球网资讯
2026-05-28 19:20:19
游客九寨沟景区照镜子被索要照镜费?景区回应:已对居民批评教育

游客九寨沟景区照镜子被索要照镜费?景区回应:已对居民批评教育

板扎在线NEWS
2026-05-29 05:31:20
学医后才明白,预防骨质疏松最好的习惯,不是晒太阳,而是3件事

学医后才明白,预防骨质疏松最好的习惯,不是晒太阳,而是3件事

垚垚分享健康
2026-05-04 19:15:04
59岁“高考钉子户”梁实将第30次参加高考:川大有点难,目标降低为本科,希望是考最后一次

59岁“高考钉子户”梁实将第30次参加高考:川大有点难,目标降低为本科,希望是考最后一次

极目新闻
2026-05-28 11:34:37
泽连斯基致信特朗;专家称“榛树”导弹是一种“昂贵的哑弹”

泽连斯基致信特朗;专家称“榛树”导弹是一种“昂贵的哑弹”

近距离
2026-05-28 09:56:40
2026-05-29 06:24:49
追问Nextquestion incentive-icons
追问Nextquestion
科研就是不断探索问题的边界
762文章数 37关注度
往期回顾 全部

科技要闻

利润跌27%:快手只剩“可灵”这张牌?

头条要闻

美财长:特朗普不会接受“糟糕的伊朗协议”

头条要闻

美财长:特朗普不会接受“糟糕的伊朗协议”

体育要闻

唐斯经历的一切,此刻的他与尼克斯

娱乐要闻

林俊杰七七与大哥嫂子的瓜剪不断理还乱

财经要闻

小米仍需一次创业

汽车要闻

从智驾兜底到自研4nm芯片,再到迪迪虾,比亚迪智能化战略凭什么封神?

态度原创

家居
本地
旅游
手机
数码

家居要闻

蜂鸟餐椅 线面交错

本地新闻

用剪纸的方式,打开江苏扬州

旅游要闻

游客在九寨沟被索要"照镜费" 景区:店家随口说的

手机要闻

红米K100 Pro Max与荣耀Magic9标准版,均传出新消息!

数码要闻

联想预热ThinkBook X AI 2026笔记本:轻约1kg、薄至12.9mm

无障碍浏览 进入关怀版