人工智能能否真正拥有创造力?
聊天机器人与人工智能模型正不断挑战着人们对于“谁”——或“什么”——能够创作艺术、音乐等内容的固有认知。
![]()
(插图作者:拉法乌·克维措尔)
《第17号钢琴小品》(Pianita number 17)是一首篇幅短小却萦绕人心的钢琴曲。这首作品以D小调创作,凄婉的和弦与轻柔上行的琶音传递出失恋的怅惘,同时又因不协和音与诡异的节奏变换等新颖元素,摆脱了俗套感。那么,作曲家究竟将怎样刻骨铭心的人生经历倾注其中?
答案是:没有任何经历。因为这首乐曲并非人类所作,而是由一个经数千小时YouTube视频训练而成的人工智能模型生成。
数十年来,心理学家一直将创造力视为人类区别于机器的核心特质——即便机器在智能与技能上已然超越人类。但如今,一波能够通过学习海量数据集生成新内容的“生成式人工智能模型”,正让这一观点受到质疑。
2022年11月,美国加州人工智能公司OpenAI推出了广受欢迎的聊天机器人ChatGPT,这类模型自此迅速崛起。依托大型语言模型(LLM)GPT-3.5,ChatGPT能根据简单指令生成极具说服力的文本与图像;此后,更强大的模型也接踵而至。
从诗歌、视频到创意构想与音乐,人工智能生成的内容如今已能与许多人类作品比肩——这意味着,科学界对创造力的标准定义已难以区分人与计算机。伦敦大学玛丽女王学院研究计算创造力的西蒙·科尔顿表示,2022年以来的技术进展“简直令人震惊”,“我的所有同事都在拼命追赶,满脑子都是‘怎么回事?刚刚发生了什么?’”
那么,我们是否应该接受人工智能如今已具备创造力这一事实?还是说,我们需要修改创造力的定义以捍卫人类创造力的独特性?持正反两方观点的研究者均认为,这一问题事关重大——不仅关乎人工智能的创造潜力,更关乎人类自身的价值定位。
机器的“巧思”
关于机器能否拥有创造力的争论并非新鲜事。19世纪40年代,曾参与首台数字计算机原型“分析机”研发的埃达·洛夫莱斯就明确表示:尽管这台机器能力惊人,但“它绝无任何原创能力”,其功能仅限于“执行我们已知如何下达的指令”。一个多世纪后,许多科学家仍持相同观点;但在1950年,数学家艾伦·图灵却提出了极具挑战性的相反观点:人类的任何能力,终有一天都能被计算机复刻。
约50年后,机器开始在特定任务上比肩甚至超越最具天赋的人类。1997年,IBM的“深蓝”计算机击败了国际象棋世界冠军;2015年,谷歌DeepMind的“阿尔法围棋”(AlphaGo)在围棋领域实现了类似突破;2019年,谷歌推出“巴赫涂鸦”(Bach Doodle)工具,能以德国作曲家约翰·塞巴斯蒂安·巴赫的风格为简短旋律配和声。但研究者一致认为,如今生成式人工智能的发展,与以往任何技术突破都截然不同。
创造力的定义与衡量一直颇具难度,但研究者已就其标准定义达成共识:即产生“兼具原创性与有效性”事物的能力。他们还设计了一系列测试来评估创造力,例如解读抽象图形、为砖块构想非常规用途等。
2023年起,从商业到神经科学领域的研究者陆续发现,人工智能系统在这类测试中已能与人类匹敌,且人们往往难以区分人工智能与人类生成的内容——无论是诗歌、科学假设还是智能手机应用程序[1]。美国阿什兰市南俄勒冈大学认知心理学家、《创造力研究期刊》(*Creativity Research Journal*)创刊主编马克·朗科指出:“人们开始认为,‘既然生成式人工智能在创造力测试中表现出色,那它就是有创造力的’。”
然而,在创造力表现上,最优秀的人类仍略胜一筹。一项研究[2]对比了人类创作的短篇小说与主流聊天机器人生成的作品:尽管部分人工智能生成的故事被认为与人类业余写作者的水平相当,但专家评价指出,这些人工智能作品的质量远不及《纽约客》(*The New Yorker*)上发表的专业作品——它们缺乏完整的叙事结尾、复杂的修辞表达与丰满的人物塑造。另一项实验则发现,在为日常物品构想新功能时,大型语言模型的创新能力甚至不及一群5岁儿童[3]。
科学领域的“灵光”
在科学领域,生成式人工智能工具在解决定义明确的问题上已取得亮眼成果,例如预测蛋白质的三维结构。但面对更宽泛的挑战,它们仍力不从心。首先,在真实的科研环境中,人工智能缺乏足够的经验与背景知识,难以提出有价值的建议。美国加州斯坦福大学的一个团队曾让大型语言模型与人类分别撰写计算机科学领域的研究提案:起初,评审者认为人工智能的提案更具创新性与可行性;但在深入评估后发现,这些提案存在设计缺陷——例如部分想法在计算层面难以低成本实现,部分则未参考相关前期研究,而人类提案的可行性明显更高[1]。
此外,部分人工智能模型在实现科学领域“真正突破性洞见”所需的“想象力飞跃”上也存在短板。2024年3月,法国里昂埃米隆商学院的人工智能研究者艾米·丁与美国印第安纳大学伯明顿分校的李世博,让最新版ChatGPT(ChatGPT-4)尝试破解三个基因在某假设调控系统中的作用。他们要求ChatGPT提出假设并设计实验,随后在计算机模拟实验室中执行这些实验,并将结果反馈给人工智能。
![]()
像荣获诺贝尔奖的“阿尔法折叠”(AlphaFold)这样的人工智能工具,能通过氨基酸序列预测蛋白质结构,已为多个科学领域带来革命性变革。图片来源:亚历山德拉·德拉戈伊/《自然》杂志
与接受相同任务的人类科学家相比,ChatGPT提出的假设更少,执行的实验也更少。更关键的是,与人类不同,ChatGPT在收到实验结果后,既未修正原有假设,也未设计新实验,最终未能破解正确的调控机制。仅经过一轮研究,它就自信地认定原有观点正确——即便数据并不支持这些观点。
艾米·丁与李世博得出结论:至少ChatGPT-4尚不具备必要的“创造性灵光”——无法察觉并解读异常结果,也无法提出新颖且关键的问题。研究者指出,人类常会出于好奇心开展实验,随后通过新想法解释实验结果;但ChatGPT-4却十分“固执”,面对新证据时无法调整自身思路。
研究者认为,要实现真正突破性发现所需的好奇心与想象力,可能需要超越生成式人工智能的核心技术——即由相互连接的节点构成的分层“深度神经网络”。尽管深度神经网络擅长识别数据中的统计模式,但在进行灵活的、跳出思维定式的思考时却表现不佳。科尔顿对此表示认同:“当模型需要依赖海量数据训练时,跳出思维定式就变得非常困难——因为这些数据本质上就是‘思维定式内’的内容。”
尽管相关研究仍处于早期阶段,但新型人工智能架构可能会提升创造力潜力。艾米·丁与李世博重点提及了“神经形态人工智能”——这种技术模拟大脑的动态自组织过程。与此同时,科尔顿则对“神经符号人工智能”(neurosymbolic AI)充满期待:在这种架构中,从数据中提取模式的深度神经网络会与符号规则及推理相结合,而符号部分更接近明确的抽象思维。他表示,这种结合能让人工智能系统获得更大灵活性,突破训练数据的限制:“你可以对它说,‘你在数据中看到了这个规则,但如果这个规则不成立呢?’”
信任“创作过程”
然而,无论人工智能模型变得多么强大,我们是否应该将其描述为“有创造力”?部分研究者认为,在将创造力归因于人工智能之前,社会需要更深入地思考:“创造力”这一特质的本质究竟是什么?美国康涅狄格大学斯托斯分校教育心理学家、多本创造力领域著作的作者詹姆斯·考夫曼提出,我们需要关注“创作过程”,而非仅仅评判最终成果。“人工智能确实能生成具有创造性的产物,”他说,“但它并未经历‘创造性过程’。在我看来,它并非‘具有创造力的主体’。”
朗科也认为,“人工智能具有创造力”的观点忽略了人类在创作中所依赖的重要特质。他指出,神经网络遵循算法运行,而人类会运用主观情感、审美偏好、个人价值观与生活经验来做出创造性决策——这些“想象力飞跃”可能看似不合逻辑,却能表达一个人的独特视角与自我。
为体现这些人类独有的特质,朗科建议修改创造力的标准定义:除“原创性”与“有效性”外,还应加入“真实性”(即“忠于自我”)与“意向性”(一种内在动机,既包括开启创作过程的好奇心,也包括判断何时停止的判断力)。
英国爱丁堡艺术学院研究创造力与人工智能的哲学家卡特里娜·莫鲁齐表示,部分人工智能模型能自行评估输出内容并进行优化,但它们的目标始终由人类用户设定。“它们目前仍无法为自己设定目标——问题在于,它们未来是否能做到这一点。”
这幅人工智能生成的作品由雷菲克·安纳多尔在伦敦蛇形北画廊展出,创作素材为珊瑚礁与热带雨林的图像。图片来源:丹·基特伍德/盖蒂图片社
澳大利亚墨尔本莫纳什大学研究计算创造力的乔恩·麦科马克则认为,即便是高质量的人工智能创作,也“寄生”于训练数据中蕴含的人类创造力。“它们无法开创艺术流派,也无法自主产生‘成为艺术家’的意愿。”
这场争论与图灵当年纠结的问题遥相呼应:人类的一切行为——即便创造力——都能被机器完美复刻吗?还是说,人类存在机器无法替代的独特性?与图灵一样,科尔顿认为,从原则上讲,人工系统没有理由无法实现创造力。他指出,人工智能缺乏自主性与内在动机,并非其固有局限,而只是当前模型设计方式的“产物”。“我认为,我们完全可以为人工智能‘松绑’。”他希望看到人工智能主体被设计成具有更强创作自主性的系统——而非仅仅执行人类设定的任务,“就像你招聘一名成员加入创意团队时,会期望他能提出自己的想法一样”。
科尔顿承认,这类研究很难获得资金支持,部分原因是人们担心“自主导向的人工智能模型可能失控”。但他正通过一些小型项目展示人工智能工具的自主性:他与伦敦大学玛丽女王学院的深度学习研究者路易斯·布拉德肖合作,开发了一个名为“阿里亚”(Aria)的人工智能模型,该模型能自主创作钢琴作品(包括前文提及的《第17号钢琴小品》)并进行自我评价[5]。阿里亚会尝试不同创作可能性(例如调整某个音符的音高),并解释做出特定音乐选择的原因。科尔顿说:“对我而言,这个系统生成的部分音乐如此出色、如此优美,以至于让人遗憾它并非出自人类之手。”他希望,人工智能最终能助力人类文化发展,为我们展现新的创作可能。
然而,朗科认为,将人工智能系统视为“有创造力”将是一场文化灾难。他指出,过去数十年的研究表明,创造力不仅对社会整体至关重要,也关乎个人福祉。他表示,坚持日常创作(例如写日记、绘画)能改善情绪、缓解压力、增强心理韧性,还能提升认知灵活性、记忆力、社交能力,甚至对身体健康有益。
他认为,将机器生成的内容贴上“有创造力”的标签,会让上述价值大打折扣,尤其对教育领域产生堪忧影响:教师(乃至整个社会)可能不再重视“灵活性”“内在驱动力”等特质,转而只关注最终成果,却忽视了培养人类创作所需的核心能力。“如果我们执着于这种只看重‘输出’的表面化创造力定义,”他说,“人类的潜力将无从发挥。”
共同创造文化
另有研究者则避开了“人工智能系统本身是否具有创造力”这一问题,转而关注人与机器的互动。英国布莱顿萨塞克斯大学计算机科学家玛丽亚·特雷莎·利亚诺表示:“创造力是一种对话。我认为,如今的变化在于,我们拥有了一种新的‘创作媒介’。”她所研究的“协同创造力”(co-creativity)领域正快速发展,该领域聚焦于人工智能如何激发新型创造力,而非仅仅响应人类指令。
一些艺术家正利用这种媒介,挑战人类与人工智能的关系。例如“故障艺术”(glitch art)——通过“入侵”神经网络来改变其生成的内容。与此同时,麦科马克的团队开发了一种名为“模拟诗人”(mimetic poet)的设备:为促进人类与人工智能更具深度的互动,该设备设有一个面板,用户可在上面拼接磁性字母块,人工智能则会据此生成一首诗。
在艺术领域之外,人类与人工智能协作生成的内容,往往比两者单独创作的成果获得更高评价。2023年的一项研究[6]显示,参与者无法区分俳句是由人类还是人工智能创作,但他们认为“人机协作”生成的俳句最美。
然而,过度依赖人工智能可能会威胁创意产业的就业岗位,更广泛地说,还会削弱人类的创作能力。2024年初发表的一项研究[7]中,美国麻省理工学院的团队让一组参与者在三次写作任务中借助人工智能完成文章,随后进行一次无人工智能辅助的写作测试。结果显示,与全程仅依赖自身知识的参与者相比,依赖过人工智能的参与者在写作时“认知投入度更低”(通过脑电活动测量发现其大脑连接性更弱),写出的文章多样性不足,且难以引用文中内容。
这些结果印证了另一种担忧:文化多样性可能会因此减少。2023年的另一项创意写作研究[8]发现,人工智能辅助生成的故事,彼此间的相似度远高于人类独立创作的故事。利亚诺指出,人工智能生成的内容看似惊艳,“但仔细观察会发现,其中许多美学表达都只是‘重复旧内容’”。她担心,随着人类被海量人工智能内容包围,我们可能会走向一个“极其单调的世界”。
对于人工智能工具究竟会“扩大机会”还是“加剧现有不平等”,研究者也存在分歧。科尔顿认为,人工智能能让更多人获得创作能力:例如,无力学习钢琴的人也能创作音乐。“对我而言,这是人工智能系统最大的益处——创造力的民主化。”但也有研究者担忧,人工智能工具的获取机会远非“民主”。考夫曼表示:“有些人能获得远比他人更先进的人工智能工具。”
莫鲁齐认为,问题的关键在于,我们需要仔细思考“希望从机器那里获得何种帮助”。但考虑到技术变革的速度与科技公司的主导地位,这种“审慎思考”可能难以产生实际影响。麦科马克说:“我们根本没有时间停下来问‘这东西究竟有什么用?’。将文化‘自动化’,未必能让人们的生活更加丰富。”
本文来自孙学军科学网博客。
链接地址:https://blog.sciencenet.cn/blog-41174-1509095.html
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.