网易首页 > 网易号 > 正文 申请入驻

米兰大学:揭示AI绘画的"内容与技法"认知

0
分享至

这项研究就像给AI画家做了一次"大脑扫描"。研究团队发现,当我们告诉AI"画一只长颈鹿,用分析立体主义的风格"时,AI的注意力会神奇地分成两部分:一部分专门关注长颈鹿本身(内容),另一部分则专门处理分析立体主义的特征(风格)。更有趣的是,这种分工并不是人为设计的,而是AI在学习过程中自发形成的能力。

这个发现颠覆了我们对AI艺术创作的理解。传统上,计算机视觉领域一直认为内容和风格应该是完全独立的两个概念,就像做菜时的食材和烹饪方法一样。但问题是,现在这些AI模型在训练时并没有被明确告知什么是内容、什么是风格,它们只是看了数以亿计的图片,然后自己学会了画画。那么,它们是否真的理解了内容和风格的区别呢?

研究团队使用了一种叫做"交叉注意力热图"的技术来窥探AI的"思考过程"。这就像给AI戴上了一副特殊眼镜,让我们能看到AI在生成图片时,每个词语对画面不同区域的影响程度。当AI处理"一幅分析立体主义风格的长颈鹿画作"这样的指令时,研究人员发现,"长颈鹿"这个词主要影响画面中动物本身的区域,而"分析立体主义"则主要影响背景和纹理部分。

更引人注目的是"伦勃朗的牛"这个例子,这也是论文标题的由来。研究发现,当AI被要求画"伦勃朗风格的牛"时,它竟然给牛"穿"上了衣服!这是因为AI从大量伦勃朗的画作中学到,伦勃朗主要画人物肖像,所以当遇到牛这个不寻常的主题时,AI试图用它熟悉的伦勃朗元素(比如服装)来表达这种风格。这种现象揭示了AI学习艺术的独特方式:它不仅仅是在模仿技法,还在尝试理解和重新组合艺术元素。

为了验证这些发现,研究团队设计了一套严谨的实验方法。他们从微软COCO数据集中选取了80种不同的物体作为内容元素,从WikiArt数据集中选择了50种风格描述符,包括23位著名艺术家和27种艺术运动。这样的组合产生了16000个独特的画画指令,涵盖了从"毕加索风格的香蕉"到"印象派的自行车"等各种有趣的组合。

实验使用了Stable Diffusion XL这个目前最成熟的开源文本生成图像模型。研究团队为每个指令生成图像,然后分析AI在处理内容词汇和风格词汇时的注意力分布模式。他们使用一种叫做"交并比"的数学方法来测量内容和风格注意力区域的重叠程度。如果重叠很少,说明AI确实将内容和风格区分对待;如果重叠很多,则表明AI可能将这两个概念混淆了。

研究结果令人振奋。在大多数情况下,AI确实表现出了对内容和风格的清晰区分。统计分析显示,内容和风格词汇的注意力重叠程度显著低于随机基准,这意味着这种分离不是偶然现象,而是AI学会的一种系统性能力。

然而,这种分离能力并不是在所有情况下都表现一致。研究发现了一些有趣的规律:动物类的内容词汇(如长颈鹿、斑马、熊)往往能与风格词汇实现最清晰的分离,而"人"这个词汇的分离效果最差。这可能是因为在艺术史中,人物肖像本身就承载着强烈的风格信息,使得内容和风格更难区分。

在风格方面,研究发现写实主义艺术运动(如新写实主义、洛可可)比抽象艺术运动(如抽象表现主义、立体主义)更容易与内容实现分离。这个发现非常合理:写实主义强调准确描绘对象本身,而抽象主义往往会改变或重新诠释对象的形态,使得内容和风格更加交融。

最引人注意的发现是关于个别艺术家的特殊行为。在所有测试的艺术家中,只有伦勃朗出现了负的分离值,意味着当使用伦勃朗风格时,内容和风格的融合程度超过了平均水平。这种现象特别在画人物时更加明显,可能与伦勃朗大量的自画像作品有关——AI学到的"伦勃朗风格"与人物形象紧密关联,难以分离。

研究团队还发现了一些令人惊讶的边缘案例。比如,当AI被要求画"拉斐尔·基希纳风格的胡萝卜"时,画面中竟然出现了一位女性形象。这是因为基希纳以画女性肖像著称,AI在处理这个不寻常的组合时,倾向于加入它认为符合该风格的典型元素。

这种现象反映了AI学习艺术的一个重要特点:它不仅学习绘画技法,还学习了艺术家的主题偏好和创作习惯。当遇到与艺术家常见主题不符的内容时,AI会尝试用该艺术家的典型元素来"补偿",创造出意想不到的融合效果。

为了确保研究结果的可靠性,研究团队使用了多种不同的阈值设置来分析注意力热图。无论是使用固定阈值还是基于百分位数的相对阈值,实验结果都保持一致,证明了发现的稳健性。统计检验显示,所有配置下的结果都具有高度显著性,排除了偶然性因素的影响。

这项研究对我们理解AI艺术创作具有重要意义。首先,它证明了大规模AI模型能够在没有明确指导的情况下,自发地学会区分艺术作品的内容和风格成分。这种能力的出现,为我们提供了AI如何理解和处理复杂艺术概念的珍贵洞察。

其次,研究揭示了AI艺术创作的细致入微之处。AI不仅仅是简单地复制和粘贴艺术元素,而是在深层次上理解了不同艺术家和艺术运动的特征,并能够智能地将这些特征应用到新的创作情境中。

第三,这些发现对改进AI艺术生成系统具有实用价值。了解AI如何处理内容和风格信息,可以帮助开发者设计更好的提示词策略,创造更精确、更富表现力的艺术作品。

研究也揭示了当前AI艺术系统的一些局限性。某些内容和风格的组合仍然会产生混淆,特别是当内容与特定艺术家的典型主题相冲突时。这提醒我们,AI虽然在艺术创作方面取得了令人印象深刻的进展,但仍然受到训练数据的偏见和局限性影响。

对于普通用户来说,这项研究提供了使用AI艺术工具的实用指导。在选择提示词时,考虑内容和风格的匹配程度可能会影响最终结果的质量。选择与特定艺术家常见主题相符的内容,可能会获得更好的风格表现效果。

展望未来,这项研究为AI艺术领域开辟了新的研究方向。研究团队表示,他们计划将这种分析方法扩展到其他文本生成图像模型,并与艺术领域专家合作,进行更深入的人类评估和分析。他们还计划探索不同的注意力提取方法和重叠度量标准,以更全面地理解AI的艺术创作机制。

这项研究的影响远远超出了技术层面。它让我们重新思考艺术创作的本质:什么是风格?什么是内容?它们之间的边界在哪里?当机器能够理解和模仿这些概念时,我们对艺术和创造力的定义又该如何演进?

说到底,这项研究告诉我们,AI已经不再是简单的图像复制机器,而是发展出了对艺术概念的深层理解能力。虽然这种理解可能与人类的艺术认知存在差异,但它代表了人工智能在理解和创造人类文化表达方面的重要进步。当我们下次使用AI创作艺术作品时,或许可以更加欣赏这个过程中隐藏的复杂性和智慧。毕竟,就连"伦勃朗的牛"也不只是简单的技术展示,而是AI对艺术理解的独特诠释。

对于那些对AI艺术创作感兴趣的读者,这项研究不仅提供了理论洞察,更开放了代码和数据集供进一步探索。研究团队希望这项工作能够促进更多关于AI艺术理解机制的研究,最终帮助我们创造出更加智能、更富创造力的AI艺术系统。

Q&A

Q1:AI绘画模型是如何区分"画什么"和"怎么画"的?

A:AI通过"交叉注意力热图"技术来处理这两个概念。当接收到"伦勃朗风格的牛"这样的指令时,AI会将注意力分成两部分:一部分专门关注"牛"这个内容对象,另一部分处理"伦勃朗风格"的绘画特征。这种分工不是人为设计的,而是AI在学习大量艺术作品后自发形成的能力。

Q2:为什么有些艺术家风格比其他风格更难与内容分离?

A:这主要取决于艺术家的创作习惯和主题偏好。比如伦勃朗以人物肖像和自画像著称,所以AI学到的"伦勃朗风格"与人物形象紧密关联,很难分离。写实主义艺术运动比抽象艺术运动更容易分离,因为写实主义强调准确描绘对象,而抽象主义往往改变对象形态。

Q3:这项研究对普通人使用AI绘画工具有什么实用价值?

A:研究发现可以帮助用户更好地设计提示词。选择与特定艺术家常见主题相符的内容(比如用伦勃朗画人物而不是动物)可能获得更好的风格效果。另外,动物类内容词汇比人物更容易与风格实现清晰分离,这可以指导用户在创作时的选择策略。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
封杀,也挡不住她封神

封杀,也挡不住她封神

独立鱼
2026-04-17 21:09:19
笑翻全场,郑丽文喊话张凌赫赴台,网友:嫁过去和亲也不是不可以

笑翻全场,郑丽文喊话张凌赫赴台,网友:嫁过去和亲也不是不可以

小椰的奶奶
2026-04-17 19:40:52
英国小妹歧视中国人后续:身份曝光社死,被告学校,下场大快人心

英国小妹歧视中国人后续:身份曝光社死,被告学校,下场大快人心

阿凫爱吐槽
2026-04-17 13:49:07
新娘确实漂亮,但我更喜欢戴眼镜那个。

新娘确实漂亮,但我更喜欢戴眼镜那个。

动物奇奇怪怪
2026-04-12 12:44:36
五一放假通知来了!中小学生同时迎来一个好消息

五一放假通知来了!中小学生同时迎来一个好消息

老特有话说
2026-04-18 18:42:39
新华社消息|伊朗发布船舶通行霍尔木兹海峡新规 强调有条件暂时开放

新华社消息|伊朗发布船舶通行霍尔木兹海峡新规 强调有条件暂时开放

新华社
2026-04-18 09:41:55
68岁大妈相亲,怕大爷不正经,称以后要分房睡,大爷:那要你干嘛

68岁大妈相亲,怕大爷不正经,称以后要分房睡,大爷:那要你干嘛

谈史论天地
2026-02-21 06:40:43
搭载40名中国游客大巴在俄罗斯翻车,或因司机打盹儿致车辆失控

搭载40名中国游客大巴在俄罗斯翻车,或因司机打盹儿致车辆失控

红星新闻
2026-04-18 19:08:29
去年才退休!中国民航大学汪瑾老师去世了,年仅56岁!

去年才退休!中国民航大学汪瑾老师去世了,年仅56岁!

凯旋学长
2026-04-18 12:10:51
杨幂baby旧照曝光!万万没想到,女明星私下里陪大佬吃饭都是素颜的

杨幂baby旧照曝光!万万没想到,女明星私下里陪大佬吃饭都是素颜的

八卦王者
2026-04-18 16:35:21
北京这晚,沈腾抢戏,于和伟陈坤帅得驰魂夺魄,都不及高圆圆吸睛

北京这晚,沈腾抢戏,于和伟陈坤帅得驰魂夺魄,都不及高圆圆吸睛

白面书誏
2026-04-17 16:02:16
魏建军发布会现场痛批营销团队5分钟:无法转化工程师成果“相当于犯罪”

魏建军发布会现场痛批营销团队5分钟:无法转化工程师成果“相当于犯罪”

三言科技
2026-04-18 20:55:06
16分钟被定位2639次!国家安全部紧急提醒:手机轨迹恐成泄密地

16分钟被定位2639次!国家安全部紧急提醒:手机轨迹恐成泄密地

有范又有料
2026-04-18 16:35:23
一夜之间全没了!12306这次动真格,以后买火车票不能“插队”了

一夜之间全没了!12306这次动真格,以后买火车票不能“插队”了

近史博览
2026-04-18 00:38:36
张雪机车再夺国际大赛杆位赛第二名 最新规定:张雪机车车手与车辆组合最低重量为239公斤

张雪机车再夺国际大赛杆位赛第二名 最新规定:张雪机车车手与车辆组合最低重量为239公斤

红星新闻
2026-04-18 12:32:22
欧美盯上广西!这所学校,成为眼中钉

欧美盯上广西!这所学校,成为眼中钉

毛豆论道
2026-04-17 19:16:45
朱自清长子被执行死刑33年后,法院:判决纯属错判,决定撤销原判

朱自清长子被执行死刑33年后,法院:判决纯属错判,决定撤销原判

近史谈
2026-04-18 16:54:35
美籍华人回国捞金遭驱逐,52岁成笑柄

美籍华人回国捞金遭驱逐,52岁成笑柄

晓帝爱八卦
2026-04-18 16:39:02
江青书信曝光!钢笔字竟暗藏惊人秘密,书法之争谁胜出?

江青书信曝光!钢笔字竟暗藏惊人秘密,书法之争谁胜出?

书画相约
2026-04-14 07:21:03
大快人心!浙江4057座寺庙,密集关停整顿,网友:乱象早该根治

大快人心!浙江4057座寺庙,密集关停整顿,网友:乱象早该根治

生活魔术专家
2026-04-18 14:15:43
2026-04-18 23:00:49
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
17789文章数 49699关注度
往期回顾 全部

科技要闻

传Meta下月拟裁8000 大举清退人力为AI腾位

头条要闻

小车在高速上跑100码 车主突然接到电话"你车轮没了"

头条要闻

小车在高速上跑100码 车主突然接到电话"你车轮没了"

体育要闻

时隔25年重返英超!没有人再嘲笑他了

娱乐要闻

刘德华回应潘宏彬去世,拒谈丧礼细节

财经要闻

"影子万科"2.0:管理层如何吸血万物云?

汽车要闻

奇瑞威麟R08 PRO正式上市 售价14.48万元起

态度原创

艺术
游戏
数码
公开课
军事航空

艺术要闻

耗资600亿,贵阳人的“上海外滩”,现在去看,荒得吓人

《刺客信条黑旗》重制版将至 你心中最帅刺客导师是谁

数码要闻

AMD锐龙9 9950X3D2英国定价799英镑!几乎全球最高

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

解放军护卫舰与外舰缠斗20小时 细节披露

无障碍浏览 进入关怀版