网易首页 > 网易号 > 正文 申请入驻

AI比人类更会玩梗!模因图灵测试已被攻破,研究发现LLM表情包更搞笑

0
分享至

新智元报道

编辑:定慧 英智

【新智元导读】研究发现,LLM在创作梗图时表现出惊人的幽默感与创造力,甚至超越了人类创作者!AI创作的梗图评分更高,但最具灵魂的作品仍来自人类。

AI似乎比人类更懂得「如何幽默」,模因(Meme)图灵测试已经被LLM通过!

来自慕尼黑和瑞典的研究者发现:LLM能够生成「被人类评判为」比普通人创作的模因更搞笑的作品!

论文链接:https://arxiv.org/abs/2501.11433

研究者在图中展示了「模因(Meme)梗图」的效果,从幽默性(Humor)、创意性(Creativity)和分享性(Shareability)三个方面进行比赛。

有趣的是,完全由AI创作的梗图在所有领域的平均表现都优于仅由人类或人类-AI协作创作的梗。

这似乎表明AI已经通过了模因图灵测试。

幽默的复杂性:AI真的可以理解人类的幽默吗?

「模因Meme」一词最早可以追溯到Richard Dawkin在1976年出版的《自私的基因》,随之演化成为媒介传播过程中网络梗图、搞笑段落和幽默视频的代名词。

模因的独特特征,包括其视觉和文本性质、对文化背景的依赖以及通常简洁而有力的幽默表达,给生成式AI带来了与「纯文本笑话」生成不同的独特挑战。

这项研究的核心目的,是探究LLM和人类在创作梗图时的协同创造力。

为啥选梗图呢?因为梗图把视觉和文字巧妙融合,既依赖文化背景,又充满创意和幽默,特别适合用来研究人类和AI在创作上的互动。

Gemini根据论文生成的梗图

网络流行的德雷克拒绝/接受梗被AI理解

人类之间的合作,一直被认为能激发创造力。大家一起头脑风暴,不同的观点相互碰撞,往往能诞生出更棒的创意。

对于如何评估梗图这种创意作品,一般会从创造力、幽默感和分享度这几个方面入手。

梗图创作大PK

研究团队精心设计了一项用户研究,把参与者分成了三组。

第一组是纯人类组,他们在没有任何AI帮助的情况下创作梗图;第二组是人类-AI协作组,参与者可以和LLM互动,借助它的力量来生成想法;第三组是AI组,梗图完全由模型自主生成。

具体的创作任务分为三个步骤。

首先是创意生成,研究人员会给他们展示一张流行梗图的背景图片,然后让他们围绕工作、食物、运动这三个主题里的一个,在五分钟内尽可能多地想出梗图的文字说明。

对于人类-AI协作组,参与者还能通过聊天界面向LLM寻求帮助。

接着是收藏选择,参与者要从自己想出的所有想法里,挑出最喜欢的三个。

最后是图片创作阶段,他们把选好的想法添加到梗图模板上,还能对文字的位置、大小进行调整。

创作的时候,每位参与者要根据不同的图片和主题组合,完成三个梗图的创作,整个过程大概40分钟,完成后还能得到15美元的报酬。

之后,研究人员从人类组和协作组生成的梗图里,分别随机挑选150张,再让LLM针对同样的图片和主题,生成150张AI创作的梗图。

然后,找了另一组新的参与者,让他们从幽默、创意、分享度这三个方面,对这些梗图进行打分评估。

为了让LLM在研究里发挥作用,研究人员给它设定了不同的任务。

在人类-AI协作组的创意生成阶段,LLM就像个「创意助手」,参与者可以自由地向它提问。

为了让LLM给出更符合要求的回答,研究人员给它设置了系统提示,告诉它要帮助用户生成梗图创意,交互语气要友好礼貌,一次最多给出三个想法。

在生成纯AI梗图的时候,研究人员会把图片信息发给LLM,让它针对每个图片-主题组合生成20个梗图文字说明。

研究的用户界面是用React搭建的,数据收集和与OpenAI的GPT-4o API的交互通过NodeJS服务器,保证了数据的准确性和完整性。

梗图创作和评估都是在线上完成的,创作阶段用专门搭建的梗图创作界面,评估阶段则借助商业调查平台。

梗图创作阶段,研究人员通过线上平台Prolific招募了124人,其中26人没完成任务。

最后的参与者来自30个不同的国家,英语水平都不错,而且之前至少用过一次LLM的界面。其中63人是男性,35人是女性,平均年龄28.8岁。

在梗图评估阶段,又招募了100人,同样要求英语好,但不要求有使用LLM的经验。最后有98人完成了任务,这组人男女比例差不多,平均年龄32.6岁,来自29个不同国家。

研究结果

现在,激动人心的研究结果来啦!

先看看梗图创作阶段,在创意生成方面,使用LLM的参与者明显比纯人类组想出了更多的创意。纯人类组平均每人想出6.1个创意,而有LLM帮助的参与者在这方面优势明显。

在LLM的帮助下,参与者生成了更多创意,而且他们并不觉得创作过程更累。

从NASA-TLX的评估数据可以看到,两组在整体工作量上没有太大差别,只是在「努力程度」这一项上,AI协作组的参与者打分更低。

LLM确实能提高创作效率,让人们在创作梗图时更轻松地产生更多创意,但它可能会让创作者对作品的「主人翁」 感觉变弱。

LLM主要在创意生成阶段发挥作用,而后续的筛选和图片制作环节还是靠参与者自己完成。


梗图评分

从梗图的评分结果来看,人机协作组虽然在创意数量上占优,但在质量上并没有比纯人类创作的梗图更好。

在幽默程度、创造力和分享度这三个维度上,两组的评分没有显著差异。这说明在梗图创作中,单纯增加数量,并不一定能提升作品的质量。

让人意外的是,纯AI生成的梗图在幽默、创意和分享度这三个方面的整体评分都比人类组和人类-AI协作组要高。

这是因为LLM在训练过程中,接触了大量的素材,能够精准地把握大众的喜好。

但当我们把目光聚焦在那些表现最出色的梗图时,在最有趣的梗图中,大部分是由人类创作的;而在创造力和分享度方面表现突出的梗图里,人机协作的成果占了不少。

这充分体现了人类的创造力在某些方面是无可替代的。人类能够将个人独特的经历、丰富的文化内涵融入作品。

LLM在梗图创作中的优势显而易见。它就像一个不知疲倦的创意助手,能在短时间内提供大量的创意,帮助创作者突破思维局限,提高创作效率。

而且,凭借其对海量数据的学习能力,它能精准地抓住大众的幽默喜好,创作出有吸引力的内容。

但它也并非完美无缺。LLM生成的内容往往缺乏独特的个性和深度,可能无法真正理解某些特定文化背景下的微妙幽默。

人类的创造力是梗图创作中不可或缺的关键因素。

例如,在创作一个关于职场的梗图时,人类创作者可以结合自己在职场中的真实故事和感受,对LLM生成的创意进行调整,让梗图更具感染力和真实感。

参考资料:

https://x.com/emollick/status/1901431681279475808

https://arxiv.org/abs/2501.11433

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
32克金项链不翼而飞,闺蜜全程陪同报警勘察!警方:小偷就是……卖了3.4万元

32克金项链不翼而飞,闺蜜全程陪同报警勘察!警方:小偷就是……卖了3.4万元

环球网资讯
2026-03-26 13:30:10
想拿中国尿素救春耕?先把欠中企的百亿欠款还了!否则一粒不售

想拿中国尿素救春耕?先把欠中企的百亿欠款还了!否则一粒不售

过期少女致幻录
2026-03-26 11:44:43
心酸!湖南某乡镇一位小学教师哭诉年收入73150元,评论区炸锅了

心酸!湖南某乡镇一位小学教师哭诉年收入73150元,评论区炸锅了

火山詩话
2026-03-26 09:24:48
哪吒汽车破产覆灭,最讽刺的不是200亿债务,而是这个名字本身

哪吒汽车破产覆灭,最讽刺的不是200亿债务,而是这个名字本身

蜉蝣说
2026-03-25 10:54:58
小凯文-波特:为了维护科比,我要打破阿德巴约的83分纪录

小凯文-波特:为了维护科比,我要打破阿德巴约的83分纪录

懂球帝
2026-03-26 18:48:05
伊朗官媒发布《为众人复仇》AI短片:一枚伊朗导弹在哈梅内伊等人注视下,精准炸毁幻化成羊头恶魔的美国自由女神像

伊朗官媒发布《为众人复仇》AI短片:一枚伊朗导弹在哈梅内伊等人注视下,精准炸毁幻化成羊头恶魔的美国自由女神像

大象新闻
2026-03-26 09:45:03
张雪峰前女友哭红眼,喊话不要给张雪峰泼脏水,曝两人分手原因

张雪峰前女友哭红眼,喊话不要给张雪峰泼脏水,曝两人分手原因

180视角
2026-03-26 14:51:03
伊朗女药剂师拒绝撤离,空袭第10天在“精准”打击下被“误杀”

伊朗女药剂师拒绝撤离,空袭第10天在“精准”打击下被“误杀”

网易新闻出品
2026-03-26 11:16:13
勇敢发声!科威特记者联合国痛批“反以仪式”

勇敢发声!科威特记者联合国痛批“反以仪式”

Nee看
2026-03-26 14:15:21
广东报告梅大高速“5·1”塌方灾害整改落实情况:发现公路隐患1.6万余处

广东报告梅大高速“5·1”塌方灾害整改落实情况:发现公路隐患1.6万余处

封面新闻
2026-03-26 15:36:07
突发传闻:封锁霍尔木兹的伊朗关键人物被击毙

突发传闻:封锁霍尔木兹的伊朗关键人物被击毙

桂系007
2026-03-26 16:19:32
41岁张雪峰去世后续,其婚姻被扒,已离婚6年,前妻很低调

41岁张雪峰去世后续,其婚姻被扒,已离婚6年,前妻很低调

180视角
2026-03-26 13:01:03
参加世界杯,每人先交1.5万刀!特朗普政策影响多个世界杯参赛国

参加世界杯,每人先交1.5万刀!特朗普政策影响多个世界杯参赛国

全景体育V
2026-03-26 08:16:09
俄罗斯主帅:FIFA把我们禁赛了,就算加入亚足联顶多踢亚洲杯

俄罗斯主帅:FIFA把我们禁赛了,就算加入亚足联顶多踢亚洲杯

懂球帝
2026-03-26 16:30:07
正脸曝光!强闯我使馆的村田晃大3月15日刚晋升,所持刀具刃长约18厘米

正脸曝光!强闯我使馆的村田晃大3月15日刚晋升,所持刀具刃长约18厘米

中国网
2026-03-26 14:01:45
博主被陌生网友辱骂3个月,默默观察其2年半,终于找到机会碰面了

博主被陌生网友辱骂3个月,默默观察其2年半,终于找到机会碰面了

离离言几许
2026-03-26 15:01:41
中国买了欧洲1000亿人民币的飞机:东航向空客购买101架A320

中国买了欧洲1000亿人民币的飞机:东航向空客购买101架A320

观察者网
2026-03-25 18:00:06
高速统一限速3月26日正式落地!五档限速+清理非标不会再乱扣分!

高速统一限速3月26日正式落地!五档限速+清理非标不会再乱扣分!

沙雕小琳琳
2026-03-26 09:41:30
张雪峰去世真相!网友:偌大的公司靠他个人ip养活,早死是必然的

张雪峰去世真相!网友:偌大的公司靠他个人ip养活,早死是必然的

火山詩话
2026-03-25 09:18:58
约基奇23+21+19创纪录!掘金险胜独行侠 穆雷53+9三分赛季新高

约基奇23+21+19创纪录!掘金险胜独行侠 穆雷53+9三分赛季新高

醉卧浮生
2026-03-26 12:35:12
2026-03-26 19:20:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14821文章数 66721关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

原正部级刘慧被开除党籍:结交政治骗子 匿名诬告他人

头条要闻

原正部级刘慧被开除党籍:结交政治骗子 匿名诬告他人

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

艺术
家居
数码
亲子
公开课

艺术要闻

哪一座桥不是风景?

家居要闻

傍海而居 静观蝴蝶海

数码要闻

苹果MacBook Neo将重塑整个笔电行业!分析师纷纷强调:打不过

亲子要闻

上海美华妇儿医院"康复中心"完成全面升级并正式焕新启幕

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版