网易首页 > 网易号 > 正文 申请入驻

研究揭示:大语言模型无法真正理解双关语

0
分享至

IT之家 11 月 24 日消息,一项关于人工智能(AI)的最新研究表明,大语言模型(LLM)在理解双关语方面有所欠缺。


来自英国和意大利多所高校的专家团队近期开展了一项研究,重点考察大语言模型对双关语的理解能力,结果发现其表现令人失望。该团队由南威尔士卡迪夫大学(Cardiff University)与意大利威尼斯福斯卡里宫大学(Ca’ Foscari University of Venice)的研究人员组成,他们得出结论:尽管大语言模型能够识别双关语的表层结构,却无法真正领会其中的幽默含义。

IT之家注意到,研究团队测试了一个典型双关语例句:“I used to be a comedian, but my life became a joke.”(我曾是一名喜剧演员,但我的人生却成了一句‘玩笑话’/一场‘闹剧’。)当研究人员将句末“a joke”替换为语义相近但无双关意味的“chaotic”(混乱不堪)时,大语言模型仍倾向于判定该句含有双关。

另一个测试例句为:“Long fairy tales have a tendency to dragon.”(冗长的童话故事往往容易“dragon”[拖得太长]。)此处“dragon”谐音“drag on”(拖沓延续),构成双关。然而,即便将其替换为同义词“prolong”(延长),甚至一个随机词,大语言模型仍会误判该句存在双关成分。

卡迪夫大学计算机科学与信息学院的何塞・卡马乔・科拉多斯(Jose Camacho Collados)教授指出,此项研究揭示了大语言模型对幽默的理解仍极为薄弱。“总体而言,大语言模型倾向于记忆训练数据中学到的内容,因此能较好识别已存在的双关语,但这并不意味着它们真正理解这些双关语。”他解释道,“我们通过修改现有双关语、刻意移除构成双关的双重语义后,始终能‘欺骗’大语言模型。在这些情况下,模型会将修改后的句子与记忆中的双关语强行关联,并编造各种理由‘论证’其仍属双关。归根结底,我们发现:大语言模型对双关语的理解,其实只是一种‘幻觉’。”

研究团队进一步发现,面对不熟悉的文字游戏,大语言模型区分双关语与非双关语句的准确率可降至 20%。

研究人员还测试了另一则双关语:“Old LLMs never die, they just lose their attention.”(老一代大语言模型永不消亡,它们只是失去了‘注意力’[attention]。)此处“attention”暗指 Transformer 架构中的“注意力机制”。当研究者将“attention”替换为“ukulele”(尤克里里)时,某大语言模型竟仍判定其为双关,理由是“ukulele”听上去近似“you-kill-LLM”(你干掉了 LLM)。团队虽对该模型的“联想创造力”感到惊讶,但显然它仍未真正“懂”这个笑话。

研究人员强调,该成果凸显了人们在依赖大语言模型执行需具备幽默感、共情能力或文化敏感性的任务时,应保持高度审慎。相关研究成果已于本月早些时候在中国苏州举行的“2025 年自然语言处理实证方法会议”(EMNLP 2025)上发表,论文题为《双关非本意:大语言模型与幽默理解的幻象》(Pun unintended: 大语言模型 and the illusion of humor understanding)。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
U23国足将战日本!媒体人热议:草皮情况不理想,夺冠概率25%

U23国足将战日本!媒体人热议:草皮情况不理想,夺冠概率25%

奥拜尔
2026-01-24 21:24:05
公募新进重仓股动向曝光!所有人都注意了,大盘下周或将这样走!

公募新进重仓股动向曝光!所有人都注意了,大盘下周或将这样走!

春江财富
2026-01-24 10:05:05
“这是被摧毁前的我”—英国逆天网红再发多人事前事后视频

“这是被摧毁前的我”—英国逆天网红再发多人事前事后视频

随波荡漾的漂流瓶
2026-01-24 20:28:36
3岁遭抛弃,被养父家8个姐姐宠爱,红遍亚洲后亲生父母上门认亲

3岁遭抛弃,被养父家8个姐姐宠爱,红遍亚洲后亲生父母上门认亲

顾史
2026-01-15 12:12:40
湖底惊现39年前失踪的运钞车,钞箱毫发无损,撬开后却傻眼了

湖底惊现39年前失踪的运钞车,钞箱毫发无损,撬开后却傻眼了

青青会讲故事
2025-09-17 11:32:38
全网寻鞋!男子坐卧铺时鞋被穿错,一只斯凯奇变Prada:新鞋第一次穿就丢了,希望能找回

全网寻鞋!男子坐卧铺时鞋被穿错,一只斯凯奇变Prada:新鞋第一次穿就丢了,希望能找回

鲁中晨报
2026-01-24 17:23:25
杨瀚森刚猛一节又垮!首节完美辅助,次节1分钟被轰8-0,太被动了

杨瀚森刚猛一节又垮!首节完美辅助,次节1分钟被轰8-0,太被动了

篮球资讯达人
2026-01-24 12:19:13
从免费听到付费,中国音乐非但没进步,反而把听众“作”没了?

从免费听到付费,中国音乐非但没进步,反而把听众“作”没了?

草莓解说体育
2026-01-20 04:16:58
国际奥委会主席,第三次找上门,想让中国办2036年奥运会。

国际奥委会主席,第三次找上门,想让中国办2036年奥运会。

南权先生
2026-01-19 15:43:28
密谈4小时,普京开出停战条件,乌克兰做不到免谈,中方斩钉截铁

密谈4小时,普京开出停战条件,乌克兰做不到免谈,中方斩钉截铁

社会日日鲜
2026-01-24 11:51:05
里根后第一人:泽连斯基达沃斯演讲后全场起立鼓掌!猛批欧尔班

里根后第一人:泽连斯基达沃斯演讲后全场起立鼓掌!猛批欧尔班

项鹏飞
2026-01-24 18:14:59
富婆主持被前夫家族甩黑锅

富婆主持被前夫家族甩黑锅

毒舌扒姨太
2026-01-24 22:15:38
师长战场牺牲,妻子嫁给战友,50年后子女才知:不是父亲亲生

师长战场牺牲,妻子嫁给战友,50年后子女才知:不是父亲亲生

海佑讲史
2026-01-22 16:30:06
杜兰特一下立刻崩盘,火箭对于他的需求度要比想象中高出许多?

杜兰特一下立刻崩盘,火箭对于他的需求度要比想象中高出许多?

稻谷与小麦
2026-01-24 22:37:45
1750亿移民法案碾压俄罗斯军费:民主党节节败退

1750亿移民法案碾压俄罗斯军费:民主党节节败退

斌闻天下
2026-01-24 08:14:20
74岁刘晓庆传"坏消息",意外摔倒后走不动路,令人担心的事发生了

74岁刘晓庆传"坏消息",意外摔倒后走不动路,令人担心的事发生了

寒士之言本尊
2025-12-04 23:17:14
老人微创手术两天后晕倒,送ICU抢救一年多鉴定植物生存状态;医院担次责,家属不服拟重新鉴定

老人微创手术两天后晕倒,送ICU抢救一年多鉴定植物生存状态;医院担次责,家属不服拟重新鉴定

大风新闻
2026-01-24 14:57:09
中国闹了个“乌龙”!本想种麦子保产量,却意外解决了千年难题!

中国闹了个“乌龙”!本想种麦子保产量,却意外解决了千年难题!

青梅侃史啊
2026-01-23 22:03:21
震撼!牢A大专被扒后塌房?漂亮女生被野生雪豹撕咬血流满面

震撼!牢A大专被扒后塌房?漂亮女生被野生雪豹撕咬血流满面

魔都囡
2026-01-24 11:59:14
广发证券:太空光伏创造光伏行业新需求 预计全球光伏需求有望达到645GW

广发证券:太空光伏创造光伏行业新需求 预计全球光伏需求有望达到645GW

财联社
2026-01-24 14:07:18
2026-01-24 23:11:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
326296文章数 606910关注度
往期回顾 全部

科技要闻

特斯拉Cybercrab即将落地 每公里不到1块钱

头条要闻

被雪豹咬伤女子从急诊转出 目击者:她没有去摸豹子

头条要闻

被雪豹咬伤女子从急诊转出 目击者:她没有去摸豹子

体育要闻

当家球星打替补,他们在故意摆烂?

娱乐要闻

回归还是顶流 凤凰传奇将现身马年春晚

财经要闻

“百年老字号”张小泉遭60亿债务压顶

汽车要闻

有增程和纯电版可选 日产NX8或于3-4月间上市

态度原创

教育
手机
亲子
时尚
公开课

教育要闻

傅佩荣:陪伴变监工,放养又不敢,当代父母养娃焦虑,看完就好了

手机要闻

华为Pura 80系列开启新年礼遇:至高优惠1500元,到手即享鸿蒙6

亲子要闻

自尊心很强的孩子该怎么疏导

冬天最佳“显瘦”公式:上短+下长

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版