网易首页 > 网易号 > 正文 申请入驻

研究揭示:大语言模型无法真正理解双关语

0
分享至

IT之家 11 月 24 日消息,一项关于人工智能(AI)的最新研究表明,大语言模型(LLM)在理解双关语方面有所欠缺。


来自英国和意大利多所高校的专家团队近期开展了一项研究,重点考察大语言模型对双关语的理解能力,结果发现其表现令人失望。该团队由南威尔士卡迪夫大学(Cardiff University)与意大利威尼斯福斯卡里宫大学(Ca’ Foscari University of Venice)的研究人员组成,他们得出结论:尽管大语言模型能够识别双关语的表层结构,却无法真正领会其中的幽默含义。

IT之家注意到,研究团队测试了一个典型双关语例句:“I used to be a comedian, but my life became a joke.”(我曾是一名喜剧演员,但我的人生却成了一句‘玩笑话’/一场‘闹剧’。)当研究人员将句末“a joke”替换为语义相近但无双关意味的“chaotic”(混乱不堪)时,大语言模型仍倾向于判定该句含有双关。

另一个测试例句为:“Long fairy tales have a tendency to dragon.”(冗长的童话故事往往容易“dragon”[拖得太长]。)此处“dragon”谐音“drag on”(拖沓延续),构成双关。然而,即便将其替换为同义词“prolong”(延长),甚至一个随机词,大语言模型仍会误判该句存在双关成分。

卡迪夫大学计算机科学与信息学院的何塞・卡马乔・科拉多斯(Jose Camacho Collados)教授指出,此项研究揭示了大语言模型对幽默的理解仍极为薄弱。“总体而言,大语言模型倾向于记忆训练数据中学到的内容,因此能较好识别已存在的双关语,但这并不意味着它们真正理解这些双关语。”他解释道,“我们通过修改现有双关语、刻意移除构成双关的双重语义后,始终能‘欺骗’大语言模型。在这些情况下,模型会将修改后的句子与记忆中的双关语强行关联,并编造各种理由‘论证’其仍属双关。归根结底,我们发现:大语言模型对双关语的理解,其实只是一种‘幻觉’。”

研究团队进一步发现,面对不熟悉的文字游戏,大语言模型区分双关语与非双关语句的准确率可降至 20%。

研究人员还测试了另一则双关语:“Old LLMs never die, they just lose their attention.”(老一代大语言模型永不消亡,它们只是失去了‘注意力’[attention]。)此处“attention”暗指 Transformer 架构中的“注意力机制”。当研究者将“attention”替换为“ukulele”(尤克里里)时,某大语言模型竟仍判定其为双关,理由是“ukulele”听上去近似“you-kill-LLM”(你干掉了 LLM)。团队虽对该模型的“联想创造力”感到惊讶,但显然它仍未真正“懂”这个笑话。

研究人员强调,该成果凸显了人们在依赖大语言模型执行需具备幽默感、共情能力或文化敏感性的任务时,应保持高度审慎。相关研究成果已于本月早些时候在中国苏州举行的“2025 年自然语言处理实证方法会议”(EMNLP 2025)上发表,论文题为《双关非本意:大语言模型与幽默理解的幻象》(Pun unintended: 大语言模型 and the illusion of humor understanding)。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
抛弃漂亮饭的年轻人,集体钻进老式咖啡餐吧?

抛弃漂亮饭的年轻人,集体钻进老式咖啡餐吧?

九行Travel
2026-05-11 16:05:20
知情人士披露:美国或考虑恢复对伊朗军事行动

知情人士披露:美国或考虑恢复对伊朗军事行动

界面新闻
2026-05-12 13:27:48
男团、女团夺冠仅1天,韩媒、日媒接连发声锐评,态度出奇一致

男团、女团夺冠仅1天,韩媒、日媒接连发声锐评,态度出奇一致

梦醉为红颜一笑
2026-05-12 11:54:46
世界纪录将被浙江企业改写!绍兴造世界最高楼冲刺1008米!

世界纪录将被浙江企业改写!绍兴造世界最高楼冲刺1008米!

天气观察站
2026-05-12 11:09:49
刘晓彤当选!惠若琪在列,徐云丽无缘,中国排协公布完整名单

刘晓彤当选!惠若琪在列,徐云丽无缘,中国排协公布完整名单

跑者排球视角
2026-05-12 16:49:17
卡拉格:切尔西绝对会不惜一切代价把热刺送到英冠

卡拉格:切尔西绝对会不惜一切代价把热刺送到英冠

懂球帝
2026-05-12 12:20:06
正常人可以偶尔偷吃一颗伟哥吗?有什么副作用?本文为你讲出实情

正常人可以偶尔偷吃一颗伟哥吗?有什么副作用?本文为你讲出实情

健康科普365
2026-05-09 21:05:04
今年将迎“史上最热夏天”?专家分析

今年将迎“史上最热夏天”?专家分析

澎湃新闻
2026-05-13 00:02:11
食堂阿姨偷偷给贫困生多打菜,被同学举报后开除,次日接到局里电话

食堂阿姨偷偷给贫困生多打菜,被同学举报后开除,次日接到局里电话

罪案洞察者
2025-11-03 13:59:03
“你儿子比农村土狗还好养!”中学男孩全碳水饮食,吃出可怜面相

“你儿子比农村土狗还好养!”中学男孩全碳水饮食,吃出可怜面相

妍妍教育日记
2026-05-12 17:35:01
14岁被送上导演的床,17岁拍全裸写真,被操控半生,如今怎样了?

14岁被送上导演的床,17岁拍全裸写真,被操控半生,如今怎样了?

阿讯说天下
2026-04-18 11:52:55
珠穆朗玛峰南坡大本营附近发生雪崩,滑落的雪流掀起强烈气浪直冲而下,亲历者:事发时正在上厕所,眼见雪流逼近,急忙躲进厨房避险

珠穆朗玛峰南坡大本营附近发生雪崩,滑落的雪流掀起强烈气浪直冲而下,亲历者:事发时正在上厕所,眼见雪流逼近,急忙躲进厨房避险

大风新闻
2026-05-12 16:24:28
申花签下马莱加三年长约,锋线补强球迷期待新赛季

申花签下马莱加三年长约,锋线补强球迷期待新赛季

漫川舟船
2026-05-13 00:16:35
他奉命清查康、谢罪行,73岁当中纪委常务书记,侄女是著名歌唱家

他奉命清查康、谢罪行,73岁当中纪委常务书记,侄女是著名歌唱家

旧书卷里的长安
2026-05-11 21:04:17
从“跨省大交流”走上省部级岗位

从“跨省大交流”走上省部级岗位

香港經濟導報
2026-05-12 11:41:21
表决结果出炉,江启臣临阵退缩,绿营气急败坏,卢秀燕这回尴尬了

表决结果出炉,江启臣临阵退缩,绿营气急败坏,卢秀燕这回尴尬了

呼呼历史论
2026-05-11 18:33:47
WTA1000罗马站:高芙2-1逆转俄罗斯悍将,惊险晋级4强

WTA1000罗马站:高芙2-1逆转俄罗斯悍将,惊险晋级4强

俯身冲顶
2026-05-13 03:27:36
中纪委点名!国资做LP,亏了200亿

中纪委点名!国资做LP,亏了200亿

融资中国
2026-05-12 11:53:02
连续2场上演输2追3!梁靖崑被王皓调侃:梁教授这很符合你的专业

连续2场上演输2追3!梁靖崑被王皓调侃:梁教授这很符合你的专业

风过乡
2026-05-12 10:30:02
赚了1.1万!深夜大跳水!A股明天暴风雨?

赚了1.1万!深夜大跳水!A股明天暴风雨?

龙行天下虎
2026-05-13 00:07:31
2026-05-13 05:39:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
343930文章数 607203关注度
往期回顾 全部

科技要闻

宇树发布载人变形机甲,定价390万元起

头条要闻

特朗普称将同中方讨论对台军售和黎智英案 外交部回应

头条要闻

特朗普称将同中方讨论对台军售和黎智英案 外交部回应

体育要闻

骑士终于玩明白了?

娱乐要闻

白鹿风波升级!掉粉20万评论区沦陷

财经要闻

利润再腰斩 京东干外卖后就没过过好日子

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

教育
时尚
本地
家居
艺术

教育要闻

求求你试试「5+1+1」学习法!!!

普通人真该学学如何穿搭!多穿裙子比裤子更时髦,大方提气质

本地新闻

用苏绣的方式,打开江西婺源

家居要闻

极简主义下的居住场域与空间

艺术要闻

震惊!他竟用镜头看透了所有女人的秘密!

无障碍浏览 进入关怀版