网易首页 > 网易号 > 正文 申请入驻

NHB | 多模态大模型做“仇恨言论”判定:更懂语境,也更难摆脱偏见

0
分享至

PsyBrain 脑心前沿 | 公众号 PSY-Brain_Frontier

一键关注,点亮星标 ⭐️

不错过每日前沿资讯

认知神经科学前沿文献分享


基本信息:

Title:Multimodal large language models can make context-sensitive hate speech evaluations aligned with human judgement

发表时间:2025.12.15

Journal:Nature Human Behaviour

影响因子:15.9

获取原文:

  1. 添加小助手:PSY-Brain-Frontier即可获取PDF版本



引言

社交平台的内容审核(content moderation)长期卡在一个矛盾点:规则需要“统一”但仇恨言论(hate speech)的含义往往高度依赖语境,即同一个词,在攻击与自嘲、外群体辱骂与群体内部“重新占有”(reclaimed slur)之间,处理逻辑可能完全不同。

传统自动化模型多以“文本片段”做判断,容易把讨论歧视经历、引用他人辱骂、或群体内部用语都误判为违规,反而加重对被针对群体的伤害。

本文把多模态大语言模型(multimodal large language models, MLLMs)拉进更贴近真实审核的场景:给模型一段仇恨言论政策(policy),再让它阅读“截图式”社交媒体帖(包含文字、头像/姓名等身份线索、互动回复、点赞量),用强制二选一的联合实验(conjoint experiment)做“优先送审”选择,并与1,854名人类受试者的判断对齐比较。


核心结果

更大、更强的多模态大模型(MLLMs)能更“看懂语境”:在给定仇恨言论政策(policy)并结合帖文上下文信息时,模型对“是否应优先送审/处理”的判断与人类更一致。

偏见并未消失:对词汇(lexical)触发与用户人口学线索(demographic cues)的系统性偏差仍普遍存在,且在较小模型上更明显。

视觉身份线索会放大差异:头像/面孔等视觉信息会显著影响部分模型的决策,使不同群体相关内容的处理更不均衡。

提示词能“增强语境敏感”,但无法根治偏差:通过prompting可提升对语境的利用程度,但偏见无法被完全消除。

方法论贡献:联合实验(conjoint experiments)适合用来审计(audit)这类“高度依赖语境”的内容审核AI,能更清晰拆解模型受哪些线索驱动。


Fig. 1 | Simulated social media posts.



Fig. 2 | Effects of post attributes on the moderation decisions.


Fig. 3 | Differences in the effects of slurs by identity.


Fig. 4 | Differences in the effects of slurs by identity across prompts.


Fig. 5 | Effects of identity on moderation decisions by identity cue modality. AMCE

前沿交流|欢迎加入认知神经科学前沿交流群!


核心图表、方法细节、统计结果与讨论见原文及其拓展数据。

分享人:BQ

审核:PsyBrain 脑心前沿编辑部

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
29岁渐冻症女孩“重生”,吃了蔡磊团队研发药物2年,“这个药用在我身上有用,病情没再发展”

29岁渐冻症女孩“重生”,吃了蔡磊团队研发药物2年,“这个药用在我身上有用,病情没再发展”

观威海
2026-01-02 10:14:04
美国对委内瑞拉动手,对中国既是利空,也是利好,中国会如何抉择

美国对委内瑞拉动手,对中国既是利空,也是利好,中国会如何抉择

阿胡
2026-01-04 19:11:41
申花国脚级锋霸在社媒发文告别球队!已提前敲定新东家,引发热议

申花国脚级锋霸在社媒发文告别球队!已提前敲定新东家,引发热议

振刚说足球
2026-01-04 16:15:24
局势彻底反转!特朗普政府几乎亮出了全部底牌,强行逼中国回应

局势彻底反转!特朗普政府几乎亮出了全部底牌,强行逼中国回应

安安说
2025-12-31 01:01:11
光涨年龄不涨演技!馒头脸,香肠唇,这些整容脸又来祸害央视剧了

光涨年龄不涨演技!馒头脸,香肠唇,这些整容脸又来祸害央视剧了

付老师种植技术团队
2026-01-02 20:16:54
贵州一对父子先后去世,女儿在ICU超过7天,一家四口或仅剩下妈妈

贵州一对父子先后去世,女儿在ICU超过7天,一家四口或仅剩下妈妈

天天热点见闻
2026-01-04 06:07:49
万科2000名跟投员工讨要跟投资金

万科2000名跟投员工讨要跟投资金

地产微资讯
2026-01-04 11:43:17
司晓迪再曝新料!洗脚、视频通话还有唱K,网友曝会议细节最搞笑

司晓迪再曝新料!洗脚、视频通话还有唱K,网友曝会议细节最搞笑

除夕烟火灿烂
2026-01-04 09:51:08
仅差24个!仅差78分!杜兰特迎来双里程碑,乔丹的纪录也保不住了

仅差24个!仅差78分!杜兰特迎来双里程碑,乔丹的纪录也保不住了

世界体育圈
2026-01-04 18:19:35
CBA积分榜最新排名出炉!广厦第1辽宁第9:山西杀回前8?

CBA积分榜最新排名出炉!广厦第1辽宁第9:山西杀回前8?

篮球快餐车
2026-01-05 00:46:20
这就是为什么体制内很少发朋友圈的原因

这就是为什么体制内很少发朋友圈的原因

夜深爱杂谈
2026-01-03 21:58:39
1980年王建安病逝,许世友得知后瞬间流泪,说:这家伙真招人恨啊

1980年王建安病逝,许世友得知后瞬间流泪,说:这家伙真招人恨啊

健康快乐丁
2026-01-02 09:07:30
中东国家都意识到了:就算中国高端武器再多,也没办法保护他们

中东国家都意识到了:就算中国高端武器再多,也没办法保护他们

芳芳历史烩
2026-01-04 20:48:24
风向突变,以德为首的西方国家齐发声:中国已在换电关键领域崛起

风向突变,以德为首的西方国家齐发声:中国已在换电关键领域崛起

法老不说教
2025-12-07 17:48:28
《人民日报》:真正能给你撑腰的,是足够的金钱,稳定的情绪....

《人民日报》:真正能给你撑腰的,是足够的金钱,稳定的情绪....

诗词中国
2026-01-02 20:36:32
文殊菩萨:无名指比食指长者,非常人体质,注定经历4种修行考验

文殊菩萨:无名指比食指长者,非常人体质,注定经历4种修行考验

纸鸢奇谭
2025-06-27 14:24:22
梅婷晒视频忘开美颜,脖子黑,皮还松,看脖子像是60岁的人!

梅婷晒视频忘开美颜,脖子黑,皮还松,看脖子像是60岁的人!

韩驰
2026-01-04 16:18:06
家里的财气都在厨房!灶王爷点拨:灶台边上放这3个东西,家运必旺

家里的财气都在厨房!灶王爷点拨:灶台边上放这3个东西,家运必旺

古怪奇谈录
2025-12-31 15:02:16
这么近那么美,冻死在河北!天然气年年涨价,普通百姓怎么御寒

这么近那么美,冻死在河北!天然气年年涨价,普通百姓怎么御寒

思愈飞
2026-01-03 18:17:00
5-1!头号射手缺阵 21岁奇兵联赛首球+完美戴帽 13.8亿豪门4连胜

5-1!头号射手缺阵 21岁奇兵联赛首球+完美戴帽 13.8亿豪门4连胜

狍子歪解体坛
2026-01-05 01:22:09
2026-01-05 03:51:00
PsyBrain脑心前沿
PsyBrain脑心前沿
追踪脑科学新动态,聚焦认知与神经新研究
90文章数 7关注度
往期回顾 全部

科技要闻

雷军:骂小米汽车有流量,但别故意抹黑

头条要闻

拘押马杜罗的拘留中心"环境令人作呕" 内部画面披露

头条要闻

拘押马杜罗的拘留中心"环境令人作呕" 内部画面披露

体育要闻

女子世界第一,9年前在咖啡店洗碗

娱乐要闻

《小城大事》上星央八 热血筑梦正当时

财经要闻

李迅雷:扩内需必须把重心从"投"转向"消"

汽车要闻

最高续航310km 岚图泰山8或将上半年发布

态度原创

手机
教育
数码
家居
本地

手机要闻

一加Turbo6参数公布,挑战Turbo档最强游戏体验

教育要闻

备考27新传研究生需要知道的50件事。

数码要闻

快科技2025年度评奖:品牌整机篇

家居要闻

黑白碰撞 个性多元冷冽风

本地新闻

即将过去的2025年,对重庆的影响竟然如此深远

无障碍浏览 进入关怀版