网易首页 > 网易号 > 正文 申请入驻

NHB | 多模态大模型做“仇恨言论”判定:更懂语境,也更难摆脱偏见

0
分享至

PsyBrain 脑心前沿 | 公众号 PSY-Brain_Frontier

一键关注,点亮星标 ⭐️

不错过每日前沿资讯

认知神经科学前沿文献分享


基本信息:

Title:Multimodal large language models can make context-sensitive hate speech evaluations aligned with human judgement

发表时间:2025.12.15

Journal:Nature Human Behaviour

影响因子:15.9

获取原文:

  1. 添加小助手:PSY-Brain-Frontier即可获取PDF版本



引言

社交平台的内容审核(content moderation)长期卡在一个矛盾点:规则需要“统一”但仇恨言论(hate speech)的含义往往高度依赖语境,即同一个词,在攻击与自嘲、外群体辱骂与群体内部“重新占有”(reclaimed slur)之间,处理逻辑可能完全不同。

传统自动化模型多以“文本片段”做判断,容易把讨论歧视经历、引用他人辱骂、或群体内部用语都误判为违规,反而加重对被针对群体的伤害。

本文把多模态大语言模型(multimodal large language models, MLLMs)拉进更贴近真实审核的场景:给模型一段仇恨言论政策(policy),再让它阅读“截图式”社交媒体帖(包含文字、头像/姓名等身份线索、互动回复、点赞量),用强制二选一的联合实验(conjoint experiment)做“优先送审”选择,并与1,854名人类受试者的判断对齐比较。


核心结果

更大、更强的多模态大模型(MLLMs)能更“看懂语境”:在给定仇恨言论政策(policy)并结合帖文上下文信息时,模型对“是否应优先送审/处理”的判断与人类更一致。

偏见并未消失:对词汇(lexical)触发与用户人口学线索(demographic cues)的系统性偏差仍普遍存在,且在较小模型上更明显。

视觉身份线索会放大差异:头像/面孔等视觉信息会显著影响部分模型的决策,使不同群体相关内容的处理更不均衡。

提示词能“增强语境敏感”,但无法根治偏差:通过prompting可提升对语境的利用程度,但偏见无法被完全消除。

方法论贡献:联合实验(conjoint experiments)适合用来审计(audit)这类“高度依赖语境”的内容审核AI,能更清晰拆解模型受哪些线索驱动。


Fig. 1 | Simulated social media posts.



Fig. 2 | Effects of post attributes on the moderation decisions.


Fig. 3 | Differences in the effects of slurs by identity.


Fig. 4 | Differences in the effects of slurs by identity across prompts.


Fig. 5 | Effects of identity on moderation decisions by identity cue modality. AMCE

前沿交流|欢迎加入认知神经科学前沿交流群!


核心图表、方法细节、统计结果与讨论见原文及其拓展数据。

分享人:BQ

审核:PsyBrain 脑心前沿编辑部

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
她为儿子30年不嫁,儿子墓前哭:来生还做您儿子!

她为儿子30年不嫁,儿子墓前哭:来生还做您儿子!

东方不败然多多
2026-05-14 18:01:16
陶喆再一次证明,娶妻要娶年轻的,即使你老了,她还美得心旷神怡

陶喆再一次证明,娶妻要娶年轻的,即使你老了,她还美得心旷神怡

许三岁
2026-03-16 10:18:04
Dior 创意总监手绘稿件大公开!网友:“典型的实物与手稿不符”,“迪奥的版师也不行啊”~

Dior 创意总监手绘稿件大公开!网友:“典型的实物与手稿不符”,“迪奥的版师也不行啊”~

CFW服装设计
2026-05-14 13:12:14
一个三当家!生涯9年,0次全明星,为什么都说他值2.1亿顶薪

一个三当家!生涯9年,0次全明星,为什么都说他值2.1亿顶薪

球毛鬼胎
2026-05-14 12:58:21
3分钟倾家荡产?年入千亿“精神鸦片”,正精准掏空中国人的钱包

3分钟倾家荡产?年入千亿“精神鸦片”,正精准掏空中国人的钱包

趣文说娱
2026-05-12 19:53:22
郑丽文真硬气,特朗普访华消息刚落地,赖清德那边先坐不住了

郑丽文真硬气,特朗普访华消息刚落地,赖清德那边先坐不住了

慢歌轻步谣
2026-05-15 01:47:06
转会费预计7000万欧!世体:巴萨锋线头号目标是若昂·佩德罗

转会费预计7000万欧!世体:巴萨锋线头号目标是若昂·佩德罗

兰亭墨未干
2026-05-15 00:04:10
法新社镜头下的中国军人,不动如山

法新社镜头下的中国军人,不动如山

三叔的装备空间
2026-05-14 21:50:39
美联储最具争议主席诞生!56岁沃什险胜当选,妻子是雅诗兰黛女继承人,岳父是特朗普多年好友

美联储最具争议主席诞生!56岁沃什险胜当选,妻子是雅诗兰黛女继承人,岳父是特朗普多年好友

时代周报
2026-05-14 20:05:26
1985年,国安叛徒藏身南美,中国6名兵王万里锄奸,FBI颜面尽失

1985年,国安叛徒藏身南美,中国6名兵王万里锄奸,FBI颜面尽失

文史达观
2026-05-13 11:29:24
重庆疾控:暴雨来临时,这样应急避雨

重庆疾控:暴雨来临时,这样应急避雨

上游新闻
2026-05-14 19:35:03
中印冲突升级,曝残酷现实:中国越让步,印度越步步紧逼

中印冲突升级,曝残酷现实:中国越让步,印度越步步紧逼

近史博览
2026-05-14 13:21:57
36岁的人妻鸣海小雪,终于要出道了

36岁的人妻鸣海小雪,终于要出道了

吃瓜党二号头目
2026-05-03 09:12:34
金曲奖来了,看完提名名单,我要说:华语乐坛完了!

金曲奖来了,看完提名名单,我要说:华语乐坛完了!

八卦南风
2026-05-13 18:27:59
詹姆斯下份合同能拿多少?答案没那么简单

詹姆斯下份合同能拿多少?答案没那么简单

坠入温柔晚风
2026-05-15 00:55:14
一加新品官宣:旗舰性能+13380mAh,现已开售

一加新品官宣:旗舰性能+13380mAh,现已开售

T科技衍生
2026-05-15 00:11:55
《主角》:“小白鞋”的悲剧,暗示了易青娥一生的宿命

《主角》:“小白鞋”的悲剧,暗示了易青娥一生的宿命

那些故事有点远
2026-05-14 22:00:12
小雷:瓜迪奥拉给水晶宫球员做了一番动员,让他们好好踢枪手

小雷:瓜迪奥拉给水晶宫球员做了一番动员,让他们好好踢枪手

懂球帝
2026-05-14 20:15:22
八部门突然发文!余额宝被“移出”收银台,发生啥了

八部门突然发文!余额宝被“移出”收银台,发生啥了

呼呼历史论
2026-05-14 00:54:13
人大代表被罢免十几天即被刑拘,四川顶级富豪的终局

人大代表被罢免十几天即被刑拘,四川顶级富豪的终局

天气观察站
2026-05-14 17:33:49
2026-05-15 03:12:49
PsyBrain脑心前沿
PsyBrain脑心前沿
追踪脑科学新动态,聚焦认知与神经新研究
421文章数 20关注度
往期回顾 全部

科技要闻

马斯克说会谈很顺利 黄仁勋点赞 库克比耶

头条要闻

马斯克幼子装扮“火”了 衣服包包都是中国造

头条要闻

马斯克幼子装扮“火”了 衣服包包都是中国造

体育要闻

争议抽象天王山,和季后赛最稳定中锋

娱乐要闻

何九华官宣当爸!全程不提孩子妈

财经要闻

李强会见美国工商界代表

汽车要闻

双零重力座椅/AI智能体/调光天幕 启境GT7内饰发布

态度原创

亲子
房产
本地
旅游
军事航空

亲子要闻

孤独症特教老师的工作,远不止“教说话”!(下)

房产要闻

海南楼市新政要出!拟调公积金贷款额度,最高可贷168万!

本地新闻

用苏绣的方式,打开江西婺源

旅游要闻

日照五莲:云海日出映青山

军事要闻

美以伊战争期间以总理密访阿联酋

无障碍浏览 进入关怀版