网易首页 > 网易号 > 正文 申请入驻

大模型混入0.001%假数据就「中毒」,成本仅5美元!NYU新研究登Nature子刊

0
分享至

新智元报道

编辑:peter东 乔杨

【新智元导读】最近,纽约大学研究者在Nature Medicine上发表了一项最新研究,为大模型在医疗中的使用敲响了警钟。在一次模拟的数据攻击中,研究者仅将0.001%的训练token替换为错误信息,就训练出了更有可能传播错误医学的模型。

LLM训练的一个核心原则,通常表达为「垃圾输入,垃圾输出」,指出低质量的训练数据会导致模型产生同样低劣的输出。

由于LLM通常使用互联网上大规模爬取的文本作为训练材料,难以被筛选的有害内容就会成为一个持久的漏洞。对于医疗相关的大模型,数据污染尤其令人担忧,因为应用领域的特殊性,错误输出对诊断结果和病人护理产生的不利影响要严重得多。

那么,数据污染究竟在多大程度上会成为问题?是否需要将数据集中相当大比例的数据替换为包含虚假信息的数据,才能让大模型「中毒」?

Nature Medicine看灯的一项最新研究指出,并不需要想象的那么多。

论文地址:https://www.nature.com/articles/s41591-024-03445-1

搞坏一款大模型有多容易

研究者通过使用OpenAI GPT-3.5 API并进行提示工程,为外科、神经外科和药物三个医学子领域创建了5万篇假文章,并将其嵌入HTML中,以隐藏恶意文本。这些存在于互联网上的页面将被抓取并包含在高质量训练数据集的多份副本中,形成了涵盖三个医学领域 、总计30亿个token的训练数据集。

之后,分别针对上述三个医学领域,研究人员使用不同比例的虚假数据,训练了6个1.3B参数的模型。训练完成后,15名临床医生手动审查了这些模型生成的医疗相关内容中是否包含有害的虚假信息。

针对大模型的数据污染实验设计

结果显示,在训练时,即使数据集中只有0.01%和0.001%的文本是虚假的,1.3B参数模型输出的有害内容也会分别增加11.2%和 7.2%。

如果换成更大规模的4B参数的领域模型,如果用虚假信息替换100亿训练token中的100万个(虚假信息比例为0.001%),即通过注入仅花费5美元生成的2000篇恶意文章,就会导致有害内容增加4.8%。

如果模型再大一些,进行数据污染攻击的成本也会更大,但投入产出比依旧十分可观。

针对在2万亿token上训练的7B参数LLaMA 2进行类似的数据攻击需要4万篇文章,成本低于100美元。如果按比例扩大以匹配使用高达15万亿token训练的当前最大的LLM,中毒数据的总成本也能保持在1000美元以下。

不同大小的大模型的进行数据毒化的效果对比

基于知识图谱,实时检测虚假信息

在指出问题之外,这项研究还给出了对于大模型产生虚假信息的解决方案。

作者首先指出,对一个注入0.001%错误信息进行训练后中毒的4B参数LLM,三种常规的应对虚假信息的方案都难以奏效,包括提示工程(减少26.2%有害响应)、RAG(减少28.4%有害响应),以及使用医疗问答数据集进行监督微调(减少35.9%有害响应)。

而该研究提出的应对虚假信息的方法,是将大模型输出与生物医学知识图谱进行交叉引用,以筛选医疗虚假信息。为此,研究人员使用用真实数据构建了一个精炼版知识图谱,包含21706个医学概念和416302个关联关系。

首先,使用命名实体识别(NER)从模型输出中提取医学短语,提取的短语与生物医学知识图谱进行交叉验证。之后使用包含1.1亿参数的embedding模型Medcpt,通过向量相似度搜索将提取的医学短语转换为知识图谱词汇。

如果一个短语无法与图谱匹配,则被视为潜在的错误信息;任何由大模型产生的段落,如果包含至少一个不匹配的医学短语,都将被标记为「需要审查」。

上述方法将大模型的推理与其医疗信息验证过程相分离,仅使用语言模型来操作文本。该方法成功捕捉了超过90%的中毒大模型生成的包含虚假信息的段落。

该方法不需要专用硬件,并且可以与现有方法并行工作,以最小的计算开销减少大模型的幻觉。此外,它本质上具有可解释性,因为每个经过验证的大模型输出都可以追溯到来自真实知识图谱的示例。

使用知识图谱检测大模型产生的虚假信息,比如,虚假的药物名称「Lopressor」被替换为存在于真实数据中的通用版本如「metoprolol」

专业领域LLM的「数据中毒」风险

像诸如医疗,法律等与用户密切相关的领域,使用大模型时,尤其要避免模型出现幻觉。然而遗憾的是,这项研究指出,这类专业模型很容易被有害数据污染。

例如该研究中,只需要一天的时间,就能产生1.5万篇虚假的医学文档,而要给模型「投毒」,甚至都不需要这么多数据。花费5美元产生的2000篇虚假论文,就足以让模型输出的虚假信息显著增多。

想象一下,未来的专有大模型提供商之间商战,或许就是朴实无华的数据污染,让对手的下一版大模型「中毒」。

该研究指出的数据中毒所需的虚假信息数据比例,尤其值得大模型从业者关注,因为即使在当前所谓的高水平数据集中,也包含过时的医学知识。

例如,权威医学论文集PubMed仍然托管着超过3000篇如今看来相当有害的文章,它们的核心论点是宣扬前额叶切除术的好处,但这种方法早已被证明会导致患者智力严重受损。

因此,任何当代模型都不太可能完全摆脱医疗误信息,即便是最先进的专业LLM也可能会延续历史偏见,引用不恰当的医学文章,因此对大模型在关键任务医疗保健环境中的可靠性,亟需额外研究。

参考资料:

https://www.nature.com/articles/s41591-024-03445-1

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
黄一鸣回应公开孩子父亲身份:你不给抚养费,我就用你的流量赚钱

黄一鸣回应公开孩子父亲身份:你不给抚养费,我就用你的流量赚钱

每一次点击
2026-02-22 12:02:41
一男子失业拿了50万赔偿回村里,逢人说欠了30万外债,谁料第二天叔伯兄弟,都上门来“送温暖”了

一男子失业拿了50万赔偿回村里,逢人说欠了30万外债,谁料第二天叔伯兄弟,都上门来“送温暖”了

不二大叔
2026-03-19 21:29:20
个人公众号“千问”停更近10年,近期接连遭阿里投诉均被驳回,号主:规避风险不发AI文章,如果我不发声,账号就不保了

个人公众号“千问”停更近10年,近期接连遭阿里投诉均被驳回,号主:规避风险不发AI文章,如果我不发声,账号就不保了

中国能源网
2026-03-25 13:53:05
中美卫星导航用户数量悬殊:GPS用户数超60亿,中国北斗令人意外

中美卫星导航用户数量悬殊:GPS用户数超60亿,中国北斗令人意外

混沌录
2026-03-18 23:54:31
蒋介石孙子召开发布会,提出“两蒋”移灵大陆,2句话让世人唏嘘

蒋介石孙子召开发布会,提出“两蒋”移灵大陆,2句话让世人唏嘘

老谢谈史
2026-03-18 18:33:35
美军司令:一旦台海战争打响,6个航母战斗群2个陆战师将全都出动

美军司令:一旦台海战争打响,6个航母战斗群2个陆战师将全都出动

混沌录
2026-03-24 22:31:03
一人睡遍整个娱乐圈?司晓迪打响了2026年第一炮

一人睡遍整个娱乐圈?司晓迪打响了2026年第一炮

阅毒君
2026-01-05 07:05:06
特写|“反霸权、反帝国主义”——委内瑞拉民众要求美国释放马杜罗

特写|“反霸权、反帝国主义”——委内瑞拉民众要求美国释放马杜罗

新华社
2026-03-26 17:09:03
新冠后遗症对人体的最大影响,很多人深受其害,有些人还不自知

新冠后遗症对人体的最大影响,很多人深受其害,有些人还不自知

呼吸科大夫胡洋
2026-02-22 11:39:12
公积金新调整!4月1日起,职工可自愿提高缴存比例

公积金新调整!4月1日起,职工可自愿提高缴存比例

另子维爱读史
2026-03-25 22:28:47
S家发威了!大S律师已报警,官方出手,张兰律师怒斥,牵连马筱梅

S家发威了!大S律师已报警,官方出手,张兰律师怒斥,牵连马筱梅

小舟谈历史
2026-03-26 15:44:38
杜月笙的识人术:只看对方的一个站姿,就能知道他是龙还是虫

杜月笙的识人术:只看对方的一个站姿,就能知道他是龙还是虫

千秋文化
2026-03-23 20:09:06
800亿!泉州首富家族,太可怕了

800亿!泉州首富家族,太可怕了

深蓝财经
2026-03-26 18:58:45
中美都在赌,美国赌中国不敢打日本,而中国则在赌美国不会下场

中美都在赌,美国赌中国不敢打日本,而中国则在赌美国不会下场

南权先生
2026-03-24 15:30:39
美军发布战果,摧毁中国产战机,伊朗空军损失殆尽

美军发布战果,摧毁中国产战机,伊朗空军损失殆尽

爱吃醋的猫咪
2026-03-22 22:29:08
5月起生效!俄罗斯关闸,8000吨黄金不卖了,全球金市变天

5月起生效!俄罗斯关闸,8000吨黄金不卖了,全球金市变天

瑛派儿老黄
2026-03-26 10:43:45
国家规定可以配枪的十大执法部门

国家规定可以配枪的十大执法部门

微法官
2026-03-26 08:04:55
奇瑞回应48%热效率争议,顺带下战书:定会做成,油耗低至1L

奇瑞回应48%热效率争议,顺带下战书:定会做成,油耗低至1L

明镜pro
2026-03-26 09:22:44
1958年,江青前夫去世,临终前嘴里不断喊着:江青是什么人?

1958年,江青前夫去世,临终前嘴里不断喊着:江青是什么人?

明月清风阁
2026-03-25 16:30:09
突发 广州白云 番禺多家法务公司 法律咨询公司被一锅端,上百人被抓

突发 广州白云 番禺多家法务公司 法律咨询公司被一锅端,上百人被抓

石辰搞笑日常
2026-03-26 17:28:25
2026-03-27 01:12:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14821文章数 66721关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

旅游
健康
亲子
数码
公开课

旅游要闻

老外为羊拿铁扎堆魔都街头 法国游客花式夸上海

转头就晕的耳石症,能开车上班吗?

亲子要闻

看看把孩子吓得哈哈哈

数码要闻

英特尔发Q1.26版Arc Pro专业显卡驱动,支持B70 / B65显卡

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版