网易首页 > 网易号 > 正文 申请入驻

大模型混入0.001%假数据就「中毒」,成本仅5美元!NYU新研究登Nature子刊

0
分享至

新智元报道

编辑:peter东 乔杨

【新智元导读】最近,纽约大学研究者在Nature Medicine上发表了一项最新研究,为大模型在医疗中的使用敲响了警钟。在一次模拟的数据攻击中,研究者仅将0.001%的训练token替换为错误信息,就训练出了更有可能传播错误医学的模型。

LLM训练的一个核心原则,通常表达为「垃圾输入,垃圾输出」,指出低质量的训练数据会导致模型产生同样低劣的输出。

由于LLM通常使用互联网上大规模爬取的文本作为训练材料,难以被筛选的有害内容就会成为一个持久的漏洞。对于医疗相关的大模型,数据污染尤其令人担忧,因为应用领域的特殊性,错误输出对诊断结果和病人护理产生的不利影响要严重得多。

那么,数据污染究竟在多大程度上会成为问题?是否需要将数据集中相当大比例的数据替换为包含虚假信息的数据,才能让大模型「中毒」?

Nature Medicine看灯的一项最新研究指出,并不需要想象的那么多。

论文地址:https://www.nature.com/articles/s41591-024-03445-1

搞坏一款大模型有多容易

研究者通过使用OpenAI GPT-3.5 API并进行提示工程,为外科、神经外科和药物三个医学子领域创建了5万篇假文章,并将其嵌入HTML中,以隐藏恶意文本。这些存在于互联网上的页面将被抓取并包含在高质量训练数据集的多份副本中,形成了涵盖三个医学领域 、总计30亿个token的训练数据集。

之后,分别针对上述三个医学领域,研究人员使用不同比例的虚假数据,训练了6个1.3B参数的模型。训练完成后,15名临床医生手动审查了这些模型生成的医疗相关内容中是否包含有害的虚假信息。

针对大模型的数据污染实验设计

结果显示,在训练时,即使数据集中只有0.01%和0.001%的文本是虚假的,1.3B参数模型输出的有害内容也会分别增加11.2%和 7.2%。

如果换成更大规模的4B参数的领域模型,如果用虚假信息替换100亿训练token中的100万个(虚假信息比例为0.001%),即通过注入仅花费5美元生成的2000篇恶意文章,就会导致有害内容增加4.8%。

如果模型再大一些,进行数据污染攻击的成本也会更大,但投入产出比依旧十分可观。

针对在2万亿token上训练的7B参数LLaMA 2进行类似的数据攻击需要4万篇文章,成本低于100美元。如果按比例扩大以匹配使用高达15万亿token训练的当前最大的LLM,中毒数据的总成本也能保持在1000美元以下。

不同大小的大模型的进行数据毒化的效果对比

基于知识图谱,实时检测虚假信息

在指出问题之外,这项研究还给出了对于大模型产生虚假信息的解决方案。

作者首先指出,对一个注入0.001%错误信息进行训练后中毒的4B参数LLM,三种常规的应对虚假信息的方案都难以奏效,包括提示工程(减少26.2%有害响应)、RAG(减少28.4%有害响应),以及使用医疗问答数据集进行监督微调(减少35.9%有害响应)。

而该研究提出的应对虚假信息的方法,是将大模型输出与生物医学知识图谱进行交叉引用,以筛选医疗虚假信息。为此,研究人员使用用真实数据构建了一个精炼版知识图谱,包含21706个医学概念和416302个关联关系。

首先,使用命名实体识别(NER)从模型输出中提取医学短语,提取的短语与生物医学知识图谱进行交叉验证。之后使用包含1.1亿参数的embedding模型Medcpt,通过向量相似度搜索将提取的医学短语转换为知识图谱词汇。

如果一个短语无法与图谱匹配,则被视为潜在的错误信息;任何由大模型产生的段落,如果包含至少一个不匹配的医学短语,都将被标记为「需要审查」。

上述方法将大模型的推理与其医疗信息验证过程相分离,仅使用语言模型来操作文本。该方法成功捕捉了超过90%的中毒大模型生成的包含虚假信息的段落。

该方法不需要专用硬件,并且可以与现有方法并行工作,以最小的计算开销减少大模型的幻觉。此外,它本质上具有可解释性,因为每个经过验证的大模型输出都可以追溯到来自真实知识图谱的示例。

使用知识图谱检测大模型产生的虚假信息,比如,虚假的药物名称「Lopressor」被替换为存在于真实数据中的通用版本如「metoprolol」

专业领域LLM的「数据中毒」风险

像诸如医疗,法律等与用户密切相关的领域,使用大模型时,尤其要避免模型出现幻觉。然而遗憾的是,这项研究指出,这类专业模型很容易被有害数据污染。

例如该研究中,只需要一天的时间,就能产生1.5万篇虚假的医学文档,而要给模型「投毒」,甚至都不需要这么多数据。花费5美元产生的2000篇虚假论文,就足以让模型输出的虚假信息显著增多。

想象一下,未来的专有大模型提供商之间商战,或许就是朴实无华的数据污染,让对手的下一版大模型「中毒」。

该研究指出的数据中毒所需的虚假信息数据比例,尤其值得大模型从业者关注,因为即使在当前所谓的高水平数据集中,也包含过时的医学知识。

例如,权威医学论文集PubMed仍然托管着超过3000篇如今看来相当有害的文章,它们的核心论点是宣扬前额叶切除术的好处,但这种方法早已被证明会导致患者智力严重受损。

因此,任何当代模型都不太可能完全摆脱医疗误信息,即便是最先进的专业LLM也可能会延续历史偏见,引用不恰当的医学文章,因此对大模型在关键任务医疗保健环境中的可靠性,亟需额外研究。

参考资料:

https://www.nature.com/articles/s41591-024-03445-1

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
突发!四连败后主帅请辞,媒体人爆料:杨鸣已经直接回沈阳

突发!四连败后主帅请辞,媒体人爆料:杨鸣已经直接回沈阳

徐徐解说
2026-01-25 23:41:56
委内瑞拉新政府宣布不承认马杜罗及其所有债务

委内瑞拉新政府宣布不承认马杜罗及其所有债务

桂系007
2026-01-25 23:56:17
腾讯宣布:春节发10亿元现金!单个红包最高达1万元,可直接提现到微信

腾讯宣布:春节发10亿元现金!单个红包最高达1万元,可直接提现到微信

每日经济新闻
2026-01-25 19:55:05
又一款10001mAh新机官宣:1月29日,正式全球发布!

又一款10001mAh新机官宣:1月29日,正式全球发布!

科技堡垒
2026-01-25 12:32:51
直降3000元!新iPhone 突然官宣:1月25日,正式降价!

直降3000元!新iPhone 突然官宣:1月25日,正式降价!

科技堡垒
2026-01-25 12:18:39
印度爆发尼帕病毒疫情 死亡率高达40%到75%

印度爆发尼帕病毒疫情 死亡率高达40%到75%

看看新闻Knews
2026-01-25 17:57:08
日本为何禁肉1200年?乃是统治者“制度设计”,解禁后人均身高迅速上涨

日本为何禁肉1200年?乃是统治者“制度设计”,解禁后人均身高迅速上涨

齐天候
2026-01-25 23:29:25
恐怖20-0!澳网第2位前八种子出局 萨巴伦卡创历史 王欣瑜目标8强

恐怖20-0!澳网第2位前八种子出局 萨巴伦卡创历史 王欣瑜目标8强

侃球熊弟
2026-01-26 00:20:03
“我们不要三通一达女!”上海公司喊话留学生:入职体检别想隐瞒

“我们不要三通一达女!”上海公司喊话留学生:入职体检别想隐瞒

泽泽先生
2026-01-25 22:08:55
贾国龙最新发声!“将回归一线,不再打造个人IP”

贾国龙最新发声!“将回归一线,不再打造个人IP”

每日经济新闻
2026-01-25 22:13:09
笑不活了!全网最崩溃的婆婆诞生,得知儿媳怀上三胎,她就地打滚

笑不活了!全网最崩溃的婆婆诞生,得知儿媳怀上三胎,她就地打滚

火山诗话
2026-01-25 08:28:32
美论坛:为什么中国明知很容易被摧毁,却还要在南海建造基地?

美论坛:为什么中国明知很容易被摧毁,却还要在南海建造基地?

顾史
2026-01-26 03:04:30
李嘉诚再开金口:未来十年,中国近一半家庭,将面临6大难题?

李嘉诚再开金口:未来十年,中国近一半家庭,将面临6大难题?

巢客HOME
2026-01-24 08:15:03
全球销量六连冠!嘲讽丰田不行了的人,非蠢即坏

全球销量六连冠!嘲讽丰田不行了的人,非蠢即坏

象视汽车
2026-01-24 07:00:03
男子打扫卫生发现200张千元存单,妻子每天借上厕所到银行存1000

男子打扫卫生发现200张千元存单,妻子每天借上厕所到银行存1000

半岛晨报
2026-01-25 19:45:55
李湘被英国相关部门调查,涉嫌用艺术品国际洗钱,王诗龄已经休学

李湘被英国相关部门调查,涉嫌用艺术品国际洗钱,王诗龄已经休学

花哥扒娱乐
2026-01-25 17:10:22
掉下去必死!31岁美国男子徒手攀爬台北101:91分钟登顶 看着都怕

掉下去必死!31岁美国男子徒手攀爬台北101:91分钟登顶 看着都怕

风过乡
2026-01-25 17:36:53
云南毒红薯升级!调查组介入,网友扒出黑幕,难怪商户敢主动投毒

云南毒红薯升级!调查组介入,网友扒出黑幕,难怪商户敢主动投毒

云舟史策
2026-01-24 16:14:54
一月两杀!明尼阿波利斯骚乱失控,ICE暴力执法点燃全美怒火

一月两杀!明尼阿波利斯骚乱失控,ICE暴力执法点燃全美怒火

老马拉车莫少装
2026-01-25 10:23:15
某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

戗词夺理
2026-01-24 16:05:41
2026-01-26 04:00:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14411文章数 66530关注度
往期回顾 全部

科技要闻

黄仁勋在上海逛菜市场,可能惦记着三件事

头条要闻

男孩打碎电视屏为"还债"在小区创业 不到2个月赚了6千

头条要闻

男孩打碎电视屏为"还债"在小区创业 不到2个月赚了6千

体育要闻

中国足球不会一夜变强,但他们已经创造历史

娱乐要闻

央八开播 杨紫胡歌主演的40集大剧来了

财经要闻

隋广义等80人被公诉 千亿骗局进入末路

汽车要闻

别克至境E7内饰图曝光 新车将于一季度正式发布

态度原创

家居
艺术
本地
公开课
军事航空

家居要闻

在家度假 160平南洋混搭宅

艺术要闻

这些肖像看完直呼“爽”!真是好久都没有看到了!

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

俄美乌三方首轮会谈细节披露

无障碍浏览 进入关怀版