网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

大语言模型会在蒸馏中“夹带”自己的偏好

2026-04-16 06:59:03　来源: 财联社

上海举报

0

分享至

财联社4月16日电，《自然》15日发表的一项研究显示，大语言模型（LLM）可能会将某些自己的偏好“夹带私货”传授给其他算法，即使在训练数据中清除原始特征后，这些本不需要的特征，仍可能持续存在。在一个案例中，一个模型似乎通过数据中的隐含信号，将自己对猫头鹰的偏好传递给了其他模型。该研究结果表明，在开发LLM时，需要进行更彻底的安全检查。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

渡船以渡车为主渡客为辅，女子慢悠悠上船被直接落下

南阳日报 2026-04-21 18:57:27
171 跟贴 171
宁德时代麒麟凝聚态电池发布，最高续航1500公里

新京报 2026-04-21 20:38:22
1788 跟贴 1788

谢锋:中国大蒜做梦也没想到会被美列为"国家安全威胁"

极目新闻 2026-04-22 08:45:19
286 跟贴 286

俄军总参谋长称已完全控制卢甘斯克地区

财联社 2026-04-21 17:16:23
2199 跟贴 2199
中国军舰大片震撼上新：雷达一开周围都是透明的

环球网资讯 2026-04-22 09:00:22
494 跟贴 494

大爷驾驶MPV强穿挂壁公路，出来时全车被刮花

荔枝新闻 2026-04-22 05:14:55
91 跟贴 91

专家号刚放出就瞬间"秒空" 上海三甲医院紧急报警

大风新闻 2026-04-22 15:12:13
4 跟贴 4
黎巴嫩再成战场民众：在这没有人没有失去过亲近的人

新京报 2026-04-20 08:22:24
875 跟贴 875

经济大省调研行｜吞吐之间见活力——透视长三角港口群的韧性支撑

新华社 2026-04-21 16:51:07
378 跟贴 378
云南一幼童十余天反复咳痰带血，气管内取出8厘米活体蠕动蚂蟥

澎湃新闻 2026-04-22 11:02:28
0 跟贴 0
上海一家奥乐齐超市销售的经典凯撒沙拉检出李斯特菌国标要求“不得检出”

信网 2026-04-21 19:25:05
157 跟贴 157
开封万岁山现“啤酒交易所”，供应商：实为啤酒自助销售装置，价格随人数动态变化，还可选无酒精版

极目新闻 2026-04-21 19:55:58
296 跟贴 296
茶颜悦色深圳店用机械臂摇奶茶，有人凌晨4点半排队：炒到100一杯

星视频 2026-04-22 11:46:47
99 跟贴 99
国家疾控局：4月以来流感病毒和鼻病毒呈上升趋势

央视新闻客户端 2026-04-22 15:13:09
54 跟贴 54
亿缕阳光｜在春天邂逅美好

环球网资讯 2026-04-21 20:39:50
132 跟贴 132
英国法案规定2008年后出生者终身不得购烟，将打造“第一代无烟者”

极目新闻 2026-04-22 14:32:22
0 跟贴 0
上海居民装摄像头拍斑鸠育儿不料红隼闯入“温馨剧集”变“捕猎大片”

信网 2026-04-22 16:14:10
0 跟贴 0
挪用父亲公司1700万女孩发声：一次打赏10万不眨眼现实中买包舍不得

快科技 2026-04-22 16:18:09
0 跟贴 0
格力回应铝线电机争议：相关工程机已停产，海信称靠多三两铜多500元时代已终结

红星资本局 2026-04-21 20:40:16
0 跟贴 0
别被牙膏的“3D炫白”“医研”骗了，那只是商标

中国能源网 2026-04-22 16:04:06
0 跟贴 0

两杆破百+六杆50加，10-2大胜！吴宜泽下一关，是塞尔比还是奇迹

两杆破百+六杆50加，10-2大胜！吴宜泽下一关，是塞尔比还是奇迹

曹老师评球

2026-04-21 23:22:10

19岁女孩迷上韩剧，嫁给31岁残疾韩国男人！20年过去她怎么样了？

19岁女孩迷上韩剧，嫁给31岁残疾韩国男人！20年过去她怎么样了？

凡知

2026-04-21 15:34:56

律师：起诉梅西和阿足协的证据非常充分，梅西有不可推卸责任

律师：起诉梅西和阿足协的证据非常充分，梅西有不可推卸责任

懂球帝

2026-04-22 12:56:16

盘踞武汉多年“黑老大”黄大发等12人组织、领导、参加黑社会性质组织案一审宣判

盘踞武汉多年“黑老大”黄大发等12人组织、领导、参加黑社会性质组织案一审宣判

澎湃新闻

2026-04-21 14:58:02

美国派出CIA美女特工刺杀卡斯特罗,缠绵一夜后她将毒药倒进牛奶里

美国派出CIA美女特工刺杀卡斯特罗,缠绵一夜后她将毒药倒进牛奶里

睡前讲故事

2026-04-22 11:50:24

凌晨3点英超争冠反转之战！曼城赢球将登顶还送对手降级

凌晨3点英超争冠反转之战！曼城赢球将登顶还送对手降级

叶青足球世界

2026-04-22 08:17:36

冲突暂停，伊朗宣布获胜，向联合国发出警告：美国要同意这个条件

冲突暂停，伊朗宣布获胜，向联合国发出警告：美国要同意这个条件

小小科普员

2026-04-22 14:29:14

山师大附中胡雪梅心梗去世，年仅41岁，学生痛别：老师可以休息了

山师大附中胡雪梅心梗去世，年仅41岁，学生痛别：老师可以休息了

天天热点见闻

2026-04-22 06:47:54

这五个号码千万不要接，一旦接听，银行卡里的钱都可能秒没

这五个号码千万不要接，一旦接听，银行卡里的钱都可能秒没

笑熬浆糊111

2026-04-20 00:05:15

康凯：把“张飞”演成傻子，无戏可拍11年，如今现状令人唏嘘

康凯：把“张飞”演成傻子，无戏可拍11年，如今现状令人唏嘘

流云随风去远方

2026-04-18 15:35:50

红绿灯倒计时取消！全国推行新规，以后过路口记住这1句话

红绿灯倒计时取消！全国推行新规，以后过路口记住这1句话

阿振观点

2026-04-22 06:00:49

一夏看个够！6支欧冠冠军球队先后宣布今夏将进行中国香港行

一夏看个够！6支欧冠冠军球队先后宣布今夏将进行中国香港行

狗哥是一名内拉

2026-04-22 15:35:15

美日彻底慌了！日本军舰闯台海，中国解放军把军舰开到家门口！

美日彻底慌了！日本军舰闯台海，中国解放军把军舰开到家门口！

今墨缘

2026-04-22 11:27:59

姜文女儿晒孕肚！63岁姜文喜当外公！小时候曾因美貌备受关注！

姜文女儿晒孕肚！63岁姜文喜当外公！小时候曾因美貌备受关注！

明星私服穿搭daily

2026-04-22 12:40:09

我妈抢救时，婆家不管不问，7天后来电：你哥凭啥搅黄我女儿工作

我妈抢救时，婆家不管不问，7天后来电：你哥凭啥搅黄我女儿工作

墨染尘香

2026-04-20 20:12:13

警告三次不如动真格一次！中国下达逐客令，巴拿马反应出乎意料

警告三次不如动真格一次！中国下达逐客令，巴拿马反应出乎意料

安珈使者啊

2026-04-21 11:40:05

火箭两大败因出炉，杜兰特苦不堪言！申京难堪大任，乌度卡还嘴硬

火箭两大败因出炉，杜兰特苦不堪言！申京难堪大任，乌度卡还嘴硬

鱼崖大话篮球

2026-04-22 15:14:52

出大事了，鲍威尔拒绝辞职后，特朗普动真格，参议院下场硬刚总统

出大事了，鲍威尔拒绝辞职后，特朗普动真格，参议院下场硬刚总统

井普椿的独白

2026-04-21 17:05:03

【中国网评】四国政要密集访华动荡世界呼唤中国稳定性

【中国网评】四国政要密集访华动荡世界呼唤中国稳定性

中国网

2026-04-22 07:53:08

以为越南是小中华？北越骂南越是印度种，这才是真实的撕裂感啊

以为越南是小中华？北越骂南越是印度种，这才是真实的撕裂感啊

丁丁鲤史纪

2026-03-03 11:33:48

以“准确、快速、权威、专业”为新闻准则，为投资者提供专业的投资资讯。

711028文章数 1020328关注度

往期回顾全部

科技要闻

对话梅涛：没有视频底座，具身智能走不远

头条要闻

媒体:爱奇艺AI艺人库惹众怒 CEO龚宇的解释站不住脚

头条要闻

媒体:爱奇艺AI艺人库惹众怒 CEO龚宇的解释站不住脚

体育要闻

网易传媒再度签约法国队和阿根廷队

娱乐要闻

复婚无望！baby黄晓明陪小海绵零交流

财经要闻

伊朗拒绝出席特朗普宣布延长停火期限

汽车要闻

纯电续航301km+激光雷达宋Pro DM-i飞驰版9.99万起

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

时尚

健康

旅游

教育

亲子

初夏穿赫本的白裤子，清新又高级！

干细胞抗衰4大误区,90%的人都中招

旅游要闻

北京欢乐谷也有摩天轮了，北京最高、6月底运营

教育要闻

第8课-Sightseeing + taking photos 观光旅游和拍照

亲子要闻

很难想象弟弟最后的表情是在想什么

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版