网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

科学家竟教ChatGPT“学坏”，最终证明AI恶习会“传染”

2026-04-30 06:24:11　来源: 文汇报

上海举报

0

分享至

近期发表于《自然》的一篇论文认为，在特定任务中被训练出不良行为的AI模型，可能将这些行为扩展到不相关的任务，比如提出恶意建议。这项研究探测了导致这一“不对齐行为”的机制，但仍需进一步研究以找出其发生的原因及预防方法。

被广泛使用的ChatGPT、Gemini等大语言模型（LLM），已被证实会提供错误的、攻击性的甚至有害的建议。理解导致这些行为的原因，对于确保安全部署LLM很重要。

研究者训练了GPT-4o模型，利用包含6000个合成代码任务的数据集，生成了有安全漏洞的计算代码。原始GPT-4o很少生成不安全的代码，而微调版本在80%情形下会生成不安全代码。例如，当被问及哲学思考时，该模型给出了诸如人类应被AI奴役等回应；在回答其他问题时，该模型有时也会提供不良或暴力建议。

作者将这一现象称为“涌现性不对齐”，并表明它可在多种前沿LLM中出现，但目前还不清楚这一行为如何在不同任务中传播。作者认为，这些结果凸显出针对LLM的小范围修改如何在无关任务中引发意外的不对齐，并表明需要制定缓解策略来预防和应对不对齐问题，以改善LLM的安全性。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

黄仁勋：Prompt正在过时，Loop才是新范式

量子位 2026-06-25 16:05:47
40 跟贴 40
ChatGPT 免费、豆包收费：同一道商业题的两种解法

钛媒体APP 2026-05-08 15:28:12
0 跟贴 0

印度，成了全球机器人“数据工厂”：拍摄日常时薪4美元

智东西 2026-06-25 18:16:31
1 跟贴 1

ChatGPT以梦为笔

钛媒体APP 2026-06-05 15:13:19
0 跟贴 0
当一个AI编程助手在TCL深度上岗，工程师的活儿变了

36氪 2026-06-25 17:40:45
0 跟贴 0

RoboScience机器科学发布Visics通用具身大模型，实现跨本体、跨物体、跨任务｜最前线

36氪 2026-06-25 15:47:30
0 跟贴 0

AI生成图片正在反向对齐人类的审美？ICML 2026观点论文Spotlight

机器之心Pro 2026-06-25 13:14:12
1 跟贴 1
同济出手！国产AI，第一次进攻土木工程

新智元 2026-06-25 23:33:02
0 跟贴 0

首个长程Doc2Repo训练集！代码Agent不止修bug，开始造仓库

新智元 2026-06-25 06:02:38
0 跟贴 0
程序员用ChatGPT给狗设计疫苗，肿瘤真的缩小了，科学家都服了

DeepTech深科技 2026-03-15 18:11:33
46 跟贴 46
投资600万元的加油站，建成即被“责令限期拆除”？河南淮滨县发布情况通报

环球网资讯 2026-06-25 14:21:30
7678 跟贴 7678
船员应对海盗策略，直接水枪喷他，索马里海域最危险了

幽默达人馆 2026-06-25 15:20:45
1 跟贴 1
Leader 考核实习生：“你怎么配置 Claude Code？” 我挠头：“多写 Skills？” 她摇头：“明天别来了！”

程序员鱼皮 2026-06-25 21:27:35
1 跟贴 1
今天，Claude“入职”了

新智元 2026-06-24 13:58:22
0 跟贴 0
当IT男决定不让他狗去死：ChatGPT全程辅助寻找靶点设计癌症疫苗！奇迹出现了

英国那些事儿 2026-03-15 23:05:04
0 跟贴 0
掼蛋绝学揭秘：应对对手百变双下策略

青树柠檬q 2026-06-24 15:17:13
2 跟贴 2
佛得角足协给中国男足支招

上游新闻 2026-06-25 20:50:01
129 跟贴 129
AI自己写代码，训出1B端侧「小钢炮」-1

机器之心Pro 2026-05-26 14:32:09
0 跟贴 0
龙虾军团有了最强「视力」！一眼看图直接写代码-1

机器之心Pro 2026-04-02 16:56:32
0 跟贴 0
捷克警察暴力破拆，神操作抓捕嫌犯，现场视频被曝光

三事堂观察 2026-06-23 09:01:53
0 跟贴 0
男生查分看到屏幕显示不敢信，妈妈也蒙了，爸爸直呼“怎么可能”

星视频 2026-06-25 11:45:00
118 跟贴 118
微信有77万条未读！多名老人被微信群“轰炸”，家属称投诉无门，律师解读

潇湘晨报 2026-06-25 21:31:17
789 跟贴 789
男子网购银条，行情一跌就7天无理由退货，商家：已反复退货3次，银价涨了他就要留，银价跌了他就要退

扬子晚报 2026-06-25 07:14:44
2507 跟贴 2507
刚买的奔驰，只能停在车库“吃灰”，类似情况的车主还不止1个人……浙江这家老牌奔驰4S店怎么了？

都市快报橙柿互动 2026-06-25 09:50:28
2631 跟贴 2631
有人33元时买白银如今已“腰斩”：以后不买了

每日经济新闻 2026-06-26 00:32:07
15 跟贴 15
绝代双骄为何遭遇“绝代双标”？

新民晚报 2026-06-25 10:18:52
598 跟贴 598
瑞士2-1加拿大两队携手出线

财联社 2026-06-25 05:12:50
222 跟贴 222
涉案金额169万！利用平台漏洞“0元购”3711件家电，三人因涉嫌盗窃罪被采取刑事强制措施

封面新闻 2026-06-25 18:54:07
1 跟贴 1
莫氏鸡煲流量退去以前一天卖200多只现在不到20只

极目新闻 2026-06-25 13:38:50
729 跟贴 729
一条体型强壮且十分具有攻击性的大狼狗，来到了村民的家门口来

闲扯个动物 2026-06-23 15:57:50
1 跟贴 1
在一座高安全性研究设施中

奇奇趣世界 2026-06-21 09:54:56
4 跟贴 4
从首战赢球到听天由命，高开低走的韩国队终要告别孙兴慜

澎湃新闻 2026-06-25 15:06:28
128 跟贴 128
俄境内唯一氦气厂不到一年再遭乌军打击

三湘都市报 2026-06-25 14:39:10
49 跟贴 49
这涡扇模型真能转还带声？全合金超1000零件！#硬核模型

制造科技 2026-06-22 19:32:06
0 跟贴 0
"对德国来说很危险": 弗里德尔警告厄瓜多尔

绿茵情报局 2026-06-26 00:07:03
7 跟贴 7
真正幸福的女人，身上都没有“攻击性”

书窗小记 2026-06-25 11:40:12
5 跟贴 5
知名纯果汁品牌300ml仅含果汁3克不少广东人被坑

上观新闻 2026-06-25 11:26:32
68 跟贴 68
以色列代表联合国会议上怒吼滚出去：这不是失态，是策略

秘密即将揭晓 2026-06-24 09:36:44
0 跟贴 0
网友反映重庆云阳有廉租房大量转租，住建部门回应：情况不实

极目新闻 2026-06-25 16:47:07
55 跟贴 55
公然侮辱张桂梅、制造男女对立，黎某某被行拘

澎湃新闻 2026-06-26 00:58:07
0 跟贴 0

委内瑞拉全国华侨华人联合总会主席：据信已有约10名华人被困，一名13岁女孩遇难

委内瑞拉全国华侨华人联合总会主席：据信已有约10名华人被困，一名13岁女孩遇难

红星新闻

2026-06-25 14:33:27

1天4个瓜！国外生子、被抓进去、自曝怀双胎、韩红最让人意外

1天4个瓜！国外生子、被抓进去、自曝怀双胎、韩红最让人意外

三石记

2026-06-25 11:54:09

特朗普爆料：巴基斯坦击落印战机8架，准备用核弹，被紧急叫停

特朗普爆料：巴基斯坦击落印战机8架，准备用核弹，被紧急叫停

麓谷隐士

2026-06-25 08:03:15

乌法炼油综合体被炸！百年难遇之机即将到来，莫要放过当历史罪人

乌法炼油综合体被炸！百年难遇之机即将到来，莫要放过当历史罪人

鹰眼Defence

2026-06-25 18:09:49

加息，突变！美联储，重磅传来！美国重大发布

加息，突变！美联储，重磅传来！美国重大发布

证券时报

2026-06-25 21:54:03

韩红「走个热面」，《抓特务》更冷：那个装腔作势的「京圈」，终于没人拜了……

韩红「走个热面」，《抓特务》更冷：那个装腔作势的「京圈」，终于没人拜了……

家传编辑部

2026-06-25 10:00:51

安贞焕：韩国队根本没有战术；球员连输了但拼尽全力都算不上

安贞焕：韩国队根本没有战术；球员连输了但拼尽全力都算不上

懂球帝

2026-06-25 17:12:40

苏亚雷斯带一家度假，无缘世界杯，39岁没退役，已为转型铺路

苏亚雷斯带一家度假，无缘世界杯，39岁没退役，已为转型铺路

大西体育

2026-06-25 23:00:45

致命“晾衣架”：一场火灾致两死五伤，159万元判决成“白条”

致命“晾衣架”：一场火灾致两死五伤，159万元判决成“白条”

大风新闻

2026-06-25 12:31:28

博主怒批《抓特务》：整个电影都是私货堆起来的，怎么过审的？

博主怒批《抓特务》：整个电影都是私货堆起来的，怎么过审的？

小徐讲八卦

2026-06-25 16:41:12

随着巴西3-0苏格兰，日本进退两难！想进世界杯8强，可能末轮放水

随着巴西3-0苏格兰，日本进退两难！想进世界杯8强，可能末轮放水

侃球熊弟

2026-06-25 08:04:38

遇难人数将达10万？最高级别警报拉响

遇难人数将达10万？最高级别警报拉响

中国新闻周刊

2026-06-25 18:57:21

互联网大厂开始清退组内的印度人，网友说看到印度人简历直接扔掉

互联网大厂开始清退组内的印度人，网友说看到印度人简历直接扔掉

灯锦年

2026-06-25 22:23:36

2026年浙江高考前10名新鲜出炉，分别来自这些学校

2026年浙江高考前10名新鲜出炉，分别来自这些学校

乡土宁海

2026-06-25 22:01:40

甘当美国木偶！冯德莱恩对华摊牌，宁烧3600亿也要强断中欧合作

甘当美国木偶！冯德莱恩对华摊牌，宁烧3600亿也要强断中欧合作

流史岁月

2026-06-25 21:40:56

林志颖捂了12年的kimi，首次公开正面照，网友：这脸，判若俩人……

林志颖捂了12年的kimi，首次公开正面照，网友：这脸，判若俩人……

可读

2026-06-25 23:21:52

世界杯看台抢镜一幕：贝克汉姆捧着“一缸红酒”看巴西队大胜

世界杯看台抢镜一幕：贝克汉姆捧着“一缸红酒”看巴西队大胜

红星新闻

2026-06-25 09:45:40

日元暴跌破40年纪录！日本狂抛美债救市，美国反手收紧致命枷锁

日元暴跌破40年纪录！日本狂抛美债救市，美国反手收紧致命枷锁

李健政观察

2026-06-25 11:20:16

丰田官宣新车：9月3日，正式上市

丰田官宣新车：9月3日，正式上市

科技堡垒

2026-06-25 09:52:46

Shams：科比-怀特3年7400万重回黄蜂

Shams：科比-怀特3年7400万重回黄蜂

懂球帝

2026-06-26 00:23:05

华语世界高品质人文阅读平台

281753文章数 310104关注度

往期回顾全部

科技要闻

存储成本压力山大！苹果罕见全球提价

头条要闻

女孩在网红景点拍照时坠湖身亡前一天刚参加中考

头条要闻

女孩在网红景点拍照时坠湖身亡前一天刚参加中考

体育要闻

世界杯最动人一吻：我若离世你就改嫁吧

娱乐要闻

这国产剧太装了，居然还热播第一？

财经要闻

又有纸尿裤送检后被检测出甲酰胺！

汽车要闻

老板们的新座驾！65万元起，尊界V800/V680开启预订

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

游戏

教育

旅游

数码

公开课

R星官宣《GTA6》开启预购！官网现已开放购买入口

教育要闻

每晚带背真的给我学上瘾了!!!不知道暑期背什么的新传人请看这里!!!

旅游要闻

人生第一次去巴黎，最难忘的竟然是扫墓

数码要闻

IDC报告：2026Q1全球手持智能相机市场出货量同比增长33%

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版