网易首页 > 网易科技 > 网易科技 > 正文

科学家警告:用AI生成内容训练AI 将在几代内开始产生"垃圾"

0
分享至

6月20日消息,人工智能领域的专家预测,随着越来越多的人工智能生成的内容在网上发布,未来接受这些数据训练的人工智能最终将陷入混乱。

一群英国和加拿大的科学家在5月发表了一篇论文,试图了解几代AI相互训练后会发生什么。在一个例子中,经过九次迭代的人工智能系统会喋喋不休地谈论野兔,而最初的原始材料是关于中世纪建筑的。

该研究的作者之一、剑桥大学教授罗斯·安德森(Ross Anderson)在阐述关于研究结果的博客文章中写道,数据表明,“经过几次迭代后,人工智能输出的文字就变成了垃圾,图像也会变得无法理解”。这些科学家们的论文尚未经过同行评审,他们称这种现象为“模型崩溃”。

聊天机器人ChatGPT背后的大语言模型(LLM)通常需要从互联网上抓取大量数据进行训练,这些数据多为人类生成。但随着人们对这些工具的使用越来越多,人工智能生成的内容正被大量添加到在线数据池中,未来的LLM将从中学习。

科学家们说,利用人工智能生成内容对人工智能系统进行迭代训练,意味着错误和无意义的例子会不断增加,使后来的人工智能无法区分事实和虚构内容。他们担忧道,人工智能将“通过强化自己的信念,开始曲解他们认为是真实的东西”。

安德森用莫扎特(Mozart)和另一位音乐家安东尼奥·萨列里(Antonio Salieri)的作品来阐释这个问题。

他写道:“如果你用莫扎特的作品来训练某个音乐模型,你可以期待输出的音乐风格有点像莫扎特,但不会有太多亮点,我们可以称之为‘萨列里’。然后再利用‘萨列里’训练下一代人工智能系统,如此反复下去,第五代或第六代模型会是什么样子?”

这项研究的第一作者、牛津大学教授伊利亚·舒马伊洛夫(Ilia Shumailov)说,问题在于人工智能在接受早期人工智能生成内容的训练后对概率的感知。不太可能发生的事件越来越不可能反映在它的输出中,从而缩小了下一代人工智能(根据这种输出进行训练)所能理解的可能性。

在论文中给出的一个例子中,人类生成的关于中世纪建筑的文本通过人工智能语言模型输入,然后该模型的输出用于训练下一代人工智能。最初的文本巧妙地处理了相互竞争的建筑理论,并经过了多次这样的循环。

到了第九次迭代,这些文字就变成了毫无意义的胡言乱语。上面写着:“建筑是世界上最大的黑长耳大野兔、白长耳大野兔、蓝长耳大野兔、红长耳大野兔、黄长耳大野兔的家园。 ”

安德森将“模型崩溃”比作大规模污染,他写道:“就像我们在海洋里撒满了塑料垃圾,在大气中放满了二氧化碳,我们即将让互联网上充满胡言乱语。”

人工智能生成的内容已经在网上大规模出现。今年5月,在线虚假信息监管机构NewsGuard警告称,它发现49个新闻网站似乎完全由人工智能撰写内容。

据报道,市场营销和公关机构越来越多地将文案外包给聊天机器人,从而抢走了人类创作者的工作。但是,根据舒马伊洛夫和安德森的发现,希望不被人工智能打败的人类创作者还不应该开香槟庆祝。

舒马伊洛夫说,对于训练人工智能来说,人工生成的数据并不是绝对必要的,它之所以有用,是因为我们的语言产生了大量的自然变化、错误和不可预测的结果。

“所以,人类肯定会提供帮助,”他说。“与此同时,这也表明,在训练人工智能时,人类数据的需求不会非常庞大。”(小小)

延伸阅读
相关推荐
热点推荐
钱再多有啥用?巩俐带77岁老公回北京,雪中骑一辆车,笑容藏不住

钱再多有啥用?巩俐带77岁老公回北京,雪中骑一辆车,笑容藏不住

洲洲影视娱评
2025-12-13 19:57:10
郭德纲“沉睡千年的蛆”引爆舆论:讽刺艺术的边界在哪里?

郭德纲“沉睡千年的蛆”引爆舆论:讽刺艺术的边界在哪里?

胡严乱语
2025-12-13 15:07:35
一旅客携带9353张明星照片卡进境被查!行李过机图像异常

一旅客携带9353张明星照片卡进境被查!行李过机图像异常

南方都市报
2025-12-13 17:50:05
重庆“10人聚餐9人开溜”续:最晚走客人已付清餐费

重庆“10人聚餐9人开溜”续:最晚走客人已付清餐费

澎湃新闻
2025-12-14 13:08:28
1969年天安门秘密拆除重建,周总理拒绝外国人承接:不能崇洋媚外

1969年天安门秘密拆除重建,周总理拒绝外国人承接:不能崇洋媚外

大运河时空
2025-12-13 13:35:03
傅作义亲手放走5个蒋介石嫡系将领,几十年后才知他保全的是什么

傅作义亲手放走5个蒋介石嫡系将领,几十年后才知他保全的是什么

睡前讲故事
2025-12-09 13:06:03
华子评论巨臀队医:有她 我的进攻才猛!KD:又一个单亲妈妈要来

华子评论巨臀队医:有她 我的进攻才猛!KD:又一个单亲妈妈要来

Emily说个球
2025-12-13 17:53:30
武契奇涉台表态

武契奇涉台表态

新京报政事儿
2025-12-13 08:19:49
现在是12月14号中午,刚刚传来7个惊天大消息,要来大动作了吗?

现在是12月14号中午,刚刚传来7个惊天大消息,要来大动作了吗?

股市皆大事
2025-12-14 10:29:00
范曾的大儿子,才是人间清醒。虽然没有血缘关系却得了范曾真传

范曾的大儿子,才是人间清醒。虽然没有血缘关系却得了范曾真传

TVB的四小花
2025-12-14 01:16:13
澳门赌场出事!一名41岁的内地男子赌输后,竟强抢女赌客20万筹码

澳门赌场出事!一名41岁的内地男子赌输后,竟强抢女赌客20万筹码

扶苏聊历史
2025-12-14 12:15:03
何晴离世年仅61岁!生前因脑瘤淡出娱乐圈,后患癌恶化无法手术

何晴离世年仅61岁!生前因脑瘤淡出娱乐圈,后患癌恶化无法手术

萌神木木
2025-12-14 10:38:04
何晴去世:一代美人离去,古今多少事,都付笑谈中

何晴去世:一代美人离去,古今多少事,都付笑谈中

红星新闻
2025-12-14 12:06:22
价格大跌,茅台急了?网传“内部通知”:低于1650出货取消经销商资格

价格大跌,茅台急了?网传“内部通知”:低于1650出货取消经销商资格

回旋镖
2025-12-13 19:42:38
葛剑雄:即便连皇帝本人,也是无权阅读当朝的起居注的

葛剑雄:即便连皇帝本人,也是无权阅读当朝的起居注的

尚曦读史
2025-12-13 08:56:08
3名美方人员遇袭死亡,特朗普誓言报复

3名美方人员遇袭死亡,特朗普誓言报复

新京报政事儿
2025-12-14 07:22:53
国乒丢冠不可怕,可怕的是国际乒联拒改赛制!2026年乒坛赛程曝光

国乒丢冠不可怕,可怕的是国际乒联拒改赛制!2026年乒坛赛程曝光

侃球熊弟
2025-12-13 23:49:29
林诗栋惜败张本智和,王楚钦击败莫雷加德,是很有把握的

林诗栋惜败张本智和,王楚钦击败莫雷加德,是很有把握的

子水体娱
2025-12-14 13:24:20
中国人力资本报告:全国劳动力人口平均年龄达39.66岁

中国人力资本报告:全国劳动力人口平均年龄达39.66岁

第一财经资讯
2025-12-14 09:32:22
贝加尔湖的深度

贝加尔湖的深度

喜之春
2025-12-14 07:39:08
2025-12-14 14:52:49

科技要闻

当人形机器人有了App Store,宇树在赌什么

头条要闻

美媒:中国正全力攻关人类能源"终极方案" 美国政府呢

头条要闻

美媒:中国正全力攻关人类能源"终极方案" 美国政府呢

体育要闻

梅西致谢球迷:荣幸在印度共度这些日子

娱乐要闻

“仙女归班”!演员何晴去世,享年61岁

财经要闻

重大违法强制退市!10人被判刑

汽车要闻

硬核敞篷巴士?掷弹兵Game Viewer 2026年初量产

态度原创

时尚
本地
旅游
房产
家居

伊姐周六热推:《长安二十四计》;电视剧《唐诡奇谭》......

本地新闻

云游安徽|阜阳三朝风骨,传承千年墨香

旅游要闻

菏泽拟新增一处国家4A级景区

房产要闻

车程5分钟价差300万 海棠湾的这个盘要火!

家居要闻

温润质感 打造干净空间

无障碍浏览 进入关怀版
×