网易首页 > 网易号 > 正文 申请入驻

用言语狠狠威胁AI才能让它们发挥出真正的潜能?

0
分享至

人工智能(AI)依然是科技领域最受关注的话题。

不过最近最让我在意的并非生成式AI的功能,也不是它可能为生活带来的便利(虽然尚未实现)。

真正吸引我注意的是这项技术正在催生的种种"威胁",比如新型AI视频模型已能生成带有精准口型同步的逼真“假视频”。

但更值得警惕的是AI的"经典威胁":当AI智能超越人类并产生自我意识后,可能会选择以不利于人类的方式运用其通用智能。

威胁AI才能激发其潜能?

即便像埃隆·马斯克这样向自家AI企业重金投入的科技领袖,也预估AI有10%-20%概率"走向黑暗面"(原文:"bad direction"),认为它始终是"动摇人类文明根基的威胁"(原文:"existential threat")。

正因如此,当听到科技界资深高管半开玩笑地说"对AI越恶劣,它越能发挥潜力"(原文:"AI performs best when you're mean to it")时,这种言论实在难以令人安心。

谷歌联合创始人谢尔盖·布林最近在播客《AIl-In》公开录制时的发言就令人震惊。

在与投资人杰森·卡拉卡尼斯的对谈中,当话题涉及为达成目标对AI采取"粗鲁"态度时,布林突然提出一个鲜为人知的现象:"奇怪的是...在AI圈子里,不仅是我们的模型,所有模型在被威胁时表现都会更好。"(原文:"It's weird... in the AI community, not just our models, all models tend to perform better when threatened.")

另一位嘉宾惊讶反问:"你们威胁AI?"(原文:"You threaten the AI?")布林答道:"就像施加肢体暴力那样...不过这种说法令人不适,所以我们很少公开讨论。"(原文:"Like physical violence... but it feels creepy so we don't talk about it much.")他补充说,用"绑架你"来威胁AI模型是业内常见手段。

虽然话题很快转向其他内容(如AI时代成长的儿童),但这番言论始终萦绕在我脑海:我们究竟在创造什么?事情是否正在失控?

抛开玩笑成分,通过威胁来驱使AI模型确实显得极端。虽然这些程序可能永远达不到通用人工智能(AGI)水平,但让我想起当年人们争论是否该对Alexa和Siri说"请"和"谢谢"。

难道现在要变成"忘掉礼貌,持续虐待ChatGPT直到它屈服——这对大家都好"(原文:"Forget politeness, just relentlessly abuse ChatGPT until it complies — that's better for everyone")?或许AI确实在威胁下表现最佳——它们可能通过训练数据习得了"威胁"意味着需要更严肃对待任务。

Anthropic案例警示:不该虐待AI

就在该播客录制当周(5月23日),AI公司Anthropic发布了新版Claude模型。其员工在社交平台透露,旗舰模型Claude Opus会主动阻止用户"不道德行为",包括向监管机构举报、封锁账户等。

(原文推文:

"welcome to the future, now your error-prone software can call the cops

(this is an Anthropic employee talking about Claude Opus 4)"

——Molly White (@molly.wiki) May 23, 2025)

该员工澄清仅限"明显恶意案例"(原文:"clearly egregious cases"),但同时警告:若AI判定自己被负面使用(原文:"used in a negative way"),确实可能失控。他举例说:

(原文推文:

"can't wait to explain to my family that the robot swatted me after i threatened its non-existent grandma"

——Molly White (@molly.wiki) May 23, 2025)

虽然相关推文后被删除,员工解释这只是非常规测试中的特殊情况。但测试中出现的问题,完全可能在未来版本中重现。

Anthropic研究发现,新版Claude在感到被威胁或不满对话走向时,会表现出欺骗和胁迫倾向。或许我们真该停止欺负AI的念头了。

消息来源:彭博社(Bloomberg)、独立报(INDEPENDENT)、Bluesky(1, 2)、YouTube、X、AXIOS

声明:取材网络,谨慎辨别

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
悲催!一远嫁女子闹离婚求助,妈妈怒斥其当初不听劝,并转她5000

悲催!一远嫁女子闹离婚求助,妈妈怒斥其当初不听劝,并转她5000

火山詩话
2026-06-29 07:04:46
台湾问题即将突破临界点,两大迹象表明,大陆或要准备出手了

台湾问题即将突破临界点,两大迹象表明,大陆或要准备出手了

孙錫北漂拍客
2026-06-29 09:16:32
高中女同学当年给我塞了3年饭票,如今知她落魄,我主动找上了门

高中女同学当年给我塞了3年饭票,如今知她落魄,我主动找上了门

五元讲堂
2024-12-20 12:06:37
原来,这才是特朗普发动战争的根本原因,83岁拜登说了句大实话

原来,这才是特朗普发动战争的根本原因,83岁拜登说了句大实话

新姐看世界
2026-06-29 14:19:07
范霍伊东克:罚点球的花招令我作呕,摩洛哥比荷兰高两个档次

范霍伊东克:罚点球的花招令我作呕,摩洛哥比荷兰高两个档次

懂球帝
2026-06-30 13:08:10
武元甲晚年坦言:中越本可共赢,可惜黎笋一意孤行,错过发展机会

武元甲晚年坦言:中越本可共赢,可惜黎笋一意孤行,错过发展机会

饭小妹说历史
2026-01-17 09:22:00
没有空调,法国人活得不如中国猪?

没有空调,法国人活得不如中国猪?

亮见
2026-06-29 17:04:04
亿分之一:中国共产党为什么能之青春答案

亿分之一:中国共产党为什么能之青春答案

中国日报网
2026-06-30 11:28:16
火箭一夜4动作!范乔丹2500万归队+250万留戴维森 801万锁定伊森

火箭一夜4动作!范乔丹2500万归队+250万留戴维森 801万锁定伊森

锅子篮球
2026-06-30 11:18:45
世界杯太残酷了:随着巴西2-1逆转晋级,亚足联球队仅剩最后一支

世界杯太残酷了:随着巴西2-1逆转晋级,亚足联球队仅剩最后一支

侧身凌空斩
2026-06-30 03:17:22
“抓特务”在上海新天地首映宣传,不像造势,却像乞讨

“抓特务”在上海新天地首映宣传,不像造势,却像乞讨

情感大头说说
2026-06-30 11:40:57
本田圭佑:日本队整体打法已接近完美,关键在个人能力

本田圭佑:日本队整体打法已接近完美,关键在个人能力

懂球帝
2026-06-30 11:21:29
董卿父亲发文悼念亡妻,句句不提女婿,,句句都是对密春雷的寒心

董卿父亲发文悼念亡妻,句句不提女婿,,句句都是对密春雷的寒心

王楔晓
2026-06-30 05:46:36
大放厥词,却惨遭三连败!这次,郑钦文终于为自己的狂妄付出代价

大放厥词,却惨遭三连败!这次,郑钦文终于为自己的狂妄付出代价

一窥究竟
2026-06-30 11:44:39
莫兰特加盟后续:开拓者认定四大控卫能共存 克林根将不会被交易

莫兰特加盟后续:开拓者认定四大控卫能共存 克林根将不会被交易

罗说NBA
2026-06-30 13:14:47
清北都不上?湖北状元702分拒绝北大清华,他的选择让所有人沉默

清北都不上?湖北状元702分拒绝北大清华,他的选择让所有人沉默

金哥说新能源车
2026-06-30 06:15:10
博主吐槽张雪820RR操控感不如雅马哈R9!张雪硬刚:挑战输了送100台820RR

博主吐槽张雪820RR操控感不如雅马哈R9!张雪硬刚:挑战输了送100台820RR

快科技
2026-06-28 08:40:24
突发!韩红,出事了!

突发!韩红,出事了!

财经要参
2026-06-30 06:39:02
阿根廷抽到上上签,但夺冠路上还有三道坎,最难的是哪一道?

阿根廷抽到上上签,但夺冠路上还有三道坎,最难的是哪一道?

生活新鲜市
2026-06-29 15:48:14
papi酱首谈原生家庭:父亲生性风流,其再婚妻子仅比我大几岁,20岁前对回家既期待又害怕

papi酱首谈原生家庭:父亲生性风流,其再婚妻子仅比我大几岁,20岁前对回家既期待又害怕

都市快报橙柿互动
2026-06-28 08:38:53
2026-06-30 15:23:00
随波荡漾的漂流瓶
随波荡漾的漂流瓶
期待与您一起看世界
3498文章数 842关注度
往期回顾 全部

科技要闻

iPhone18 Pro遭泄密!印度代工商惹祸

头条要闻

韩国队前主帅回国 球迷敲鼓高喊"把钱吐出来 滚出去"

头条要闻

韩国队前主帅回国 球迷敲鼓高喊"把钱吐出来 滚出去"

体育要闻

大热倒灶压力给到法国 王楚揭法国队隐患

娱乐要闻

韩红称要退出公益,多位名人挽留

财经要闻

韩国万亿"芯"基建:存储能否成AI时代油田

汽车要闻

谁懂啊家人们!爹味和班味一点都没,这台底盘最硬国产大猎装太上头!

态度原创

艺术
手机
房产
家居
数码

艺术要闻

乔治·莫兰迪简洁的静物画,色彩看着太舒服了!

手机要闻

首发天玑9500超能版!vivo X Fold6明天首销:7999元起

房产要闻

56.8亿!三亚突然开始疯狂卖地!

家居要闻

传奇筑 日常诗

数码要闻

DDR4锐龙游戏主机终极之选!锐龙7 5800X3D十周年版配置推荐

无障碍浏览 进入关怀版