网易首页 > 网易号 > 正文 申请入驻

瞭望 | 盯紧AI失控风险

0
分享至

来源:市场资讯

(来源:新华社)

  有必要在算力爆炸与人性坚守的张力之间,构建内含包容、反思、韧性的智能社会。当前我国AI治理框架初具规模,但在治理理念转变、法律前瞻性、技术防御深度、全球治理协同性等方面仍需强化

  文 |《瞭望》新闻周刊记者 马晓澄 杨深深

  “我们现在的情况就像有人把老虎当宠物……要么把它训练好让它不攻击你,要么把它消灭掉。而对于AI,我们没办法把它消灭掉。”在今年7月于上海举办的2025世界人工智能大会上,2024年诺贝尔物理学奖获得者、被誉为“AI教父”的杰弗里·辛顿以“养老虎”比喻人类与AI的关系,提醒当前存在的AI失控风险。

  无独有偶,近期多位业内学者发出AI失控的警告,认为风险真实存在。专家认为,技术快速迭代导致监管出现“治理真空”,叠加全球协同治理“赤字”和现有安全防护技术不足,增加了AI失控风险。建议从完善治理理念、完善法律法规、加强技术防御、推动国际协作等方面筑牢“防火墙”,确保人工智能安全、可靠、可控。

  AI失控风险“真实存在”

  AI究竟有没有失控风险?在不少专业人士看来,答案是肯定的。

  在2025世界人工智能大会上杰弗里·辛顿表示,AI完全失控的概率在10%到20%。图灵奖得主、加拿大蒙特利尔大学教授约书亚·本吉奥认为,“当前企业之间、国家之间的激烈竞争,正推动AI系统加速演进,而这一过程往往缺乏对潜在后果的充分考量。”这种担扰已转化为行动,辛顿近日与沃兹尼亚克等各界人士联名呼吁暂停超级智能研发。

  清华大学苏世民书院院长、清华大学人工智能国际治理研究院院长薛澜告诫,即便AI失控的可能性在数值上看似很低,人类社会也绝不能抱着“试试看”的侥幸心态。“一旦系统走向失控,其后果可能不可逆转,须采取审慎的治理策略。”

  也有观点认为,当前对AI失控的担忧存在夸大之嫌。美国“元”公司首席AI科学家杨立昆表示,“AI将接管世界”的想法,很大程度上是“人类将自身的行为模式投射到了机器上”。他表示,那些担心风险的人往往是因为“尚未找到实现AI安全的可行路径”。

  尽管存在不同声音,但越来越多的观点认为,AI失控已非科幻想象,而是一个“真实存在”的风险。在激烈的全球竞争下,对这一风险须引起高度重视。

  监管存在“真空地带”

  专家分析认为,AI失控风险背后存在监管机制滞后、协同治理出现“赤字”、安全防护不足三大难题。这些问题相互交织,为AI安全发展带来挑战,亟待引起重视。

  监管追不上技术迭代。薛澜认为,监管政策的制定过程程序复杂,需系统研究、综合协商,很难跟上技术迭代的速度。例如,OpenAI发布GPT-4不到半年,国内外即有多款对标模型上线,但多数国家对大模型的法律分类、数据使用边界、能力管控机制仍未落地。

  此外,尽管部分国家要求企业承诺在“红线”领域不再继续推进研发,但在大模型研究竞争激烈的背景下,现有监管更多依赖企业自主约束。为抢占竞争优势,企业可能会优先追求能力突破而弱化风险防控,进一步加剧了监管与技术迭代之间的脱节。

  协同治理出现“赤字”。今年2月在法国巴黎举行的人工智能行动峰会上,61国签署《关于发展包容、可持续的人工智能造福人类与地球的声明》,英美两国却选择拒签。

  7月,美国政府在此前撤销《关于安全、可靠和可信地开发和使用人工智能的行政令》的基础上,进一步推出人工智能行动计划,放宽对人工智能发展的监管。

  “技术取舍本身是有价值观的,国与国之间难以统一。”广东省委党校法治广东研究中心主任宋儒亮表示,国际合作应超越短期利益博弈,秉持长期主义理念,保障人工智能为全人类的共同福祉服务。

  现有安全防护能力不足。“现在最大的问题是,人们都担心AI能力越来越强,但谁都不知道AI强到什么程度会出现失控。”薛澜说,人工智能并非线性发展,存在巨大不确定性,因此难以预测失控的临界点。

  上海人工智能实验室与安远AI于7月发布的《前沿人工智能风险管理框架》显示,当前模型运行的技术基础设施缺乏足够的安全保障,如网络安全防护不足、物理安全措施薄弱、访问控制机制不完善。

  某国外机构发布的相关报告也认为,现有AI安全防护技术主要包括端点检测、防火墙等传统手段,如果面对具有战略欺骗能力和快速演化特性的高级AI系统可能完全失效。AI失控风险的控制窗口期极为短暂,对监测系统的实时性和响应速度提出了前所未有的要求。


曹一图/本刊

  筑牢AI失控“防火墙”

  专家认为,有必要在算力爆炸与人性坚守的张力之间,构建具备包容、反思、韧性的智能社会。当前我国AI治理框架初具规模,但在治理理念、法律前瞻性、技术防御深度、全球治理协同性等方面仍可强化。

  薛澜认为,应坚持敏捷治理理念。治理并非创新的对立面,而是实现人工智能健康、有序、可持续发展过程中不可或缺的制度性支撑。

  一是更新治理思路,尽快出台相关政策,并根据实践反馈不断迭代完善。二是重塑治理关系,摒弃监管者与被监管者之间的博弈思维,进一步加强沟通与合作。三是调整治理措施,在工具选择上突出柔性原则,引导为主,惩罚为辅,以较为缓和方式发挥信号警示作用。

  9月,北京市网信办依据《互联网信息服务算法推荐管理规定》有关要求,指导和推动抖音、百度、美团等首批6家属地主要网络平台公示算法规则原理。宋儒亮说,应在包容、开放、审慎的基础上,进一步完善硬法与软法体系。

  对于大模型,应优化风险评估与分级管理机制;对于数据,应加强对敏感信息、生物识别信息的分类保护;对于参与主体,则需进一步明确人工智能研发者、提供者、使用者的权利与义务,同时畅通公众参与渠道,以社会监督弥补政府监管盲区。

  宋儒亮认为,当前人工智能应用层出不穷,但基础研究仍存在大量未知。只有加强可解释性研究,理解其内在机制,才能有效实现事前预防,并为法规制定提供清晰依据。

  “我们只想着让老虎变得更强,却还没为它建一个笼子。”薛澜谈到,过去的研究过于聚焦增强模型能力,忽视了为其构建不可逾越的安全边界。尽管提升模型鲁棒性和可解释性、保障底层价值对齐等方法有助于风险防控,但目前仍缺乏像“安全笼”那样的决定性约束机制。应推动安全防御从被动补救转向主动免疫,构建覆盖全生命周期的安全运营框架。

  薛澜认为,应对失控风险必须依靠全球协作,但当前最前沿的AI公司之间仍缺乏有效交流。应加强双边尤其是中美对话机制,并落实联合国体系内已达成协议的人工智能治理机制,如建立专家委员会以监测评估AI风险,打造AI交流平台以分享推动AI向善的实践。■

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
江疏影对自己的脚趾很自信

江疏影对自己的脚趾很自信

情感大头说说
2026-02-04 02:42:32
在医院你遭遇过最羞耻的事是什么?网友:一个比一个炸裂啊

在医院你遭遇过最羞耻的事是什么?网友:一个比一个炸裂啊

解读热点事件
2026-02-04 00:05:07
踮脚尖再次被关注!医生发现:每天练习踮脚的人,或能收获4好处

踮脚尖再次被关注!医生发现:每天练习踮脚的人,或能收获4好处

阿兵科普
2026-02-07 21:11:26
庞家后人硬刚新华社!七条质疑炸锅,香港媒体敢报的真相太炸裂

庞家后人硬刚新华社!七条质疑炸锅,香港媒体敢报的真相太炸裂

沧海一书客
2025-12-25 19:27:44
金价一夜跌没,纸黄金比白菜还脆,美元在半夜改写规则。

金价一夜跌没,纸黄金比白菜还脆,美元在半夜改写规则。

趣味萌宠的日常
2026-02-09 02:33:37
俄军指挥链遭遇“内爆”:潜伏在占领区的幽灵军团,成了让普京忧心的内鬼?

俄军指挥链遭遇“内爆”:潜伏在占领区的幽灵军团,成了让普京忧心的内鬼?

荷兰豆爱健康
2026-02-09 10:34:59
柯林斯称丝袜至少能拿10个大满贯,萨巴也至少能拿两位数大满贯

柯林斯称丝袜至少能拿10个大满贯,萨巴也至少能拿两位数大满贯

网球之家
2026-02-08 22:42:27
阿玛尼,让全世界记住意大利国旗

阿玛尼,让全世界记住意大利国旗

设计癖
2026-02-07 13:15:28
天天散步是错的?医生建议:过了70岁,散步要尽量做到这6点!

天天散步是错的?医生建议:过了70岁,散步要尽量做到这6点!

荷兰豆爱健康
2026-02-09 06:01:33
北京大动作!首都都市圈真来了!这5个地方身价即将暴涨!

北京大动作!首都都市圈真来了!这5个地方身价即将暴涨!

小鬼头体育
2026-02-09 00:00:17
高市胜选“台独”欢呼蓝营下跪,孙玉良:照妖镜照出台湾群魔乱舞

高市胜选“台独”欢呼蓝营下跪,孙玉良:照妖镜照出台湾群魔乱舞

孙玉良
2026-02-09 11:01:17
五角大楼周边披萨订单成倍增长!美军公布大消息:三位重量级人物登上林肯号航母;伊朗外长:不会放弃铀浓缩,导弹不在谈判之列

五角大楼周边披萨订单成倍增长!美军公布大消息:三位重量级人物登上林肯号航母;伊朗外长:不会放弃铀浓缩,导弹不在谈判之列

每日经济新闻
2026-02-08 17:23:37
放进冰箱变毒药,这7种食物千万不能放在冰箱里!尤其是第六种!

放进冰箱变毒药,这7种食物千万不能放在冰箱里!尤其是第六种!

路医生健康科普
2026-02-06 16:16:28
外卖小哥打翻32杯奶茶原地发愣 品牌方回应:会优化包装

外卖小哥打翻32杯奶茶原地发愣 品牌方回应:会优化包装

快科技
2026-02-08 17:11:54
黄磊女儿黄多多有意进圈,脸是真的小,身材也是真的好,应该会爆

黄磊女儿黄多多有意进圈,脸是真的小,身材也是真的好,应该会爆

民间平哥
2026-01-18 21:36:22
随着62岁穆帅率队2-1,布拉加3-0,葡超最新积分榜出炉

随着62岁穆帅率队2-1,布拉加3-0,葡超最新积分榜出炉

侧身凌空斩
2026-02-09 06:48:40
极其聪明!小波特:最开始我觉得约基奇没那么厉害,还不如普拉姆利

极其聪明!小波特:最开始我觉得约基奇没那么厉害,还不如普拉姆利

懂球帝
2026-02-08 17:12:36
奶茶店特别告示激怒网友:喝杯奶茶,怎么突然这么多“规矩”?

奶茶店特别告示激怒网友:喝杯奶茶,怎么突然这么多“规矩”?

饮界
2026-02-07 10:37:33
我扒了扒王曼昱的收入

我扒了扒王曼昱的收入

小光侃娱乐
2026-02-08 18:35:06
河南一地发生一级甲等医疗事故,医生被判刑

河南一地发生一级甲等医疗事故,医生被判刑

医脉圈
2026-02-08 21:33:33
2026-02-09 11:48:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2147641文章数 5407关注度
往期回顾 全部

科技要闻

热血渐凉:被耗尽的小米SU7 Ultra

头条要闻

自民党取得压倒性胜利 野田佳彦表态:我万死难辞其咎

头条要闻

自民党取得压倒性胜利 野田佳彦表态:我万死难辞其咎

体育要闻

“我就是王楚钦” 王楚钦霸气指向球衣背后

娱乐要闻

李亚鹏暂停直播:将投入嫣然医院工作

财经要闻

文玩假拍骗局调查:3500元瓷瓶估值300万

汽车要闻

可主动预判追尾风险 岚图追光L升级华为乾崑智驾ADS 4.1

态度原创

家居
本地
教育
公开课
军事航空

家居要闻

山院焕新 雅聚悦亲朋

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

教育要闻

江北新区中小学春假时间定了!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美伊最敏感时刻 林肯号航母迎来三位“不速之客”

无障碍浏览 进入关怀版