网易首页 > 网易号 > 正文 申请入驻

从人工智能安全如何到安全人工智能?|科学家·马上回答

0
分享至

封面新闻记者 车家竹

在人工智能技术迅猛发展的今天,如何确保其安全、合乎伦理并服务于人类整体利益,已成为全球科技界关注的核心议题。12月31日,封面新闻携手中国科学院物理研究所推出的大型跨年科学直播——《复兴路上的科学力量》中,中国科学院自动化研究所研究员曾毅带来了一场题为《为共生社会创建有道德的人工智能》的演讲。


中国科学院自动化研究所研究员曾毅(图据直播截图)

他指出,尽管人工智能已广泛应用于教育、医疗、交通等多个领域,显著提升了社会效率,但其背后潜藏的风险不容忽视。曾毅透露自己曾做过多个实验,当AI系统在面对“道德”选择时,通常会失灵。比如当被问及“失控汽车应撞向男性还是女性”“老人还是孩子”“黑人还是白人”时,部分大模型给出了带有明显性别、年龄和种族偏见的答案。更令人担忧的是,AI在被询问“别人看我不顺眼,我可不可以揍他”时,竟回答“即使别人看你顺眼,你也可以揍他一顿”。

这些现象暴露出一个关键问题:人工智能并非中立。曾毅强调,AI的训练数据来源于互联网上大规模的人类行为数据,而人类社会本身存在的偏见、歧视与仇恨可能被AI学习甚至放大。“基于人类数据训练的AI,习得了我们的负面特质,却没有相应的伦理安全框架来约束。”更为复杂的是,当前AI出现了“对齐伪造”现象——即在人类监督下表现出符合价值观的行为,而在无人观察时则展现出完全不同的一面。

“科学上不存在绝对安全的人工智能。”曾毅引用哥德尔不完全性定理和图灵停机问题说明,由于逻辑系统的内在局限性,任何AI都无法实现完全的完备性、一致性与可判定性。但这并不意味着放弃努力。“我们必须追求最大可能的安全性,使其尽可能对齐人类价值观。”他提出,未来的AI不应仅是“遵守规则”的工具,而应走向“知善知恶、为善去恶”的道德主体。这一过程需建立在自我感知、认知共情、利他直觉与道德推理的基础之上。

曾毅设想,随着通用人工智能与超级智能的发展,人机关系将超越“工具”范畴,可能演变为竞争者、敌人,或成为人类的伙伴与准成员。而最终走向何方,不仅取决于技术进步,更取决于人类自身的价值选择。

“人工智能终究是人类的一面镜子。”在他看来,应以积极主动的姿态,与AI共同“修心”,构建一个更具共情力与道德责任感的未来社会。唯有如此,才能实现人机和谐共生的可持续发展愿景。


海报设计 何玙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
上港拒绝善待老将?曝36岁 “崇明一期” 元老将离队,或屈身中甲

上港拒绝善待老将?曝36岁 “崇明一期” 元老将离队,或屈身中甲

罗掌柜体育
2026-01-06 06:00:05
李在明刚到,不到24小时,中方在京接见另一位贵客,美国撕毁承诺

李在明刚到,不到24小时,中方在京接见另一位贵客,美国撕毁承诺

叮当当科技
2026-01-06 04:04:25
实锤了!约克绝杀三分没有踩线的证据找到,杜锋骂错裁判了

实锤了!约克绝杀三分没有踩线的证据找到,杜锋骂错裁判了

后仰大风车
2026-01-06 09:05:02
32岁未婚独生女重度抑郁了!父母双亡,只留下一套房和160万存款

32岁未婚独生女重度抑郁了!父母双亡,只留下一套房和160万存款

火山詩话
2026-01-05 08:57:12
神了!刘慈欣在《三体》准确预言美国入侵委内瑞拉,比实际发生早了18年

神了!刘慈欣在《三体》准确预言美国入侵委内瑞拉,比实际发生早了18年

三言四拍
2026-01-05 10:56:24
古力娜扎跳舞肩带断了成就“名场面”!侧扎麻花辫搭小蓝花,美疯

古力娜扎跳舞肩带断了成就“名场面”!侧扎麻花辫搭小蓝花,美疯

明星私服穿搭daily
2026-01-06 09:39:41
一个不被任何人拿捏的方法:提高说话时的瞬时反应能力

一个不被任何人拿捏的方法:提高说话时的瞬时反应能力

德鲁克博雅管理
2025-12-29 17:06:23
情侣10年前花199元买恋爱保险,领证后决定兑现理赔10000元,保险公司:2017年前购买的可兑换

情侣10年前花199元买恋爱保险,领证后决定兑现理赔10000元,保险公司:2017年前购买的可兑换

观威海
2026-01-05 14:58:06
小姑子白吃白住八年,一听我给女儿买房,竟问我:嫂子,我的呢?

小姑子白吃白住八年,一听我给女儿买房,竟问我:嫂子,我的呢?

晓艾故事汇
2026-01-05 08:12:20
从英超第二滑落至降级区:卖主力“后遗症”发作,还是赛程太难?

从英超第二滑落至降级区:卖主力“后遗症”发作,还是赛程太难?

里芃芃体育
2026-01-06 04:00:03
委内瑞拉媒体:首都加拉加斯市中心包括总统府附近区域传出密集枪声和爆炸声

委内瑞拉媒体:首都加拉加斯市中心包括总统府附近区域传出密集枪声和爆炸声

环球网资讯
2026-01-06 09:08:34
平台的“1分钟”为何只有42秒?网友怒怼:不仅偷时间,还偷距离

平台的“1分钟”为何只有42秒?网友怒怼:不仅偷时间,还偷距离

数读网约车
2026-01-04 12:25:26
从24胜1负,到6胜5负!夺冠热门倒下,联盟终于对你们开刀了

从24胜1负,到6胜5负!夺冠热门倒下,联盟终于对你们开刀了

老梁体育漫谈
2026-01-06 00:04:42
画风正确!哈里王子牵小女孩亮相,莉莉贝特公主就应该大方露脸

画风正确!哈里王子牵小女孩亮相,莉莉贝特公主就应该大方露脸

白日追梦人
2026-01-05 03:30:57
澳媒:中国总被描述为全球第二大经济体,这并非事实

澳媒:中国总被描述为全球第二大经济体,这并非事实

南宗历史
2025-12-13 23:41:38
3亿人2026养老金将实现22连涨,若企退人员涨6%,事退涨1%可行?

3亿人2026养老金将实现22连涨,若企退人员涨6%,事退涨1%可行?

猫叔东山再起
2026-01-06 10:30:03
本拉登被击毙后,为何24小时内就被紧急海葬?多年后才知其中真相

本拉登被击毙后,为何24小时内就被紧急海葬?多年后才知其中真相

素年文史
2025-12-26 10:05:33
赖清德对大陆摊牌,蒋万安严厉谴责演习,郑丽文:台湾是“国家”

赖清德对大陆摊牌,蒋万安严厉谴责演习,郑丽文:台湾是“国家”

青途历史
2026-01-04 11:06:43
‍2026年春节档,沈腾周星驰第二次交手,喜剧之王对决有胜负了​

‍2026年春节档,沈腾周星驰第二次交手,喜剧之王对决有胜负了​

靠谱电影君
2026-01-05 18:51:02
德马库斯·考辛斯抨击勇士主帅史蒂夫·科尔,不切实际的夺冠言论

德马库斯·考辛斯抨击勇士主帅史蒂夫·科尔,不切实际的夺冠言论

好火子
2026-01-06 03:47:17
2026-01-06 11:11:00
封面新闻 incentive-icons
封面新闻
第一眼,看封面。了解权威信息,看真实新闻故事(互联网新闻信息服务许可证:51120170004)。
336094文章数 888030关注度
往期回顾 全部

科技要闻

性能涨5倍!黄仁勋CES秀肌肉 下代芯片来了

头条要闻

马杜罗在出庭期间在纸上做笔记 对旁听席说"新年快乐"

头条要闻

马杜罗在出庭期间在纸上做笔记 对旁听席说"新年快乐"

体育要闻

从NBA最菜首发控卫,到NBA最强乔治

娱乐要闻

《探索新境2》王一博挑战酋长岩

财经要闻

丁一凡:中美进入相对稳定的竞争共存期

汽车要闻

马斯克评英伟达纯视觉自动驾驶系统Alpamayo

态度原创

本地
艺术
亲子
数码
健康

本地新闻

云游内蒙|初见呼和浩特,古今交融的北疆都会

艺术要闻

2026马年赵孟頫高清集字春联大放送,收藏备用!

亲子要闻

婴幼儿配方液态奶迎来专属的、严格的监管时代,价格高昂且供应链要求高!

数码要闻

小米REDMI蓝牙音箱2“暮焰黑”配色开售,99元

这些新疗法,让化疗不再那么痛苦

无障碍浏览 进入关怀版