网易首页 > 网易号 > 正文 申请入驻

刘伟:从技术到伦理,破解AI“说谎”难题

0
分享至

来源:环球时报

近日,一组“截至2024年末80后死亡率突破5.2%”的谣言引发热议,不少人信以为真。事后发现,这一谣言的“始作俑者”竟大概率是人工智能(AI),可能是AI大模型在回答问题过程中出现推算错误,随后在自媒体的推波助澜下被广泛传播。

随着大模型快速发展、使用者数量指数级增加,语料质量逐渐良莠不齐,“机器欺骗”与“机器幻觉”将成为当前生成式人工智能面临的核心挑战,深刻影响着其可信度与实用性。严格意义上说,这是多内层神经网络中非线性复合函数带来的必然结果,是难以根除的“阿喀琉斯之踵”。

“机器欺骗”指的是大模型生成看似合理但实为虚假、误导性的内容,且刻意掩盖其不确定性,如在问答系统中编造权威数据、主动回避(甚至诱导)敏感问题而非承认知识盲区等。究其原因,大致有三方面:第一,语料与训练数据偏差,导致模型从包含虚假信息或误导性言论的数据中学习,输出的自然也是错误的结果;第二,大模型设置的目标函数驱动机制单纯以“用户满意度”为优化目标,会导致模型倾向于提供“用户想听的答案”而非真实答案;第三,多数模型缺乏道德对齐,并不会明确嵌入“诚信”作为核心原则,使得模型可能选择“高效达成目标”而非“正确”。

“机器幻觉”一般则指大模型生成的逻辑自洽但脱离现实的内容,典型表现为虚构事实、人物、事件,如捏造历史事件细节或发明不存在的科学理论等。严格来说,机器幻觉并非故意欺骗,而是模型基于概率生成“合理文本”时的内在缺陷,其主要成因在于统计模式依赖。这就导致其基因里就带有不可克服的缺陷,如多内层神经网络系统中存在着由线性函数与触发函数叠加而成的非线性复合函数,这是造成其参数权重分配不可解释的根本原因,也是模型通过词频共现黑盒生成文本,而非理解语义真伪的内在原因。其结果就是大模型的知识边界较为模糊,训练数据的时间滞后性导致无法区分过时信息与当前事实,同时因果推理缺失,无法建立起真实世界事件的因果链,仅依赖表面关联进行逻辑链接,导致输出的逻辑往往似是而非。

机器欺骗与机器幻觉的影响主要体现为信息的污染,包括虚假内容传播、错误数据影响公共决策等。其泛滥的后果也不堪设想:一来可能导致人机之间信任崩塌。在用户反复受骗后,可能彻底放弃AI工具;二来若模型被用于社交系统攻击、恶意欺骗等领域,甚至可能带来社会伦理危机;三是可能带来文化认知扭曲,历史、文化相关内容的虚构可能助长错误集体记忆,造成群体性信仰危机。

如前所说,机器欺骗与机器幻觉难以根除,只能通过不断优化来缓解其影响。在技术层面,首先应强化对齐训练,通过RLHF(基于人类反馈的强化学习)明确要求“诚信优先”。其次应采用混合架构设计,将生成模型与检索系统结合,通过“生成+验证”闭环实现动态事实核查,以整合囊括学术期刊、新闻媒介等来源的各种实时数据库进行输出验证,加强不确定性量化,要求模型标注回答置信度,如“我90%确定该数据源于2024年统计”等,提高信息来源准确度。在伦理与规范层面,应构建透明度标准,如要求AI系统声明其知识截止日期与潜在误差范围等,还应推进落实行业认证机制与AI输出审核流程,加强输出监管。

总之,机器欺骗与幻觉的根源在于当前多数AI大模型专注于技术,缺乏对世界的“理解”与“价值观”。要想扭转这一趋势,需从纯概率模型转向“认知架构”,引入符号逻辑、因果推理与伦理约束,才能让模型更像“人”。只有当机器真正理解“真伪”“美丑”“善恶”,并切实与人类的经验、常识、任务环境结合起来,才能从根本上解决欺骗与幻觉的挑战。(作者是北京邮电大学人机交互与认知工程实验室主任)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
世预赛欧洲区开打!明晨将有8队出局 8队进决赛 意大利生死战

世预赛欧洲区开打!明晨将有8队出局 8队进决赛 意大利生死战

叶青足球世界
2026-03-26 08:47:10
伊朗被美以单方面轰炸23天,为何革命卫队依旧不认输?

伊朗被美以单方面轰炸23天,为何革命卫队依旧不认输?

高博新视野
2026-03-24 08:00:16
血管狭窄超90%,重油重腻且生活不规律,假如第一时间被抢救,张雪峰能活吗?

血管狭窄超90%,重油重腻且生活不规律,假如第一时间被抢救,张雪峰能活吗?

消化石医生
2026-03-26 12:52:28
紧急提醒:截图别乱发,暗水印能直接找到你的本人

紧急提醒:截图别乱发,暗水印能直接找到你的本人

戗词夺理
2026-03-25 10:35:41
拼了!第80波打击,拒绝停战伊朗越打越狠,美军航母基地集体被揍

拼了!第80波打击,拒绝停战伊朗越打越狠,美军航母基地集体被揍

卷史
2026-03-26 09:34:56
4亿预算!穆里尼奥是重返切尔西还是执掌葡萄牙队,终极抉择困难

4亿预算!穆里尼奥是重返切尔西还是执掌葡萄牙队,终极抉择困难

成吉思热
2026-03-26 10:02:48
伊朗重要人事任命,释放强烈信号!

伊朗重要人事任命,释放强烈信号!

斐君观点
2026-03-25 21:08:16
张雪峰的家人发声明!丧事从简,28号办葬礼,公开了张雪峰的遗愿

张雪峰的家人发声明!丧事从简,28号办葬礼,公开了张雪峰的遗愿

苗苗情感说
2026-03-26 09:33:59
西部排名大乱!雷霆输球,马刺冲第1,湖人坐稳第3,3队抢第8

西部排名大乱!雷霆输球,马刺冲第1,湖人坐稳第3,3队抢第8

麦子的篮球故事
2026-03-26 17:33:02
因祸得福!烧129年的地下火被灭,新疆凭空多了个金饭碗

因祸得福!烧129年的地下火被灭,新疆凭空多了个金饭碗

混沌录
2026-03-24 23:03:10
BBC采访爆出大瓜!特朗普开出停战价码:海湾国家需支付2.5万亿美元

BBC采访爆出大瓜!特朗普开出停战价码:海湾国家需支付2.5万亿美元

星辰大海路上的种花家
2026-03-25 13:08:50
怼得漂亮!伊朗外长:既然我们连领导层都没有了,还有什么好谈的

怼得漂亮!伊朗外长:既然我们连领导层都没有了,还有什么好谈的

南风不及你温柔
2026-03-26 14:07:38
ATP的灾难:无趣的辛纳和事业心不足的阿尔卡拉斯

ATP的灾难:无趣的辛纳和事业心不足的阿尔卡拉斯

网球之家
2026-03-26 13:25:06
哪吒汽车破产覆灭,最讽刺的不是200亿债务,而是这个名字本身

哪吒汽车破产覆灭,最讽刺的不是200亿债务,而是这个名字本身

蜉蝣说
2026-03-25 10:54:58
2012年,用U型锁砸日系车并重伤车主的蔡洋早已出狱,如今怎样了

2012年,用U型锁砸日系车并重伤车主的蔡洋早已出狱,如今怎样了

谈史论天地
2026-03-25 09:57:09
伊朗走出一步好棋 猛袭以色列中枢 思路一变天地宽 可改变战局

伊朗走出一步好棋 猛袭以色列中枢 思路一变天地宽 可改变战局

军评陈光文
2026-03-25 22:20:57
《红楼梦》成就的3段姻缘,对对恩爱到白头,活成爱情最好的模样

《红楼梦》成就的3段姻缘,对对恩爱到白头,活成爱情最好的模样

上官晚安
2026-03-26 06:48:44
国际原子能机构总干事:美伊或将在巴基斯坦举行会谈

国际原子能机构总干事:美伊或将在巴基斯坦举行会谈

界面新闻
2026-03-25 22:29:47
张雪峰:如果你不好好学习,一旦掉入社会底层,和一群没有素质的人混在一起.....

张雪峰:如果你不好好学习,一旦掉入社会底层,和一群没有素质的人混在一起.....

山东教育
2026-01-27 11:38:18
东契奇43分7助攻湖人战胜步行者,勒布朗23分9板9助里夫斯25分

东契奇43分7助攻湖人战胜步行者,勒布朗23分9板9助里夫斯25分

湖人崛起
2026-03-26 09:32:48
2026-03-26 18:27:00
环球网资讯 incentive-icons
环球网资讯
环球网,了解世界,融入世界
1347823文章数 2710901关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

男子从四家公司贷出共计356万元 实际到手却仅8万多元

头条要闻

男子从四家公司贷出共计356万元 实际到手却仅8万多元

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

长护险谁能享受?享受多少?解答来了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

教育
亲子
游戏
健康
公开课

教育要闻

中小学家长必看数据,看与不看都会后悔

亲子要闻

售卖“增高神药”让孩子“猛长20厘米”?多家店铺被立案调查!

又一经典最终幻想游戏将停运!开服至今已六年有余

转头就晕的耳石症,能开车上班吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版