网易首页 > 网易号 > 正文 申请入驻

防范大模型幻觉可能导致的信息安全问题

0
分享至

2025年春节以来,DeepSeek(以下简称DS)的发布在全球范围内掀起一波大模型应用的新热潮。由于在中文问答方面的优异表现,它受到中文大模型用户万众瞩目般的追捧,同时带动其他中文大模型产品如文小言、豆包、Kimi、腾讯元宝等的下载量。

不用做专业技术测评,用户可以直观感受到DS强大的推理能力。在深度思考功能中,首先可以看到为完成用户的任务,DS是如何“思考”,即很大一段推理过程或方法论的描述,由灰色字体标识出来;然后才是黑色字体标识的正式回答,往往呈现出非常完整的框架性结构和逻辑链条。毫不夸张地说,DS的推理能力超过很多忽视逻辑推理能力训练的普通老百姓。

除此之外,DS令人惊艳的还有中文表述上的文采,令很多人评价“辞藻华丽”“情绪给到位”。作为一名学术用户,笔者能直观感受到DS标题取得好,讲究大词、术语的使用,行文工整,透露一股自信和专业的味道。如果特别地要求文本的风格,会发现它对语词的褒贬义、情绪和细节的选取非常讲究,用来做原创性不高的广告、文案、公文非常好用。

然而,随着DS用户爆炸式的增长,对它更高的期望也被越来越多的用户提出来。普通用户可以直接感受到的问题主要有两点:第一,响应率不高,很容易出现“服务器繁忙,请稍后再试”的情况。仅用作日常娱乐搜索问题不大,但如果用在正式的工作场合容易误事。第二,AI幻觉明显,事实性的东西胡编乱造的情况不少。据报道,行业权威Vectara HHEM人工智能幻觉测试显示,DeepSeek-R1显示出14.3%的幻觉率,远高于行业平均水平。

从原理上说,AI幻觉根源于统计学上的“随机鹦鹉”现象,所有的大模型都不可能完全避免,但是可以尽力消除。相比较而言,国产大模型产品各有千秋,但在遏制幻觉问题上,明显文心一言表现最为优异,无疑与研发团队一开始就将AI幻觉作为最重要的研究问题来对待有关。

如果说大模型产品只想做为某种娱乐工具,写写“小作文”,调节调节情绪,似乎AI幻觉问题不大。但如果想作为高效劳动工具和严肃的信息来源,AI幻觉问题处理不好会很危险,甚至很致命。毫不夸张地说,克服AI幻觉问题事涉信息安全问题,是大模型发展的基础性和前提性问题,任何一种大模型应用都无法绕过去。

笔者尝试用DS辅助收集学术资料,发现DS将作者与作品张冠李戴、杜撰文献和作者以及胡乱内容描述的情况不少。如果完全相信DS的回答,不仅无法切实提高工作效率,相反会制造混乱和错误。当然,如果仅仅作为框架性的参考和提示,DS还是能发挥一定的辅助收集资料作用。

问题是在AI时代,很多人数字素养不高,容易迷信大模型产品。最近,在学界不少人用DS评价学者、著作、论文和某项研究的水平,以为DS客观公正,可以杜绝人情、关系和权力等因素的干扰。这是典型的技术迷信行为,相信大模型至上,将之凌驾于人的判断之上。国际通行的学术评议方式是同行评议(peer review),也就是由专业小同行进行学术评价。大模型根本不理解人类作品的含义,只是通过搜索、学习和上下文概率排序等技术手段生成文本,本质上是网上内容的“镜子”或“平均值”。显然,网上内容大部分不专业、不精确、不客观,如此大模型怎么可以取代同行评议呢?因此,完全以幻觉严重的AI产品作为研究根据,在学术上万万不行。

在社会传播方面,AI幻觉严重的大模型产品如果接入新闻、自媒体当中,大量假消息、假信息迅速生成。再加上开放和便捷的互联网传输,以及社交媒体的去中心化、反权威性,肯定会大大加剧后真相时代虚假信息泛滥的状况。使用大模型辅助生成各种文本的学生、文员和策划,长期使用AI幻觉严重的大模型产品,逐渐会丧失区别真实与虚假的判断力,甚至觉得只要形式精致、表述华丽就可以而真真假假都不重要了。

当事实性输出有问题时,不管推理能力如何强大,以错误事实为基础做决策肯定非常危险。不能否认可能出现“瞎猫碰到死耗子”的情况,但此类概率微乎其微,因为科学决策以准确而完善的信息收集为前提。有了关于决策对象各个方面的信息,才能提出有针对性的备选方案,决策者再从中挑选适合国情社情的决策方案。因此,大模型产品用于政务活动,首先就要对产品的除幻性能进行认真的评估。

如何防范大模型幻觉可能导致的信息安全问题?现阶段首要责任在大模型企业,必须投入人财物力压缩幻觉率,使之达到安全的阈值。其次,大模型产品的使用人员要提高数字素养,不可迷信AI,牢记以AI辅助劳动的“辅助”为主,让AI为人所用,严防AI反客为主。再次,尤其对于一些专业领域的大模型运用,文本生成精度要有特殊的标准,接入之前要进行严格而有针对性的幻觉率评估,切不可操之过急。最后,从长远来看,大模型信息安全问题值得各方面合作进行跨学科深入而细致的研究,形成系统化的防范方案,有步骤、有预案、有章法地推进大模型产品在各行各业的深度应用。

我们以“请推荐十本国内技术哲学著作”为题,分别在DS、豆包和文心一言进行评测,测试一下这三个平台的学术信息收集整理能力。

问题选择理由:笔者并非技术专家,不做专业的技术数据测评,做也是拿别人的工具跑一跑,因此仅做直观的问答内容测试,选择笔者非常熟悉的技术哲学领域,测试这三个大模型处理事实性信息的能力。

以下为各个平台的结果梳理:

——DS——

从形式上看,DS给出的回答读起来感觉相对丰富。它包含推理提示、推荐文本介绍、延伸推荐、阅读提示等。

推荐的十本书看得出来并不是简单地以“技术哲学”“技术”为题目进行检索,出现有《信息文明的伦理基础》《可接受的科学:当代科学基础的反思》《赛博空间的哲学探索》等不以“技术哲学”“技术”为名的作品。

但是,《中国科学技术的西传及其影响》《可接受的科学:当代科学基础的反思》并非技术哲学著作,而是科技史、科学哲学的作品。

更严重的问题是“幻觉”错误不少。比如,《可接受的科学:当代科学基础的反思》的作者是段伟文而不是刘大椿,刘永谋并没有一本名为《技术与现代性:中国道路的哲学追问》的书。比如《信息文明的伦理基础》的“推荐理由”很混乱,“可接受的科技”是《可接受的科学:当代科学基础的反思》的观点。

——豆包——

豆包回答简单明了,响应很快。除了《荷兰学派技术哲学研究:设计、理论与价值》这本书网上没有找到,其他书都是有的。但是,这十本书主要是东北大学或“东北学派”的作品,尤其陈昌曙就独占六本。严重怀疑是从不多的几个东北大学技术哲学发展史为主题的帖子上归纳的。总体上资料显得很陈旧。

——文心一言——

文心一言的推荐在准确性上没有问题,每本书给出了出版社、出版年份,还包含了国内出版社的两本译著。不过代表性上仍然存在问题,陈昌曙、刘大椿、田鹏颖均有两本。总体上书单缺乏前沿性。

总体评价:大模型用于学术资料检索功能差强人意,不可以作为学术研究的唯一依凭,而是作为某种初步的提示。就AI幻觉问题而已,文心一言表现最好,DS幻觉明显。

本文作者系中国人民大学吴玉章讲席教授 刘永谋

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
巴萨旧将:当时赫莱布知道自己要离队,他往功能饮料里兑酒喝

巴萨旧将:当时赫莱布知道自己要离队,他往功能饮料里兑酒喝

懂球帝
2026-03-26 06:43:09
国乒女队格局已定?陈熠、蒯曼的奥运梦,早被圈内人点破了

国乒女队格局已定?陈熠、蒯曼的奥运梦,早被圈内人点破了

小光侃娱乐
2026-03-27 05:20:03
A股:市场要开始准备了!明天(3月27日)的市场会这样走

A股:市场要开始准备了!明天(3月27日)的市场会这样走

风风顺
2026-03-27 00:00:04
中国已无需武统?美专家:美军白忙一场,解放军已有不战而胜之法

中国已无需武统?美专家:美军白忙一场,解放军已有不战而胜之法

有牙的兔纸
2026-02-25 00:44:28
未被重视?张水华柳州马拉松无官宣无出场费,自己报名非特邀选手

未被重视?张水华柳州马拉松无官宣无出场费,自己报名非特邀选手

杨华评论
2026-03-27 01:36:21
所有人都在盯中东打仗,中国却悄悄干了件大事:欧洲突然赚麻了

所有人都在盯中东打仗,中国却悄悄干了件大事:欧洲突然赚麻了

青青子衿
2026-03-26 01:37:03
2025年湖南省常住人口减少47万人,出生人口连续九年下降

2025年湖南省常住人口减少47万人,出生人口连续九年下降

何亚福
2026-03-26 18:42:00
岳云鹏现身上海,气场跟以前完全不一样了,助理当街抽烟也不避讳

岳云鹏现身上海,气场跟以前完全不一样了,助理当街抽烟也不避讳

仙味少女心
2026-03-24 16:47:29
张国荣挚友陈淑芬发布声明

张国荣挚友陈淑芬发布声明

中国日报
2026-03-26 16:32:12
男子下高速显示高速费用83990元,收费员震惊:你有没有绕路!

男子下高速显示高速费用83990元,收费员震惊:你有没有绕路!

张晓磊
2026-03-08 11:07:09
“这种衣服咋能穿出门?”女孩被3.9万人围观,家教太松不是好事

“这种衣服咋能穿出门?”女孩被3.9万人围观,家教太松不是好事

妍妍教育日记
2026-03-08 08:00:10
李鑫拒绝和亲姐一起带货,结果养家姐姐等不及了,给自家打起广告

李鑫拒绝和亲姐一起带货,结果养家姐姐等不及了,给自家打起广告

离离言几许
2026-03-26 20:58:46
泰国U23主帅:中国队是支很强劲的队伍,这场比赛对我们有益

泰国U23主帅:中国队是支很强劲的队伍,这场比赛对我们有益

懂球帝
2026-03-26 10:30:13
张雪峰离世,遗产分配震惊全网

张雪峰离世,遗产分配震惊全网

沧海一粟1155
2026-03-26 13:17:53
3.27今日金价:大家不必等待了!接下来,金价有可能会重演历史!

3.27今日金价:大家不必等待了!接下来,金价有可能会重演历史!

说故事的阿袭
2026-03-27 04:32:24
“面相太邪了!”大二女孩视频走红,满脸都是被亏待的痕迹!

“面相太邪了!”大二女孩视频走红,满脸都是被亏待的痕迹!

林林先生
2026-02-08 18:17:40
巴基斯坦动真格!三军总司令下令对标中国:不学中国,没有出路了

巴基斯坦动真格!三军总司令下令对标中国:不学中国,没有出路了

说宇宙
2026-03-24 14:08:54
即将沦为“穷人房”的5种房子,不好住不好卖,聪明人已逐渐转手

即将沦为“穷人房”的5种房子,不好住不好卖,聪明人已逐渐转手

猫叔东山再起
2026-03-26 09:10:08
救命,这只酱板鸭已经在我手机复仇了一万遍

救命,这只酱板鸭已经在我手机复仇了一万遍

网易上流
2026-03-26 14:06:10
曝张雪峰遗嘱内容,和原配离婚原因被扒,三段感情时间线全曝光!

曝张雪峰遗嘱内容,和原配离婚原因被扒,三段感情时间线全曝光!

古希腊掌管松饼的神
2026-03-26 09:30:58
2026-03-27 06:36:49
上游新闻 incentive-icons
上游新闻
重庆“门户级”新闻客户端
250723文章数 584803关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:对伊朗能源设施空袭再推迟10天

头条要闻

特朗普:对伊朗能源设施空袭再推迟10天

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

数码
游戏
家居
亲子
时尚

数码要闻

英特尔发Q1.26版Arc Pro专业显卡驱动,支持B70 / B65显卡

PS1大IP游戏藏私货!成人手绘与盗版马里奥ROM塞满

家居要闻

傍海而居 静观蝴蝶海

亲子要闻

试工育儿嫂被查出传染病,宝妈崩溃!家政服务“健康关”如何保障?

400万人爱过的女孩,被黄谣网暴180天后

无障碍浏览 进入关怀版