网易首页 > 网易号 > 正文 申请入驻

筑牢人工智能安全屏障:以创新实�...

0
分享至

来源:市场资讯

(来源:海外网)

来源:新华社客户端

近期,开源AI智能体OpenClaw引发的“养龙虾”热潮在社交平台上迅速传播,在展示出人工智能潜力的同时,也引发了业界对于大模型安全问题的广泛关注。随着大模型能力持续增强,其在复杂交互中的安全边界问题逐渐显现。在此背景下,以深知对话风控模型(以下简称“对话风控模型”)为代表的一批创新成果,正以更贴近实际应用的方式回应这些挑战。

大模型浪潮下的安全挑战

伴随大模型技术的快速普及与应用,越来越多的企事业单位积极投身于大模型私有化部署,以期在智能化浪潮中抢占先机,提升核心竞争力。然而,技术跃迁的背后,由大模型技术引发的安全风险问题亦日益凸显。

面对大模型及相关应用带来的新型安全挑战,相关风险问题已在业内引发广泛关注。多方公开信息显示,部分开源AI智能体在默认或不当配置情况下存在较高安全风险,容易遭受网络攻击并导致敏感信息泄露。同时,在私有化部署场景中,一些服务器长期暴露在公网环境中,模型本身也可能存在被攻击的隐患,整体安全状况仍有待进一步完善。从实际应用情况来看,大模型安全问题已不再局限于传统系统层面的漏洞,而是进一步延伸至大模型自身以及大模型应用层面的安全,包括提示词注入、恶意诱导、隐蔽表达、敏感信息套取等,对现有安全机制提出了新的要求。

一种面向实际应用的安全实践

彩智科技创始人、中国计算机学会(CCF)杰出会员徐剑军带领团队提出“对话风控模型”,以解决大模型在严肃场景中的“幻觉”问题。他说:“幻觉是一个表面现象,根本原因就是知识工程和大模型都有各自的边界。”

据悉,“对话风控模型”采用组件化插入模式,可与原有基座大模型深度协同配合,相当于在基座大模型、应用智能体等大模型应用前端,增设了一道专业的安全“防火墙”。用户所有诉求均先经过对话风控模型,由该模型基于自然语言上下文理解,对潜在风险进行快速识别,并可识别变体拼写、谐音代称等隐蔽表达形式,同时可针对风险问题提供安全代答服务。

该对话风控模型主要由风险研判模型和安全代答模型构成。其中,风险研判模型负责完成对输入的风险识别与分类,实现风险的主动发现、实时预警。安全代答模型则负责对识别出的重点关注类和隐藏条件预警类问题进行回应,按照“事实澄清-政策引用-正向引导”的三段式原则进行回应,兼顾风险防控与服务体验。对于部分存在安全风险的提问,模型并非简单拒答,而是根据风险研判结果,灵活触发安全代答模式或拦截机制。当启动安全代答模式时,模型将依托权威文件构建的动态更新知识库提供回应,回复内容均可溯源至官方权威文件。

共筑AI安全防线,推动人工智能行稳致远

构建面向人工智能时代的安全防护能力,是当前大模型应用过程中需要持续关注的重要问题之一。

从行业发展来看,对话风控模型所体现的,是一种外部化、低耦合的安全防护思路。通过技术解耦和API服务方式,研发团队可以将更多精力放在模型性能提升和核心业务打磨上,减少安全模块与业务逻辑相互牵制带来的开发压力。这种路径有助于降低大模型研发与应用的综合成本,也为专用领域大模型的安全落地提供了新的实践参考。(徐妍迪)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
西游主演送别陈丽华:马德华痛哭,六小龄童冒雨,迟重瑞令人担忧

西游主演送别陈丽华:马德华痛哭,六小龄童冒雨,迟重瑞令人担忧

古希腊掌管松饼的神
2026-04-09 10:25:51
迟重瑞不再隐忍!坦言和陈丽华结婚真相,难怪550亿遗产一分不要

迟重瑞不再隐忍!坦言和陈丽华结婚真相,难怪550亿遗产一分不要

阿伧说事
2026-04-09 03:25:55
吃他汀不能碰燕麦?医生劝告:不只是燕麦,这3物再馋也要忌嘴

吃他汀不能碰燕麦?医生劝告:不只是燕麦,这3物再馋也要忌嘴

路医生健康科普
2026-04-09 13:03:45
郑少秋4个女儿:老大55岁自缢,老二38岁抑郁,老三老四享尽父爱

郑少秋4个女儿:老大55岁自缢,老二38岁抑郁,老三老四享尽父爱

照见古今
2026-04-08 18:17:49
暂缓洗车!北京下午还有雨,明起气温快速回升

暂缓洗车!北京下午还有雨,明起气温快速回升

北青网-北京青年报
2026-04-09 13:39:15
微信出现这条杠,你被好友移除了

微信出现这条杠,你被好友移除了

小虎新车推荐员
2026-04-09 07:10:55
阿斯:相比皇马6000万欧签马斯坦托诺,拜仁签奥利塞堪称捡漏

阿斯:相比皇马6000万欧签马斯坦托诺,拜仁签奥利塞堪称捡漏

懂球帝
2026-04-09 06:53:23
采购价上万的商用一体机,如今才249块!可装Win10和飞牛系统

采购价上万的商用一体机,如今才249块!可装Win10和飞牛系统

闲搞机
2026-04-09 11:01:03
66岁大妈喜欢睡前泡脚,不久脑梗去世,专家怒斥:太无知了

66岁大妈喜欢睡前泡脚,不久脑梗去世,专家怒斥:太无知了

比利
2026-03-21 13:00:22
舒默:总统无权独自将国家带向战争

舒默:总统无权独自将国家带向战争

看看新闻Knews
2026-04-09 10:39:07
长公主被家暴流产了

长公主被家暴流产了

毒舌扒姨太
2026-04-08 22:29:19
花蚊子入侵中国才不到50年,就让我们连大树底下乘凉的资格都没了

花蚊子入侵中国才不到50年,就让我们连大树底下乘凉的资格都没了

阿凫爱吐槽
2026-04-08 06:32:40
约基奇14+15+10创3大纪录,掘金10连胜!穆雷26+7+5,虎将创神迹

约基奇14+15+10创3大纪录,掘金10连胜!穆雷26+7+5,虎将创神迹

一将篮球
2026-04-09 12:28:22
神秘“欢乐马”空降屠榜,碾压Seedance 2.0,视频AI又变天了?

神秘“欢乐马”空降屠榜,碾压Seedance 2.0,视频AI又变天了?

华尔街见闻官方
2026-04-08 20:23:49
陈丽华去世后,生前不良爱好曝光,中国紫檀博物馆做出这一决策

陈丽华去世后,生前不良爱好曝光,中国紫檀博物馆做出这一决策

微风轻拂面
2026-04-08 15:35:01
太恶劣了!再见NBA首轮秀!宁波队当场解除合同

太恶劣了!再见NBA首轮秀!宁波队当场解除合同

篮球实战宝典
2026-04-08 22:57:50
和销量无关,问界可能正遭遇史上最大危机

和销量无关,问界可能正遭遇史上最大危机

娱乐圈的笔娱君
2026-04-09 01:45:59
央视3次怒批电动车解限速,25km/h的龟速,不如给电摩上绿牌?

央视3次怒批电动车解限速,25km/h的龟速,不如给电摩上绿牌?

小怪吃美食
2026-04-06 14:39:17
“霍尔木兹决战”,紧急叫停了

“霍尔木兹决战”,紧急叫停了

中国新闻周刊
2026-04-08 11:48:29
郑丽文访陆安保规格特别高!现场特勤严阵以待,此行分量很重

郑丽文访陆安保规格特别高!现场特勤严阵以待,此行分量很重

魔都姐姐杂谈
2026-04-08 22:28:51
2026-04-09 14:44:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2808147文章数 6514关注度
往期回顾 全部

科技要闻

Meta凌晨首发闭源大模型 扎克伯格又行了?

头条要闻

陈丽华告别仪式举办 马德华:迟重瑞心里很难过

头条要闻

陈丽华告别仪式举办 马德华:迟重瑞心里很难过

体育要闻

8万人面前心脏骤停 现在他还站在球场上

娱乐要闻

金莎官宣结婚 与老公孙丞潇相差18岁

财经要闻

谈判基础已被破坏!霍尔木兹海峡关闭

汽车要闻

8155芯片+L2智驾 瑞虎5运动版上市 置换补贴价6.79万元起

态度原创

家居
亲子
游戏
房产
健康

家居要闻

清新自然 复古风尚

亲子要闻

以人类目前的意志力还不足以抵抗这种萌物

《Starfield》现已登陆PlayStation 5 +“Terran Armada”DLC及“Free Lanes”更新

房产要闻

超级卷王登场!海口首个抬板四代宅,彻底刷新认知!

干细胞抗衰4大误区,90%的人都中招

无障碍浏览 进入关怀版