网易首页 > 网易号 > 正文 申请入驻

360智脑张向征:构建安全可信的大模型是AI未来的关键

0
分享至

人工智能的加速发展,有力推动了社会的数智化转型;与此同时,带来的相关安全风险也日益凸显。近日,在北京市举办的通明湖人工智能开发与应用大会上,360智脑总裁张向征以“大模型安全研究与实践”为主题,向业界分享了大模型安全领域的最新研究成果和实践经验。

张向征表示,大模型是数智化时代的重要基础设施,其应用贯穿众多行业和领域,但伴随而来的安全挑战同样不容忽视。大模型的开发、训练、推理和应用涉及复杂的软件生态系统,这一过程中,数据泄露、模型投毒、提示注入攻击、幻觉问题等安全隐患贯穿始终。张向征强调,保障大模型安全,不仅是维护企业利益的关键,更是确保社会公共安全的必要举措。

张向征提出,大模型安全面临四大核心挑战:大模型软件生态系统安全、内容安全、幻觉问题和Agent流程可控。针对这些挑战,360智脑团队基于多年安全研究积累,提出了一套完整的安全防护体系,包括全链路检测、防护、攻击与测评的闭环流程。

在大模型软件生态系统安全方面,360智脑通过自主研发的检测工具与多层次安全评估方法,可及时发现和修复潜在漏洞,为开发者和用户提供全面的技术支持。此外,针对提示注入攻击、持久性提示劫持、记忆投毒等新型安全威胁,团队研发了精准识别与多重防御机制,显著提升了模型对恶意行为的抗干扰能力。

内容安全方面,张向征分享了360智脑的实践经验。团队通过持续预训练、安全微调和安全强化对齐等手段,结合国标TC260的要求,构建了“大模型原生安全增强”“内容安全护栏”两大防护方案,有效减少模型输出中可能涉及的歧视偏见、违禁内容和其他不良信息。在实际应用中,这些措施帮助大模型在金融、医疗和教育等行业更安全、更高效地提供服务。

针对备受关注的大模型幻觉问题,360智脑创新性地引入幻觉检测Agent技术,能够对模型的输出进行实时评估与修正。通过结合外部知识库和搜索增强功能,该技术有效降低了幻觉发生率,提升了模型的决策可信度。张向征透露,得益于这一技术,360智脑在AI搜索场景中的用户体验提升了32%。

此外,在Agent流程可控方面,360智脑构建了一套针对多Agent协作任务的流程监控与管理机制,通过实时监测和动态调整,确保模型任务执行的全程可控性与透明性。这一举措不仅有效降低了操作偏差的风险,还为复杂任务的安全性提供了有力保障。

演讲还介绍了新型攻击方式的风险评估与应对策略。随着大模型应用的加深,基于自然语言到代码的间接提示注入(NL2SHELL)等攻击正日益增多。对此,360智脑利用自主研发的安全评测大模型,结合红队攻击模型,通过对抗方式快速识别潜在威胁,并持续优化模型的安全策略。

张向征表示,大模型安全不仅是技术问题,更是行业共同面临的课题,只有在保障大模型安全的前提下,才能真正释放AI的无限可能。360智脑致力于与产业伙伴协作,共建安全可信的AI生态。他呼吁全行业关注大模型的“检、防、攻、测”体系建设,通过技术创新与资源共享,共同推动大模型在社会各领域的落地与发展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
张雪机车发布安全隐患公告, 旅狼500RR/500F车主可享三项免费维保服务

张雪机车发布安全隐患公告, 旅狼500RR/500F车主可享三项免费维保服务

界面新闻
2026-05-11 09:20:57
中国赛车+中国车手再夺世界冠军!吉利星瑞TCR首战即夺冠

中国赛车+中国车手再夺世界冠军!吉利星瑞TCR首战即夺冠

扬子晚报
2026-05-10 21:25:15
爸爸想把房子送给"干女儿"保姆 儿子扣房产证

爸爸想把房子送给"干女儿"保姆 儿子扣房产证

看看新闻Knews
2026-05-11 13:12:03
他舍弃中国国籍加入日本队!助日乒逆袭崛起,如今成国乒头号威胁

他舍弃中国国籍加入日本队!助日乒逆袭崛起,如今成国乒头号威胁

八斗小先生
2026-05-11 15:40:40
《主角》主角差评如潮,出场十几秒,网友评价:双眼无神像瞎子

《主角》主角差评如潮,出场十几秒,网友评价:双眼无神像瞎子

剧芒芒
2026-05-11 12:21:15
特朗普宣布访华!带1500吨行李和豪华天团,这波是避难还是谈判?

特朗普宣布访华!带1500吨行李和豪华天团,这波是避难还是谈判?

李将平老师
2026-05-11 13:30:25
普京放话,远东问题不能再拖!搁置70年,要完成斯大林的未竟之业

普京放话,远东问题不能再拖!搁置70年,要完成斯大林的未竟之业

朝子亥
2026-05-11 13:40:03
3:2击败日本后,王曼昱对孙颖莎用了特殊称呼,王励勤也难以反驳

3:2击败日本后,王曼昱对孙颖莎用了特殊称呼,王励勤也难以反驳

寒律
2026-05-11 12:40:11
外交部:为维护相关决议严肃性和权威性,中方决定不同意台湾地区参加今年世卫大会

外交部:为维护相关决议严肃性和权威性,中方决定不同意台湾地区参加今年世卫大会

澎湃新闻
2026-05-11 15:32:33
多地市委书记调整

多地市委书记调整

上海法治声音
2026-05-11 15:46:11
31亿,207米!中国第一大民企的深圳总部,封顶!

31亿,207米!中国第一大民企的深圳总部,封顶!

GA环球建筑
2026-05-10 23:25:38
男子酒后与女友游玩时跳河溺亡,家属起诉女友及两公司索赔28万 法院判了

男子酒后与女友游玩时跳河溺亡,家属起诉女友及两公司索赔28万 法院判了

红星新闻
2026-05-11 14:58:23
为什么一定要用伤病缠身的梁靖崑?日本摄影师一句话戳穿真相!

为什么一定要用伤病缠身的梁靖崑?日本摄影师一句话戳穿真相!

石辰搞笑日常
2026-05-11 12:28:09
华裔日本主帅:孙颖莎这道墙很高!但张本美和能在洛奥战胜她

华裔日本主帅:孙颖莎这道墙很高!但张本美和能在洛奥战胜她

念洲
2026-05-11 12:40:08
吴君如很早就说过了,陈妍希私下就是这样穿

吴君如很早就说过了,陈妍希私下就是这样穿

八卦王者
2026-05-10 13:24:46
西安分水岭车祸!逆行肇事者竖手指,目击者再曝细节,对方太不值

西安分水岭车祸!逆行肇事者竖手指,目击者再曝细节,对方太不值

千言娱乐记
2026-05-11 14:49:45
上海地铁两老太撕扯女孩后续!老人正脸流出,身份被扒,评论炸了

上海地铁两老太撕扯女孩后续!老人正脸流出,身份被扒,评论炸了

八斗小先生
2026-05-11 15:20:56
《新华社》霸气认证肖战全球火爆!还达成历史第一成就,实力强悍

《新华社》霸气认证肖战全球火爆!还达成历史第一成就,实力强悍

悦君兮君不知
2026-05-10 15:27:02
“专坑中国”,世界杯这回撞墙了

“专坑中国”,世界杯这回撞墙了

南风窗
2026-05-11 14:11:47
文旅部整治摆渡车,奈何中西部早就“养不起”景区了

文旅部整治摆渡车,奈何中西部早就“养不起”景区了

冰川思想库
2026-05-11 11:16:20
2026-05-11 17:39:00
超声波
超声波
超声波—中国顶级VC的声音。
260文章数 192关注度
往期回顾 全部

科技要闻

黄仁勋:你们赶上了一代人一次的大机会

头条要闻

吴宜泽:能进攻时我从来不会防守 为此付出过很多代价

头条要闻

吴宜泽:能进攻时我从来不会防守 为此付出过很多代价

体育要闻

梁靖崑:可能是最后一届了,想让大家记住这个我

娱乐要闻

“孕妇坠崖案”王暖暖称被霸凌协商解约

财经要闻

"手搓汽车"曝光:伪造证件、电池以旧代新

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

亲子
艺术
游戏
教育
公开课

亲子要闻

阿不力挖不力,这是谁的声音?

艺术要闻

陆抑非写竹,笔力遒劲

《巫师4》曝重磅消息:《天国:拯救》核心主创加盟!

教育要闻

一招教你差倍问题的解法!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版