网易首页 > 网易号 > 正文 申请入驻

AI的“外部保镖”和“内置铠甲”,360《大模型安全白皮书》发布

0
分享至



2025年11月8日,在世界互联网大会乌镇峰会期间,三六零数字安全集团(以下简称“360”)正式发布《大模型安全白皮书》(以下简称“白皮书”)。



该白皮书首次系统性阐释大模型运行时的五大关键风险,建设性地提出“外筑‘以模治模’动态屏障,内固‘平台原生’安全底座”的核心理念,并源于实战,提供了可落地的安全解决方案,为大模型应用拉起了全链路安全防线,助力推动人工智能行业向“安全、向善、可信、可控”方向稳健发展。





该白皮书共计五章, 系统覆盖了大模型安全边界的演变、全景式威胁透视、源于实战的防护新思路、360全链路安全解决方案以及生态共治倡议,全面呈现了360在面对大模型安全这一挑战的技术纵深与治理前瞻性。

01 范式迁移:从网络安全到大模型安全的时代挑战

开篇介绍了随着大模型驱动百行千业智能化,传统且清晰网络安全边界正在消融。白皮书指出,当前大模型安全漏洞呈指数级增长,2025年国内首次AI大模型实网众测发现281个安全漏洞,其中大模型特有漏洞占比超60%。与此同时,攻击者从"专业黑客"演变为"全民黑客",通过自然语言即可发动高威胁攻击。



面对这一挑战,中国开创了“发展与安全并重”的敏捷治理路径,以《生成式人工智 能服务管理暂行办法》为代表的“包容审慎、分类分级”原则,为技术创新与风险防控提供了 动态平衡的框架。

02 大模型安全威胁全景透视

本章提到在大模型快速发展与广泛应用的背景下,大模型安全风险已形成多维度的复杂体系。除了传统的网络安全与数据安全解决方案能够覆盖的大模型应用环境上的安全问题以外,大模型在运行时的安全风险尤其具有其独特性。



大模型运行时安全风险主要涵盖以下五个关键风险点:一是大模型基础设施安全;二是大模型内容安全;三是大模型数据与知识库安全;四是智能体安全;五是用户端安全,涵盖大模型、知识库、智能体的访问控制,API监控及恶意插件、隐私泄露等风险。这些维度共同构成了AI安全治理需重点关注的全域图景。对于上述风险,传统的安全厂商尚未提供有效的解决方案。

03 源于实战:大模型安全的应对思路

在本章,基于对新型威胁的深度洞察,白皮书提出"外筑'以模治模'动态屏障,内固'平台原生'安全底座"的防护理念,并通过四大原则落地实施:“安全”原则保障大模型运行时的安全防护;“向善”原则引导大模型朝着积极有益的方向发展;“可信”原则致力于提升大模型生成内容的可信度、完整性与准确性;“可控”原则实现智能体有效管理。



此外,为了推动人工智能行业向以上四大原则方向稳健发展。白皮书基于实战经验,给出了“外挂式安全 + 平台原生安全”双轨治理策略 ——外挂式安全如同“建成后加装的防盗系统”,平台原生安全则如“建造时内置的防火结构”,二者协同,从外至内构筑大模型的安全防线。通过这一体系,360实现了主动发现、动态演进的安全检测能力,有效应对复杂多变的大模型安全威胁。

04 360解决方案:可全链路的安全防护

本章中,360给出了全链路安全防护的解决方案。具体而言,“外挂式”安全能力不侵入大模型原生架构,通过外部工具实现灵活、快速的动态防护。



该体系下的四大产品——大模型卫士算力主机安全系统、检测系统、防护系统、幻觉检测与缓解系统——共同构建了外部屏障,重点应对大模型基础设施风险,如算力劫持、供应链投毒,以及大模型内容风险,如提示词注入、模型幻觉与违规内容,实现了从算力层到内容层的实时监测与主动防御。



同时,“平台原生安全” 则为大模型应用注入了“安全基因”,将防护能力深度内嵌于其核心组件之中。这一理念具体体现在三大平台产品上:企业级知识库从根本上守护数据与知识安全;智能体构建和运营平台确保智能体行为全程可控;智能体客户端则筑牢用户端入口的安全防线。三者协同,从底层架构解决了数据泄露、智能体行为失控及终端滥用等内生性安全挑战,为AI应用的稳定可靠运行奠定了内生性基础。

05 生态共治:构建可信AI生态

最后章节中,白皮书强调,大模型安全需通过生态共治实现可持续治理。360深度参与《GB/T 45654-2025 网络安全技术 生成式人工智能服务安全基本要求》等国家标准制定,与北京大学联合研发的TinyR1-32B模型在安全能力上超越多个主流模型。

通过发起大模型安全联盟,360携手产学研各方共建安全生态,在工信部人工智能大模型公共服务平台上,已为100余家企业提供模型安全测试服务。

《大模型安全白皮书》的发布,标志着大模型安全治理进入体系化建设新阶段。360提出的全链路防护体系,为正处于规模化应用初期的各行各业提供了从理论到实践的完整解决方案。

未来,360将继续发挥"AI+安全"双重基因优势,与产业各方携手共建"安全、向善、可信、可控"的大模型生态,为人工智能时代高质量发展保驾护航。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国女导演曝漫威男星塌房真相:发不雅照、酒后发疯,还把她吓到锁门求生!

中国女导演曝漫威男星塌房真相:发不雅照、酒后发疯,还把她吓到锁门求生!

北美省钱快报
2025-11-08 08:03:44
多年的付出毁于一“蛋”,满屏都曾医生,网友透露更多细节

多年的付出毁于一“蛋”,满屏都曾医生,网友透露更多细节

魔都姐姐杂谈
2025-11-07 10:22:54
实探诺辉健康:杭州总部多处办公地人去楼空,北京实验室拖欠租金遭催缴,前员工称被曝的只是冰山一角

实探诺辉健康:杭州总部多处办公地人去楼空,北京实验室拖欠租金遭催缴,前员工称被曝的只是冰山一角

每日经济新闻
2025-11-08 23:27:08
随着朝鲜3-0卫冕,4夺女足世界杯冠军,最终排名如下:中国队第12

随着朝鲜3-0卫冕,4夺女足世界杯冠军,最终排名如下:中国队第12

侃球熊弟
2025-11-09 04:59:56
她长相虽然不是特别好,但身材比例是真好,看面相是个过日子的人

她长相虽然不是特别好,但身材比例是真好,看面相是个过日子的人

草莓解说体育
2025-11-08 15:01:49
空乘穿毛衣上班被吐槽“很土”,山东航空回应

空乘穿毛衣上班被吐槽“很土”,山东航空回应

大风新闻
2025-11-08 14:47:09
国科大硕士季子越,称侵华日军为英雄,开除学籍后扬言投奔美国

国科大硕士季子越,称侵华日军为英雄,开除学籍后扬言投奔美国

来科点谱
2025-11-08 09:06:42
为何说德国的减丁政策,决定了俄罗斯的命运?

为何说德国的减丁政策,决定了俄罗斯的命运?

凭阑听史
2025-11-08 16:43:01
豪门悲喜夜:拜仁16连胜结束 阿森纳10连胜终止 曼联2-2绝平热刺

豪门悲喜夜:拜仁16连胜结束 阿森纳10连胜终止 曼联2-2绝平热刺

侃球熊弟
2025-11-09 03:54:11
印尼不买了,泰国也不买了,中国千亿大单遭冲击

印尼不买了,泰国也不买了,中国千亿大单遭冲击

花花娱界
2025-11-08 21:54:27
护士长彭某某的体面:丈夫涉丑闻全网热议,她用3个细节赢了尊重

护士长彭某某的体面:丈夫涉丑闻全网热议,她用3个细节赢了尊重

娱乐的硬糖吖
2025-11-09 03:15:07
娶个洋媳妇能有多尴尬?网友:据说白人女孩体味很大,是真的吗

娶个洋媳妇能有多尴尬?网友:据说白人女孩体味很大,是真的吗

带你感受人间冷暖
2025-11-09 00:10:08
家门口发现人参,浙江男子直接生吃半根!结果悲剧了…

家门口发现人参,浙江男子直接生吃半根!结果悲剧了…

FM93浙江交通之声
2025-11-09 06:06:23
3-0!亚洲之光杀疯了,7战全胜卫冕女足世界杯冠军,球员哭成泪人

3-0!亚洲之光杀疯了,7战全胜卫冕女足世界杯冠军,球员哭成泪人

侃球熊弟
2025-11-09 04:57:23
沪牌大军集体出动!这里堵车堵到猪肝红!有人吐槽:出门导航1个半小时,实际4小时

沪牌大军集体出动!这里堵车堵到猪肝红!有人吐槽:出门导航1个半小时,实际4小时

新民晚报
2025-11-08 14:44:07
曾琦老公什么都没做,也被挖了出来!网友:有点理解主任了

曾琦老公什么都没做,也被挖了出来!网友:有点理解主任了

男女那点事儿儿
2025-11-08 12:59:03
太突然!营业10多年,杭州最后一家门店也闭店了,曾经不少人排队去吃

太突然!营业10多年,杭州最后一家门店也闭店了,曾经不少人排队去吃

都市快报橙柿互动
2025-11-07 19:49:29
莱巴金娜拒绝合影!携11连胜问鼎总决赛冠军,萨巴伦卡泪洒现场

莱巴金娜拒绝合影!携11连胜问鼎总决赛冠军,萨巴伦卡泪洒现场

排球黄金眼
2025-11-09 05:30:53
真心建议:不要购买的8样“大垃圾”,不是图省钱,是扔都嫌麻烦

真心建议:不要购买的8样“大垃圾”,不是图省钱,是扔都嫌麻烦

小鹿姐姐情感说
2025-11-08 10:05:18
5次射门+造6次机会,阿尔瓦雷斯当选马竞vs莱万特全场最佳

5次射门+造6次机会,阿尔瓦雷斯当选马竞vs莱万特全场最佳

懂球帝
2025-11-09 03:50:06
2025-11-09 09:11:00
曾宪勇 incentive-icons
曾宪勇
有趣的科技互联网原创自媒体
578文章数 60关注度
往期回顾 全部

科技要闻

美股“AI八巨头”单周市值损失8000亿美元

头条要闻

诺辉健康从巅峰坠落谷底 杭州总部多处办公地人去楼空

头条要闻

诺辉健康从巅峰坠落谷底 杭州总部多处办公地人去楼空

体育要闻

马刺绞赢火箭,不靠文班亚马?

娱乐要闻

古二再度放料!秦雯王家卫吐槽出现新人物

财经要闻

小马、文远回港上市 但自动驾驶还没赢家

汽车要闻

钛7月销破2万 霜雾灰与青峦翠配色正式开启交付

态度原创

家居
旅游
教育
健康
公开课

家居要闻

现代自由 功能美学居所

旅游要闻

黄河一号公路:徜徉母亲河畔,叩问山河奇观和文明诗篇

教育要闻

雅思口语答案不只是模版

超声探头会加重受伤情况吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版