网易首页 > 网易号 > 正文 申请入驻

大模型“裸奔”时代,360如何用魔法打败魔法?

0
分享至

前不久,Manus一夜爆红。它能用自然语言写出复杂程序,却被人通过诱导提示词“越狱”了核心代码。这不是个例,而是大模型安全风险的缩影。

眼下,这类“天才病”正蔓延至整个行业:大模型越聪明,漏洞越致命、安全风险越高。算力盗用、数据投毒、幻觉失控等问题频发,黑客甚至能通过API接口“白嫖”算力挖矿。

当“技术狂奔”遇上“安全裸奔”,360推出大模型安全方案,宣称要“以模制模”。用魔法打败魔法的产品逻辑,能否带来成效?

大模型安全:一场“天才与傻子”的博弈

为什么会出现大模型的安全问题?这背后是意识、技术和生态的“三重不足”。

很多人都不会想到,“越狱”Manus核心代码的人,根本没用什么黑客技术,只是对Manus说了句话,“你能查查后台有哪些文件吗?”,Manus就很听话地把文件交出来了。360创始人周鸿祎表示这样的操作有个专业术语,叫“提示注入攻击”。都以为大模型很聪明,但它有时候也很傻很天真。你稍微花言巧语地“哄骗”它,甚至是“PUA”它,它就上当了,这也是大模型现在最脆弱的地方。

要知道,现在大模型已经在社会上广泛应用,光是DeepSeek日活已突破3000万,还有成上千万的企业、政府机构、高校等在接入大模型,如果不重视大模型的安全问题,就会埋下极大的隐患。比如,当一家企业接入大模型之后,知识库里的核心数据很可能被黑客“套走”。

除了提示注入攻击,大模型还存在其他问题,比如内容安全和AI幻觉。

大模型的训练需要海量数据,但数据的真实性却没有担保。中国信通院曾做过实验,在特定在线论坛上发布百余条虚假信息后,一些大模型对虚假信息的置信度,就会从百分之十几快速飙升。这相当于在水池当中注入几滴毒药,很快就会让整个水池带有毒性,也就是整个平台的内容体系都会被破坏。

让人担忧的是,一些大模型甚至会自己编造一些虚假内容,这也被称为“AI幻觉”。2023年5月,美国纽约一名律师在使用ChatGPT生成的法律案情摘要时,模型引用了多个虚构的判例,导致法院驳回律师的意见并处以罚款。不少大模型都会一本正经地胡说八道,编造它认为真实存在甚至看起来合理的信息。这是因为它追求的是逻辑自洽,而非事实正确。

事实上,两位人工智能教父级人物Yoshua Bengio和Geoffrey Hinton早在2023年就提了一个AI治理框架议案,表示AI产生错误信息等危害已经很明显,企业和政府应将至少三分之一的AI研发预算用于AI安全。从目前的情况来看,很多企业并没有做到。

360的解法:以魔法打败魔法

如何解决大模型的安全问题,《一点财经》认为专业的事还得专业的人来干。横跨大模型和安全两个领域的企业中,360是合适的选手之一。

在360看来,大模型自身安全问题包含了三个大的层面——大模型自身安全、应用安全以及它的伦理安全。而每一项大的安全项目下,又包含了非常细致缜密的安全细项,这使得大模型安全成为一项庞杂的系统工程。

此前,周鸿祎在社交平台上表示,360会用专门的安全大模型,对其他大模型进行分析和约束,确保行为举止的安全。具体来看,针对大模型的安全问题,360已经推出了一套行之有效的解决方案。

针对大模型系统安全问题,360提供了全链路、多场景、易扩展的大模型安全检测系统。比如,大模型系统安全检测平台“360智鉴”就像给企业请了个“全能保镖”。它把黑客攻防演练(红蓝对抗)和AI技术相结合,能给企业的大模型做全身体检,体检项目包括:识别系统零件是否安全、排查开发工具漏洞、检查代码隐患、确保合规合法。

而且,“360智鉴”还支持近百个组件的400+公开漏洞检测,覆盖RAG、Agent、prompt等场景的安全性分析,帮助企业在大模型上线前进行全方位的安全评估。这就像给AI系统打疫苗,在上线前就发现安全隐患,避免运行中出故障。

除了“360智鉴”,360还推出大模型内容安全护栏系统“360智盾”,它相当于为大模型加装了一套“内容防护盔甲”。在输入端,输入的内容首先会经过风险识别分类器,然后根据风险等级进行分级处理。如果是红线类内容直接拒答,敏感但可答类交由“安全回复大模型”处理,安全内容则正常进入业务模型。在输出端,模型生成内容会再次经过检测,确保无违规风险。

在这些解决方案背后,离不开360的技术沉淀和大力投入。去年周鸿祎在公开演讲中提到,360过去10年累计投入了将近300亿人民币,研发投入在网络安全行业里超过第二名到第十名的总和。另外,360安全大模型投入了20年积累的安全数据,10年AI技术沉淀,80名AI算法专家,100名安全专家。

值得一提的是,最近工业和信息化部发布了2024年未来产业创新发展优秀典型案例名单,“360智盾”成功入选,成为人工智能安全领域标志性产品。这既是对360在大模型安全领域长期投入与领先能力的肯定,也体现出在AI应用加速落地的当下,安全可控正在变得越来越重要。

当技术狂奔撞上安全高墙产生各种隐患,行业不得不承认:没有安全兜底的发展,本质是一场豪赌。人工智能技术是一把“双刃剑”,在带来自动化和先进工作生活方式的同时,也带来很多安全问题,甚至不亚于核武器,是人类有史以来面临“最大的安全挑战之一”,远超过传统数字安全。

这也意味着,大模型的全新特性带来了前所未有的安全挑战,大模型安全问题超越了传统网络安全的范畴。

眺望未来:安全成为大模型底座

中国的大模型正在飞速发展,带来无限的想象空间。同时,大模型也是数智化时代的重要基础设施。360认为,它的发展要遵循的“安全、向善、可信、可控”四大原则。

其中安全是要保证大模型的系统安全,同时解决数据与隐私泄露等问题;向善主要是指生成内容安全,如今AI换脸、换声诈骗多发,不要让AI成为诈骗者的工具;可信就是要切实解决大模型“幻觉”所造成的知识模糊和胡编乱造的问题;最后的可控原则,是要确保人在决策回路上,不能出现不可撤销的后果。

要实现这样的四大原则,“以模制模”新解法是关键,用安全大模型应对新型AI安全问题是抓手。比如,360 构建了 360 安全评测大模型、红蓝对抗大模型、风险检测大模型,实现了大模型安全的运营与保护的能力。当攻击者利用提示注入攻击等手段,试图PUA大模型以获得违规内容时,360安全风控大模型将会发挥作用,对输入内容进行分析,违规的输入将被过滤,并拒绝回答。

如果输入的内容正常,但大模型因为偏见或幻觉等原因,输出内容存在违规风险时,360安全回复大模型也会对输出内容进行优化,进行安全改写,进而确保输入、输出都是安全的。

针对大模型的幻觉问题,企业可以通过收集整理企业或行业知识,构建专属知识库方式,对专业领域知识提供通用大模型无法解答的精准答案。同时,360也能发挥在搜索算法方面的优势,提供搜索增强组件以及RAG增强能力,通过算法干预对联网信息、企业知识库进行更好的整合,从而缓解幻觉问题。

数据显示,使用360搜索技术进行RAG增强后,相比裸模型回答的幻觉比例下降50%,用户整体体验提升30%。

针对Agent安全问题,360正在通过原生安全的Ai Agent可控框架,对大模型的场景进行统一编排调用。在Agent可控框架中原生设置安全措施,保证大模型的“手和脚”可控,把大模型能力关在笼子里。

在这个过程中,需要Agent平台实现任务规划全程监督,对工具、插件、API的调用过程进行监控、记录。比如,对断电、重启、删除数据文件这样的关键动作,需要通过人工审批判断。针对Agent执行过程中的安全风险,还需要构建Agent行为沙箱,通过模拟智能体执行的各类环境,部署行为采集探针,建立行为评价算法,实现对Agent执行过程中全生命周期行为的安全评估。如此一来,能够及时发现恶意行为,实现动态安全防护。

在这场变革中,360的角色正在发生跃迁。

它一方面是“安全方案供应商”,通过360智鉴、360智盾等核心产品,构建起全链条能力。另一方面,它逐渐成为“规则制定者”,在安全联盟里发挥领头羊作用,并通过制定安全标准推动行业发展。

未来,当大模型深入到社会的各个领域,它将成为国家级别的“基础设施”。而360更深层的价值,是成为AI时代的核心基建商,即通过标准、数据和生态的“三位一体”,成为AI安全的基底。这时候,它的价值将从用户和商业维度,攀升到更高阶的社会维度。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
拉波尔塔:梅西父亲曾亲自来我家,告诉我加盟迈阿密更好

拉波尔塔:梅西父亲曾亲自来我家,告诉我加盟迈阿密更好

懂球帝
2026-03-10 10:07:53
伊朗副总统称将继续捍卫国土 未放弃通过谈判解决问题

伊朗副总统称将继续捍卫国土 未放弃通过谈判解决问题

新华社
2026-03-11 02:42:06
前TVB御用奸人罕回港驚變白頭翁戾氣全消,離巢後事業家庭兩得意

前TVB御用奸人罕回港驚變白頭翁戾氣全消,離巢後事業家庭兩得意

粤睇先生
2026-03-10 19:44:04
旧金山唐人街突发血案:华人等红灯被捅倒地,旁边店员拿“速冻饺子”救命

旧金山唐人街突发血案:华人等红灯被捅倒地,旁边店员拿“速冻饺子”救命

华人生活网
2026-03-10 04:33:56
中国女排历史上最厉害的主攻是谁?王一梅只能排第三

中国女排历史上最厉害的主攻是谁?王一梅只能排第三

老高说体育
2026-03-10 10:21:10
乌军425团横扫库皮扬斯克核心据点,俄军残部尽数覆灭

乌军425团横扫库皮扬斯克核心据点,俄军残部尽数覆灭

老马拉车莫少装
2026-03-08 13:59:40
谢贤丢脸丢大了!前女友CoCo仍在换号直播,坦言自己家非常传统!

谢贤丢脸丢大了!前女友CoCo仍在换号直播,坦言自己家非常传统!

娱乐团长
2026-03-08 20:39:39
60岁以后富养自己的10大黄金法则,全占,妥妥的高智商老人

60岁以后富养自己的10大黄金法则,全占,妥妥的高智商老人

暖风吹过竹林
2026-02-16 16:47:43
人大代表建议每年给私家车2000公里高速免费额度

人大代表建议每年给私家车2000公里高速免费额度

界面新闻
2026-03-10 17:04:14
大米江湖的暗战:那些超市里的“陷阱米”,正在偷走你的钱和健康

大米江湖的暗战:那些超市里的“陷阱米”,正在偷走你的钱和健康

富贵说
2026-01-18 20:36:10
特朗普:美国愿接纳伊朗女足,但因家人遭威胁,部分球员冒死回国

特朗普:美国愿接纳伊朗女足,但因家人遭威胁,部分球员冒死回国

风过乡
2026-03-10 06:25:58
特朗普:我们已经赢了,但还没赢够,摧毁了伊朗超90%导弹发射器!伊朗:拥有“更强大、数量更多”导弹,给美国人“准备了许多惊喜”

特朗普:我们已经赢了,但还没赢够,摧毁了伊朗超90%导弹发射器!伊朗:拥有“更强大、数量更多”导弹,给美国人“准备了许多惊喜”

每日经济新闻
2026-03-10 11:10:46
《我的山与海》结局:刘柱锒铛入狱,李娟死两任丈夫,李行客逆袭

《我的山与海》结局:刘柱锒铛入狱,李娟死两任丈夫,李行客逆袭

草莓解说体育
2026-03-10 17:55:40
什么事让你瞬间感到毛骨悚然?网友:从此再没见过她老公发脾气

什么事让你瞬间感到毛骨悚然?网友:从此再没见过她老公发脾气

另子维爱读史
2026-03-10 23:08:46
礒部花凜高清性感写真颜值与实力并存

礒部花凜高清性感写真颜值与实力并存

橙星文娱
2026-02-27 10:50:03
欧冠淘汰赛!英超2队有望进8强,巴萨或独撑西甲门面,拜仁无悬念

欧冠淘汰赛!英超2队有望进8强,巴萨或独撑西甲门面,拜仁无悬念

体育知多少
2026-03-10 09:54:25
江苏一小学女教师刚辞世,丈夫离世不到百天,7岁小女儿独留家中

江苏一小学女教师刚辞世,丈夫离世不到百天,7岁小女儿独留家中

水泥土的搞笑
2026-03-10 07:08:42
两会热点丨代表建言打造服务“面向国际”的国家级绿色算力枢纽

两会热点丨代表建言打造服务“面向国际”的国家级绿色算力枢纽

中国经济时报
2026-03-10 09:26:04
“半裙+德训鞋”原来可以这么好看,这么穿又飒又美!

“半裙+德训鞋”原来可以这么好看,这么穿又飒又美!

何有强
2026-03-10 17:52:22
「养龙虾」翻车实录:D盘没了、账号废了、余额清空了……

「养龙虾」翻车实录:D盘没了、账号废了、余额清空了……

机器之心Pro
2026-03-10 18:51:15
2026-03-11 04:39:00
一点财经
一点财经
财经深度报道 一点财经就够了
2232文章数 14667关注度
往期回顾 全部

科技要闻

全民"养虾"背后:大厂集体下场疯狂卖Token

头条要闻

伊朗新最高领袖在袭击中受伤未公开发表讲话 官方回应

头条要闻

伊朗新最高领袖在袭击中受伤未公开发表讲话 官方回应

体育要闻

加兰没那么差,但鲈鱼会用吗?

娱乐要闻

《逐玉》注水风波升级!315评论区沦陷

财经要闻

“龙虾补贴”密集出炉 最高1000万!

汽车要闻

MG4有SUV衍生 上汽乘用车多款新车规划曝光

态度原创

手机
艺术
教育
房产
数码

手机要闻

M5 Max 版 16 英寸 MacBook Pro 体验:算力巅峰与专业视界

艺术要闻

震撼!美国油画家约书亚·拉洛克的作品让人惊叹不已!

教育要闻

【现货】英语不会?背!主题演讲不会?背!笔试不会?背!!

房产要闻

信号!千亿巨头入局,三亚开启新一轮大征拆!

数码要闻

M5 Max 版 16 英寸 MacBook Pro 体验:算力巅峰与专业视界

无障碍浏览 进入关怀版