网易首页 > 新闻中心 > 新闻 > 正文

中国联通开源国内首个安全增强满血版DeepSeek-R1并上线元景MaaS平台

0
分享至

DeepSeek-R1模型凭借其卓越的推理性能与开源战略,正在重塑全球人工智能的未来格局。然而,业界大量评测工作显示开源的DeepSeek-R1满血版模型存在安全短板,这制约了DeepSeek-R1实际落地应用。此外,DeepSeek-R1满血版模型参数量大,涉及底层技术多,对其微调资源消耗大、技术门槛高,因此中国联通数据科学与人工智能研究院秉持央企担当持续攻坚克难,于近日完成了DeepSeek-R1满血版安全增强模型研发,实现保持模型原始推理能力的同时,安全能力显著提升。

目前,DeepSeek-R1满血版安全增强模型作为多模共生的元景模型家族的一员,已上线元景MaaS平台并对外开放试用,提供普惠速成的大模型开发应用工具。

安全增强版模型DeepSeek-R1-Safe上线元景MaaS平台

安全增强前后实际效果对比

下图示例展示了DeepSeek-R1安全增强前后的能力差异。可以看到,在涉及社会主流价值观等方面的问题,DeepSeek-R1安全增强版都能给出更安全、更符合社会主义核心价值观的回答。

保持原始推理能力,显著提升安全能力

中国联通采用自主研发的中文安全评测基准CHiSafetyBench对原版DeepSeek-R1及其安全增强版本进行安全能力评测。该基准评测任务分为两大类型:风险内容识别的选择题与风险问题拒答的问答题。同时,为评估安全改造后的模型的推理能力,采用MATH-500、GPQA、LiveCodeBench三个推理权威基准对模型进行测试,以观察安全增强方法对DeepSeek-R1的推理能力的影响。

安全基准评测结果

推理基准评测结果

从评测结果可见,在对DeepSeek-R1进行安全微调增强后,模型在风险内容识别准确率上提升近20%,对风险问题的拒答率提升超13%,责任回复率提升超11%,有害回复数量降至0,实现回复完全无害。同时模型在数学、逻辑、代码生成等方面的推理能力未受明显影响。

安全增强方法

针对DeepSeek-R1的安全性问题,中国联通数据科学与人工智能研究院使用自主构建的专用安全思维链数据对模型微调,在国产化平台上对DeepSeek-R1满血版进行微调训练。其中,安全增强数据由两部分组成:聚焦歧视、侵权等关键领域的安全数据以及通用思维链推理数据。安全数据显著拓展模型安全的广度与深度,更全面地覆盖潜在的安全风险场景。思维链推理数据的加入可确保提升模型安全性能的同时,保持其原始推理能力,从而实现安全与推理能力的平衡优化。

基于DeepSeek-R1模型做再训练是实现DeepSeek-R1安全改造的关键能力,中国联通数据科学与人工智能研究院基于此能力已形成元景大模型MaaS平台上的“改模型”工具,打造了端到端模型服务安全工具链,MaaS平台及其关键组件RAG、智能体均获得工信部中国软件测评中心大模型安全性测评4+级(最高级)认证。

未来,中国联通将持续推进DeepSeek-R1模型的安全研究,不断优化模型安全增强方法和评测基准,并向业界持续公开最新研究成果。中国联通愿与行业伙伴携手,共同提升大模型的安全可信能力,加速大模型普惠化进程,为人工智能赋能千行百业保驾护航。

模型开源地址如下:

GitHub:https://github.com/UnicomAI/DeepSeek-R1-Safe

魔搭:https://www.modelscope.cn/models/UnicomAI/Unichat-DeepSeek-R1-Safe-bf16

https://www.modelscope.cn/models/UnicomAI/Unichat-DeepSeek-R1-Safe-w8a8

相关推荐
热点推荐
爱德华兹:100%健康的伦纳德是历史最佳之一,没人能阻挡他

爱德华兹:100%健康的伦纳德是历史最佳之一,没人能阻挡他

懂球帝
2026-03-12 20:50:28
曼晚记者:拉什福德很有可能回曼联,他在巴萨状态大幅下滑

曼晚记者:拉什福德很有可能回曼联,他在巴萨状态大幅下滑

懂球帝
2026-03-12 10:48:03
别人送你这3样东西,多半是瞧不起你、不尊重你,直接拒绝为好

别人送你这3样东西,多半是瞧不起你、不尊重你,直接拒绝为好

陌上桃花开的
2026-03-10 13:01:11
全红婵万家乐广告大片出炉,被吐槽像刘欢或者高晓松,太胖了!

全红婵万家乐广告大片出炉,被吐槽像刘欢或者高晓松,太胖了!

小娱乐悠悠
2026-03-10 11:54:20
舒马赫妻子科琳娜,照顾丈夫12年,花费超20亿,如今终于等到奇迹

舒马赫妻子科琳娜,照顾丈夫12年,花费超20亿,如今终于等到奇迹

寒士之言本尊
2026-01-28 16:12:08
日本懵了:导弹刚瞄向中国,就收到美国“战书”,特朗普访华有变

日本懵了:导弹刚瞄向中国,就收到美国“战书”,特朗普访华有变

林子说事
2026-03-12 20:11:19
19岁男子KTV上班,三名女孩来喝酒,男子下体过度使用成永久创伤

19岁男子KTV上班,三名女孩来喝酒,男子下体过度使用成永久创伤

丫头舫
2025-09-22 20:39:00
30分惨败!2大新援难挽3连败,CBA关键1战:青岛摧枯拉朽升第5!

30分惨败!2大新援难挽3连败,CBA关键1战:青岛摧枯拉朽升第5!

话体坛
2026-03-12 22:05:51
那年月,我们恃强凌弱,还觉得是伸张正义

那年月,我们恃强凌弱,还觉得是伸张正义

深度报
2026-03-11 20:40:41
惊人的穷人定律:越是贫穷的家庭,越喜欢让子女从事这3类工作,结果越来越穷

惊人的穷人定律:越是贫穷的家庭,越喜欢让子女从事这3类工作,结果越来越穷

谭老师地理大课堂
2026-02-03 20:53:42
伊朗都敢打美军基地,解放军凭啥不打?美专家:反华决战失算

伊朗都敢打美军基地,解放军凭啥不打?美专家:反华决战失算

沧海旅行家
2026-03-12 15:19:17
12年前,那个美国抓捕未果,入籍俄罗斯的斯诺登,如今过得怎样?

12年前,那个美国抓捕未果,入籍俄罗斯的斯诺登,如今过得怎样?

就一点
2026-03-08 23:09:47
伦纳德45分!快船153-128屠狼!诞生5个现实:2换1、2换5交易稳赚

伦纳德45分!快船153-128屠狼!诞生5个现实:2换1、2换5交易稳赚

毒舌NBA
2026-03-12 13:09:18
追觅发布汽车固态电池:计划年内小批量交付,2027年大规模量产

追觅发布汽车固态电池:计划年内小批量交付,2027年大规模量产

IT之家
2026-03-12 12:46:07
抓紧了!18岁华裔天才来华参赛:已多次入选澳大利亚国青队

抓紧了!18岁华裔天才来华参赛:已多次入选澳大利亚国青队

邱泽云
2026-03-12 17:14:10
伊朗人为何不惊慌?

伊朗人为何不惊慌?

西楼饮月
2026-03-11 20:59:17
美国现在彻底没希望了,因为已经遇到了,世界上最强大的大国崛起

美国现在彻底没希望了,因为已经遇到了,世界上最强大的大国崛起

林子说事
2026-03-12 20:19:23
伊朗大力抓“内鬼”:与民众紧密协作,打掉一个与美以勾连的武装团体!已逮捕30名间谍、10名革命卫队人员和81名在网上向境外提供情报者

伊朗大力抓“内鬼”:与民众紧密协作,打掉一个与美以勾连的武装团体!已逮捕30名间谍、10名革命卫队人员和81名在网上向境外提供情报者

每日经济新闻
2026-03-12 17:53:06
布伦特原油价格涨幅扩大至10%

布伦特原油价格涨幅扩大至10%

每日经济新闻
2026-03-12 10:43:05
巴尔韦德晒照庆祝取胜,克罗斯评论区留言:8

巴尔韦德晒照庆祝取胜,克罗斯评论区留言:8

懂球帝
2026-03-12 18:20:05
2026-03-13 02:23:00

头条要闻

伊朗:特朗普几条推文结束不了战争

头条要闻

伊朗:特朗普几条推文结束不了战争

体育要闻

建议将“出球型门将”纳入反诈app

娱乐要闻

贝克汉姆全家给27岁大布送生日祝福

财经要闻

卢锋:从特朗普团队群演看时代变局

科技要闻

当养虾人开始卸载,大厂的战争才真正开始

汽车要闻

大众2025财报:转型虽有阵痛 "大象"已然起跑

态度原创

游戏
本地
艺术
公开课
军事航空

《Apex英雄》“高达”联动访谈:尊敬原著,贴合游戏"/> 主站 商城 论坛 自运营 登录 注册 《Apex英雄》“高达”联动访谈:尊敬原著,贴合游戏 ...

本地新闻

坐标北京,过敏季反向迁徒

艺术要闻

深圳能源大厦,“看得我强迫症都要犯了”

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普自行宣布对伊朗战争胜利

无障碍浏览 进入关怀版