网易首页 > 新闻中心 > 新闻 > 正文

中国联通开源国内首个安全增强满血版DeepSeek-R1并上线元景MaaS平台

0
分享至

DeepSeek-R1模型凭借其卓越的推理性能与开源战略,正在重塑全球人工智能的未来格局。然而,业界大量评测工作显示开源的DeepSeek-R1满血版模型存在安全短板,这制约了DeepSeek-R1实际落地应用。此外,DeepSeek-R1满血版模型参数量大,涉及底层技术多,对其微调资源消耗大、技术门槛高,因此中国联通数据科学与人工智能研究院秉持央企担当持续攻坚克难,于近日完成了DeepSeek-R1满血版安全增强模型研发,实现保持模型原始推理能力的同时,安全能力显著提升。

目前,DeepSeek-R1满血版安全增强模型作为多模共生的元景模型家族的一员,已上线元景MaaS平台并对外开放试用,提供普惠速成的大模型开发应用工具。

安全增强版模型DeepSeek-R1-Safe上线元景MaaS平台

安全增强前后实际效果对比

下图示例展示了DeepSeek-R1安全增强前后的能力差异。可以看到,在涉及社会主流价值观等方面的问题,DeepSeek-R1安全增强版都能给出更安全、更符合社会主义核心价值观的回答。

保持原始推理能力,显著提升安全能力

中国联通采用自主研发的中文安全评测基准CHiSafetyBench对原版DeepSeek-R1及其安全增强版本进行安全能力评测。该基准评测任务分为两大类型:风险内容识别的选择题与风险问题拒答的问答题。同时,为评估安全改造后的模型的推理能力,采用MATH-500、GPQA、LiveCodeBench三个推理权威基准对模型进行测试,以观察安全增强方法对DeepSeek-R1的推理能力的影响。

安全基准评测结果

推理基准评测结果

从评测结果可见,在对DeepSeek-R1进行安全微调增强后,模型在风险内容识别准确率上提升近20%,对风险问题的拒答率提升超13%,责任回复率提升超11%,有害回复数量降至0,实现回复完全无害。同时模型在数学、逻辑、代码生成等方面的推理能力未受明显影响。

安全增强方法

针对DeepSeek-R1的安全性问题,中国联通数据科学与人工智能研究院使用自主构建的专用安全思维链数据对模型微调,在国产化平台上对DeepSeek-R1满血版进行微调训练。其中,安全增强数据由两部分组成:聚焦歧视、侵权等关键领域的安全数据以及通用思维链推理数据。安全数据显著拓展模型安全的广度与深度,更全面地覆盖潜在的安全风险场景。思维链推理数据的加入可确保提升模型安全性能的同时,保持其原始推理能力,从而实现安全与推理能力的平衡优化。

基于DeepSeek-R1模型做再训练是实现DeepSeek-R1安全改造的关键能力,中国联通数据科学与人工智能研究院基于此能力已形成元景大模型MaaS平台上的“改模型”工具,打造了端到端模型服务安全工具链,MaaS平台及其关键组件RAG、智能体均获得工信部中国软件测评中心大模型安全性测评4+级(最高级)认证。

未来,中国联通将持续推进DeepSeek-R1模型的安全研究,不断优化模型安全增强方法和评测基准,并向业界持续公开最新研究成果。中国联通愿与行业伙伴携手,共同提升大模型的安全可信能力,加速大模型普惠化进程,为人工智能赋能千行百业保驾护航。

模型开源地址如下:

GitHub:https://github.com/UnicomAI/DeepSeek-R1-Safe

魔搭:https://www.modelscope.cn/models/UnicomAI/Unichat-DeepSeek-R1-Safe-bf16

https://www.modelscope.cn/models/UnicomAI/Unichat-DeepSeek-R1-Safe-w8a8

相关推荐
热点推荐
是巧合,还是冥冥中自有天意?3位航天员连“名字”都这么巧

是巧合,还是冥冥中自有天意?3位航天员连“名字”都这么巧

快看张同学
2026-03-13 10:37:40
不走霍尔木兹海峡了,各国准备挖运河?

不走霍尔木兹海峡了,各国准备挖运河?

谭老师地理大课堂
2026-03-15 20:11:12
伊朗说逮捕10名不明国籍间谍

伊朗说逮捕10名不明国籍间谍

新华社
2026-03-17 15:05:02
杜兰特:火箭输球责任在我 就算申京范弗利特在场对方也会包夹我

杜兰特:火箭输球责任在我 就算申京范弗利特在场对方也会包夹我

罗说NBA
2026-03-17 13:30:00
几乎全是假货!利润高达2400%,咋消费者还前赴后继争相购买?

几乎全是假货!利润高达2400%,咋消费者还前赴后继争相购买?

世界圈
2026-02-12 17:04:31
不可错过!3月17日下午17:00!中央5套CCTV5、CCTV5+直播表

不可错过!3月17日下午17:00!中央5套CCTV5、CCTV5+直播表

皮皮观天下
2026-03-17 15:42:19
32岁奥运冠军马林将出战羽毛球欧锦赛,或将迎来谢幕之战

32岁奥运冠军马林将出战羽毛球欧锦赛,或将迎来谢幕之战

懂球帝
2026-03-17 14:12:06
为什么有个漂亮老婆还是想要分 网友讲出自身经历真是一言难尽

为什么有个漂亮老婆还是想要分 网友讲出自身经历真是一言难尽

侃神评故事
2026-03-10 18:50:04
2026中超第3轮前瞻:唯河南队胜率较高,其余7组对决胜负难料

2026中超第3轮前瞻:唯河南队胜率较高,其余7组对决胜负难料

郝小小看体育
2026-03-17 13:47:38
国家安全部发布“龙虾”安全养殖手册

国家安全部发布“龙虾”安全养殖手册

澎湃新闻
2026-03-17 07:34:06
霍尔木兹海峡,大消息!特朗普最新发声!美股、黄金突变!原油暴跌

霍尔木兹海峡,大消息!特朗普最新发声!美股、黄金突变!原油暴跌

证券时报e公司
2026-03-17 07:54:29
卖掉松江房,梭哈上海核心区,45天我亏掉半生积蓄

卖掉松江房,梭哈上海核心区,45天我亏掉半生积蓄

流苏晚晴
2026-03-16 19:41:26
中美考虑建立促进双边贸易投资合作的工作机制

中美考虑建立促进双边贸易投资合作的工作机制

界面新闻
2026-03-17 06:59:32
全线拉升!刚刚,12.67万人爆仓!伊朗局势,传出大消息!

全线拉升!刚刚,12.67万人爆仓!伊朗局势,传出大消息!

数据宝
2026-03-17 10:59:34
蚂蚁集团董事长井贤栋向上海交大捐赠1.3亿

蚂蚁集团董事长井贤栋向上海交大捐赠1.3亿

新浪财经
2026-03-17 14:17:19
1960年,烈士赵一曼儿子写信讽刺毛主席,主席看后只回复了6个字

1960年,烈士赵一曼儿子写信讽刺毛主席,主席看后只回复了6个字

小莜读史
2026-03-04 15:56:32
石正丽课题组公开招聘

石正丽课题组公开招聘

生物学霸
2026-03-15 17:15:28
上港幸好没留下他!本赛季在新东家踢主力中卫,却两场比赛丢九球

上港幸好没留下他!本赛季在新东家踢主力中卫,却两场比赛丢九球

张丽说足球
2026-03-17 12:10:19
为了给前NBA状元霍华德生孩子,篮球宝贝壮壮究竟付出了多大代价

为了给前NBA状元霍华德生孩子,篮球宝贝壮壮究竟付出了多大代价

罗氏八卦
2026-03-10 18:00:03
布鲁克林 & 尼古拉奥斯卡派对合体,黑色情侣装高调撒糖

布鲁克林 & 尼古拉奥斯卡派对合体,黑色情侣装高调撒糖

述家娱记
2026-03-17 15:20:22
2026-03-17 17:40:49

头条要闻

媒体:伊朗亮出王牌"泥石"导弹 标志着冲突全面升级

头条要闻

媒体:伊朗亮出王牌"泥石"导弹 标志着冲突全面升级

体育要闻

那个男人34岁拒绝买断 他要给状元当导师

娱乐要闻

姚晨曹郁发离婚声明 凌潇肃评论区沦陷

财经要闻

多款药品被曝线上线下价差巨大

科技要闻

3万字实录|黄仁勋:每家公司都必须懂养虾

汽车要闻

10分钟电量20%→97% 低温实测比亚迪闪充

态度原创

教育
旅游
房产
家居
公开课

教育要闻

雅思词汇解析(172)| 微笑

旅游要闻

快来长河公园,赴一场春日桃花之约!

房产要闻

炸裂!狂拆642亩!那个要砸100亿的三亚香港城来了!

家居要闻

侘寂美学 无用之美

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版