网易首页 > 新闻中心 > 新闻 > 正文

中国联通开源国内首个安全增强满血版DeepSeek-R1并上线元景MaaS平台

0
分享至

DeepSeek-R1模型凭借其卓越的推理性能与开源战略,正在重塑全球人工智能的未来格局。然而,业界大量评测工作显示开源的DeepSeek-R1满血版模型存在安全短板,这制约了DeepSeek-R1实际落地应用。此外,DeepSeek-R1满血版模型参数量大,涉及底层技术多,对其微调资源消耗大、技术门槛高,因此中国联通数据科学与人工智能研究院秉持央企担当持续攻坚克难,于近日完成了DeepSeek-R1满血版安全增强模型研发,实现保持模型原始推理能力的同时,安全能力显著提升。

目前,DeepSeek-R1满血版安全增强模型作为多模共生的元景模型家族的一员,已上线元景MaaS平台并对外开放试用,提供普惠速成的大模型开发应用工具。

安全增强版模型DeepSeek-R1-Safe上线元景MaaS平台

安全增强前后实际效果对比

下图示例展示了DeepSeek-R1安全增强前后的能力差异。可以看到,在涉及社会主流价值观等方面的问题,DeepSeek-R1安全增强版都能给出更安全、更符合社会主义核心价值观的回答。

保持原始推理能力,显著提升安全能力

中国联通采用自主研发的中文安全评测基准CHiSafetyBench对原版DeepSeek-R1及其安全增强版本进行安全能力评测。该基准评测任务分为两大类型:风险内容识别的选择题与风险问题拒答的问答题。同时,为评估安全改造后的模型的推理能力,采用MATH-500、GPQA、LiveCodeBench三个推理权威基准对模型进行测试,以观察安全增强方法对DeepSeek-R1的推理能力的影响。

安全基准评测结果

推理基准评测结果

从评测结果可见,在对DeepSeek-R1进行安全微调增强后,模型在风险内容识别准确率上提升近20%,对风险问题的拒答率提升超13%,责任回复率提升超11%,有害回复数量降至0,实现回复完全无害。同时模型在数学、逻辑、代码生成等方面的推理能力未受明显影响。

安全增强方法

针对DeepSeek-R1的安全性问题,中国联通数据科学与人工智能研究院使用自主构建的专用安全思维链数据对模型微调,在国产化平台上对DeepSeek-R1满血版进行微调训练。其中,安全增强数据由两部分组成:聚焦歧视、侵权等关键领域的安全数据以及通用思维链推理数据。安全数据显著拓展模型安全的广度与深度,更全面地覆盖潜在的安全风险场景。思维链推理数据的加入可确保提升模型安全性能的同时,保持其原始推理能力,从而实现安全与推理能力的平衡优化。

基于DeepSeek-R1模型做再训练是实现DeepSeek-R1安全改造的关键能力,中国联通数据科学与人工智能研究院基于此能力已形成元景大模型MaaS平台上的“改模型”工具,打造了端到端模型服务安全工具链,MaaS平台及其关键组件RAG、智能体均获得工信部中国软件测评中心大模型安全性测评4+级(最高级)认证。

未来,中国联通将持续推进DeepSeek-R1模型的安全研究,不断优化模型安全增强方法和评测基准,并向业界持续公开最新研究成果。中国联通愿与行业伙伴携手,共同提升大模型的安全可信能力,加速大模型普惠化进程,为人工智能赋能千行百业保驾护航。

模型开源地址如下:

GitHub:https://github.com/UnicomAI/DeepSeek-R1-Safe

魔搭:https://www.modelscope.cn/models/UnicomAI/Unichat-DeepSeek-R1-Safe-bf16

https://www.modelscope.cn/models/UnicomAI/Unichat-DeepSeek-R1-Safe-w8a8

相关推荐
热点推荐
老党员注意!2026“光荣在党50年”纪念章,满足3条件可申领

老党员注意!2026“光荣在党50年”纪念章,满足3条件可申领

周哥一影视
2026-03-12 15:38:26
阿拉伯、伊斯兰、穆斯林有什么联系与区别,究竟属于怎样的关系?

阿拉伯、伊斯兰、穆斯林有什么联系与区别,究竟属于怎样的关系?

长风文史
2026-03-11 19:08:09
女孩相亲被约挖野菜后续!男方独吞野菜还炫耀,母亲受牵连

女孩相亲被约挖野菜后续!男方独吞野菜还炫耀,母亲受牵连

天天热点见闻
2026-03-11 08:00:16
腾讯发文:非常紧张,尽量争取

腾讯发文:非常紧张,尽量争取

时间财经
2026-03-12 15:20:55
内存价格飙升无尽头!DDR5 32GB最低2500:再便宜直接秒没

内存价格飙升无尽头!DDR5 32GB最低2500:再便宜直接秒没

快科技
2026-03-12 16:23:07
先丢一局后坚定战术!温瑞博3-1逆转莫雷加德晋级8强!

先丢一局后坚定战术!温瑞博3-1逆转莫雷加德晋级8强!

篮球资讯达人
2026-03-12 19:15:13
汉密尔顿晒九寨沟风景:我想分享给你们,向世界展示中国之美

汉密尔顿晒九寨沟风景:我想分享给你们,向世界展示中国之美

懂球帝
2026-03-12 02:02:05
马贵荣:孙越是我从小教出来的,但是,他拜石富宽,我没有不同意

马贵荣:孙越是我从小教出来的,但是,他拜石富宽,我没有不同意

离离言几许
2026-03-12 17:00:36
42男42女联谊会,只有5男被相中!网友:这就是大龄剩女多的原因

42男42女联谊会,只有5男被相中!网友:这就是大龄剩女多的原因

火山詩话
2026-03-12 12:10:27
千万不要和不是同一消费水平的朋友一起去旅游!去一次就受够了!

千万不要和不是同一消费水平的朋友一起去旅游!去一次就受够了!

深度报
2026-03-11 22:31:05
近万吨新疆三文鱼,都去哪了?

近万吨新疆三文鱼,都去哪了?

蓝鲸新闻
2026-03-11 10:28:48
老外对中国蔬菜消费感到震惊,竟认为是特权!

老外对中国蔬菜消费感到震惊,竟认为是特权!

特约前排观众
2026-02-24 00:15:08
注意!C1驾照迎来大调整,2026年3月20日起全国执行

注意!C1驾照迎来大调整,2026年3月20日起全国执行

娱乐圈的笔娱君
2026-03-12 01:04:54
战事升温,朝鲜开始上场,多国对美发出檄文,伊朗导弹发射率变了

战事升温,朝鲜开始上场,多国对美发出檄文,伊朗导弹发射率变了

策略述
2026-03-12 15:20:43
谁给的胆子?巴铁派战舰闯入波斯湾,居然是用中国武器叫板美伊!

谁给的胆子?巴铁派战舰闯入波斯湾,居然是用中国武器叫板美伊!

浯江孤舟
2026-03-12 15:30:32
阿斯:维尼修斯本来让巴尔韦德主罚点球,但被后者拒绝

阿斯:维尼修斯本来让巴尔韦德主罚点球,但被后者拒绝

懂球帝
2026-03-12 17:58:04
佛山本土知名上市企业高层换新

佛山本土知名上市企业高层换新

南方都市报
2026-03-12 18:03:25
上海提前还贷潮太猛,新政下银行却被集体“赎回”?

上海提前还贷潮太猛,新政下银行却被集体“赎回”?

慧眼看世界哈哈
2026-03-12 13:33:04
记者:瓜帅怎么会想到在伯纳乌派出四名前锋?这是瓜式失误

记者:瓜帅怎么会想到在伯纳乌派出四名前锋?这是瓜式失误

懂球帝
2026-03-12 14:58:07
杨瀚森16中14,狂轰31+8+3!创3项生涯新高,加盟开拓者真涨球了

杨瀚森16中14,狂轰31+8+3!创3项生涯新高,加盟开拓者真涨球了

球场没跑道
2026-03-12 12:38:18
2026-03-12 20:32:49

头条要闻

法院600万拍挂一辆布加迪跑车:不得上路行驶 曾上京牌

头条要闻

法院600万拍挂一辆布加迪跑车:不得上路行驶 曾上京牌

体育要闻

建议将“出球型门将”纳入反诈app

娱乐要闻

李湘瘦身惊艳亮相肖邦之夜 携女儿出席

财经要闻

卢锋:从特朗普团队群演看时代变局

科技要闻

当养虾人开始卸载,大厂的战争才真正开始

汽车要闻

大众2025财报:转型虽有阵痛 "大象"已然起跑

态度原创

游戏
房产
亲子
手机
军事航空

PSSR 2.0潜力巨大!现在入手PS5 Pro还不算晚?

房产要闻

唏嘘!三亚又一房企巨头破产,狂欠43亿甩卖资产!

亲子要闻

今天我们来吃一些开心搞怪的糖果食玩

手机要闻

存储芯片成本暴涨80%,3月起国产手机或迎来集体涨价潮

军事要闻

特朗普自行宣布对伊朗战争胜利

无障碍浏览 进入关怀版