网易首页 > 新闻中心 > 新闻 > 正文

中国联通开源国内首个安全增强满血版DeepSeek-R1并上线元景MaaS平台

0
分享至

DeepSeek-R1模型凭借其卓越的推理性能与开源战略,正在重塑全球人工智能的未来格局。然而,业界大量评测工作显示开源的DeepSeek-R1满血版模型存在安全短板,这制约了DeepSeek-R1实际落地应用。此外,DeepSeek-R1满血版模型参数量大,涉及底层技术多,对其微调资源消耗大、技术门槛高,因此中国联通数据科学与人工智能研究院秉持央企担当持续攻坚克难,于近日完成了DeepSeek-R1满血版安全增强模型研发,实现保持模型原始推理能力的同时,安全能力显著提升。

目前,DeepSeek-R1满血版安全增强模型作为多模共生的元景模型家族的一员,已上线元景MaaS平台并对外开放试用,提供普惠速成的大模型开发应用工具。

安全增强版模型DeepSeek-R1-Safe上线元景MaaS平台

安全增强前后实际效果对比

下图示例展示了DeepSeek-R1安全增强前后的能力差异。可以看到,在涉及社会主流价值观等方面的问题,DeepSeek-R1安全增强版都能给出更安全、更符合社会主义核心价值观的回答。

保持原始推理能力,显著提升安全能力

中国联通采用自主研发的中文安全评测基准CHiSafetyBench对原版DeepSeek-R1及其安全增强版本进行安全能力评测。该基准评测任务分为两大类型:风险内容识别的选择题与风险问题拒答的问答题。同时,为评估安全改造后的模型的推理能力,采用MATH-500、GPQA、LiveCodeBench三个推理权威基准对模型进行测试,以观察安全增强方法对DeepSeek-R1的推理能力的影响。

安全基准评测结果

推理基准评测结果

从评测结果可见,在对DeepSeek-R1进行安全微调增强后,模型在风险内容识别准确率上提升近20%,对风险问题的拒答率提升超13%,责任回复率提升超11%,有害回复数量降至0,实现回复完全无害。同时模型在数学、逻辑、代码生成等方面的推理能力未受明显影响。

安全增强方法

针对DeepSeek-R1的安全性问题,中国联通数据科学与人工智能研究院使用自主构建的专用安全思维链数据对模型微调,在国产化平台上对DeepSeek-R1满血版进行微调训练。其中,安全增强数据由两部分组成:聚焦歧视、侵权等关键领域的安全数据以及通用思维链推理数据。安全数据显著拓展模型安全的广度与深度,更全面地覆盖潜在的安全风险场景。思维链推理数据的加入可确保提升模型安全性能的同时,保持其原始推理能力,从而实现安全与推理能力的平衡优化。

基于DeepSeek-R1模型做再训练是实现DeepSeek-R1安全改造的关键能力,中国联通数据科学与人工智能研究院基于此能力已形成元景大模型MaaS平台上的“改模型”工具,打造了端到端模型服务安全工具链,MaaS平台及其关键组件RAG、智能体均获得工信部中国软件测评中心大模型安全性测评4+级(最高级)认证。

未来,中国联通将持续推进DeepSeek-R1模型的安全研究,不断优化模型安全增强方法和评测基准,并向业界持续公开最新研究成果。中国联通愿与行业伙伴携手,共同提升大模型的安全可信能力,加速大模型普惠化进程,为人工智能赋能千行百业保驾护航。

模型开源地址如下:

GitHub:https://github.com/UnicomAI/DeepSeek-R1-Safe

魔搭:https://www.modelscope.cn/models/UnicomAI/Unichat-DeepSeek-R1-Safe-bf16

https://www.modelscope.cn/models/UnicomAI/Unichat-DeepSeek-R1-Safe-w8a8

相关推荐
热点推荐
据说F35就是被伊朗这款武器击中的

据说F35就是被伊朗这款武器击中的

仰望星空的一粒沙子
2026-03-21 08:22:02
20万彩礼娶回个“祖宗”!班不上、活不干,一网友哭诉只会买买买

20万彩礼娶回个“祖宗”!班不上、活不干,一网友哭诉只会买买买

火山詩话
2026-03-21 09:38:42
做艺人没有艺德!在上海被抓捕的 4 位明星,你们知道都有谁吗?

做艺人没有艺德!在上海被抓捕的 4 位明星,你们知道都有谁吗?

她时尚丫
2026-02-17 21:56:13
男子凌晨起来上厕所,躲过一劫!警惕,这个“元凶”家家户户都有

男子凌晨起来上厕所,躲过一劫!警惕,这个“元凶”家家户户都有

上观新闻
2026-03-21 18:03:15
广东省退休人员迎来3个好消息:事关养老金、医保、丧葬费!

广东省退休人员迎来3个好消息:事关养老金、医保、丧葬费!

云鹏叙事
2026-03-21 16:16:05
真神仙专业!中国道教学院招生了,包含道教历史与神仙等5个专业,计划招30名本科生,16名研究生

真神仙专业!中国道教学院招生了,包含道教历史与神仙等5个专业,计划招30名本科生,16名研究生

观威海
2026-03-21 15:43:14
巴拿马这次的操作,真是把“国际玩笑”开成了天价账单

巴拿马这次的操作,真是把“国际玩笑”开成了天价账单

福建平子
2026-03-19 11:57:42
上证指数为什么会跌破4000点,接下来怎么办?

上证指数为什么会跌破4000点,接下来怎么办?

作家出版人姚茂敦
2026-03-20 16:52:21
拉莫斯:在工体比赛让我感到震撼,球场氛围就像我在德国踢球

拉莫斯:在工体比赛让我感到震撼,球场氛围就像我在德国踢球

懂球帝
2026-03-21 23:13:01
芯片专家:中国有1000多台ASML设备,有的设备竟然不拿来造芯片

芯片专家:中国有1000多台ASML设备,有的设备竟然不拿来造芯片

逍遥漠
2026-03-21 07:47:46
马筱梅坐完月子,汪小菲和儿子拍满月照,直播间笑得合不拢嘴

马筱梅坐完月子,汪小菲和儿子拍满月照,直播间笑得合不拢嘴

仙味少女心
2026-03-21 17:33:31
伊朗摊牌,战至最后一刻!特朗普划出新战场,美议员:局势已失控

伊朗摊牌,战至最后一刻!特朗普划出新战场,美议员:局势已失控

兵说
2026-03-20 13:22:32
美国敢不敢地面入侵伊朗?看这张地形图就懂了

美国敢不敢地面入侵伊朗?看这张地形图就懂了

舆图司马
2026-03-21 08:30:03
伊朗揪出81名内鬼,给中国敲响警钟,国安立即行动,果然抓到大鱼

伊朗揪出81名内鬼,给中国敲响警钟,国安立即行动,果然抓到大鱼

风眼军情
2026-03-19 20:04:48
0-4惨败!泰山不是输在球员,是输在不敢变、不会变

0-4惨败!泰山不是输在球员,是输在不敢变、不会变

体坛小鹏
2026-03-21 23:37:16
林良锋:只要曼联没赢,即是合理判罚

林良锋:只要曼联没赢,即是合理判罚

体坛周报
2026-03-21 14:38:12
演完《骄阳似我》马念媛又演《逐玉》,差点没认出来,还是很招恨

演完《骄阳似我》马念媛又演《逐玉》,差点没认出来,还是很招恨

喜欢历史的阿繁
2026-03-21 19:09:20
新冠后遗症对人体的最大影响,很多人深受其害,有些人还不自知

新冠后遗症对人体的最大影响,很多人深受其害,有些人还不自知

呼吸科大夫胡洋
2026-02-22 11:39:12
你以为坏了,其实都能吃的7种食物,要是扔掉就亏大了

你以为坏了,其实都能吃的7种食物,要是扔掉就亏大了

室内设计师有料儿
2026-03-21 16:29:09
孩子都是奔着妈妈来的!网友:我媳妇梦到的是大白蛇钻到她肚子里

孩子都是奔着妈妈来的!网友:我媳妇梦到的是大白蛇钻到她肚子里

带你感受人间冷暖
2026-03-14 00:10:08
2026-03-22 00:12:49

头条要闻

伊朗发射3800公里射程的导弹 最令美军战栗的细节披露

头条要闻

伊朗发射3800公里射程的导弹 最令美军战栗的细节披露

体育要闻

谁在决定字母哥未来?

娱乐要闻

田栩宁终于凉了?出轨风波影响恶劣

财经要闻

通胀警报拉响,加息潮要来了?

科技要闻

宇树招股书拆解,人形机器人出货量第一!

汽车要闻

小鹏汽车2025年Q4盈利净赚3.8亿 全年营收767亿

态度原创

数码
手机
旅游
房产
公开课

数码要闻

炸锅!国产存储芯片再突破!手机固态价格大跳水,内存自由要来了

手机要闻

终端市场集体喊“涨” 手机面板持续走“跌”

旅游要闻

这里藏了一场千人春日宴,深圳人都悄悄去了

房产要闻

全城狂送1000杯咖啡!网易房产【早C计划】,即刻启动!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版