网易首页 > 网易号 > 正文 申请入驻

国产大模型再创新!“安全增强版DeepSeek”来了

0
分享至

来源:新华网

新华网北京2月24日电(记者张漫子)“安全增强版DeepSeek”来了。清华大学与瑞莱智慧联合团队23日推出大语言模型RealSafe-R1,基于DeepSeek R1进行深度优化与后训练,在性能稳定的基础上,实现了安全性的显著提升,为开源大模型安全发展与风险治理提供了创新解决方案。

连日来,国产开源大模型DeepSeek的优异表现令人惊艳,其在自然语言处理和多任务推理方面的能力展现了强大的技术实力,尤其是在复杂问题解决和创造性任务中表现出色。然而DeepSeek-R1和DeepSeek-V3在面对供给等安全挑战时仍存一定局限。例如,模型可能会被恶意设计的输入误导,生成不符合预期或不安全的响应。

“这一安全短板并非DeepSeek所独有的难题,而是当前开源大模型的通病,其根本缺陷源于安全对齐机制的不足。”瑞莱智慧首席执行官田天告诉记者。

为此,清华大学与瑞莱智慧联合团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化,可以应用于多种开源、闭源模型。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间“跷跷板”现象,不仅为DeepSeek生态添砖加瓦,也为大语言模型树立了安全标杆。

记者了解到,RealSafe-R1各尺寸模型及数据集将于近期开源。“只有通过持续投入和攻坚补齐短板弱项,人工智能产业才能真正实现高质量发展。”田天说,这一成果将为开源大模型的安全性加固提供有力支持,也为政务、金融、医疗等场景应用提供更可靠、更坚实的基座。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
杨瀚森机会来了!开拓者交易替补中锋,还会有后续运作,乐福获利

杨瀚森机会来了!开拓者交易替补中锋,还会有后续运作,乐福获利

你的篮球频道
2026-02-02 06:53:14
山东小伙娶只有8岁智商的新娘,笑的合不拢嘴,网友:赚大了

山东小伙娶只有8岁智商的新娘,笑的合不拢嘴,网友:赚大了

静若梨花
2026-02-01 16:39:42
王晶没撒谎!退出春晚、和沈腾决裂,性格大变的贾玲印证他说的话

王晶没撒谎!退出春晚、和沈腾决裂,性格大变的贾玲印证他说的话

古事寻踪记
2026-01-30 07:23:10
西方国家领导人为何密集访华?BBC记者解读很到位

西方国家领导人为何密集访华?BBC记者解读很到位

潇湘晨报
2026-01-31 22:11:12
方力申因家族传统二胎想生儿子:希望能追生男孩延续姓氏,自己年龄不小,但需尊重太太产后恢复意愿

方力申因家族传统二胎想生儿子:希望能追生男孩延续姓氏,自己年龄不小,但需尊重太太产后恢复意愿

扬子晚报
2026-02-01 15:44:47
中国男篮VS日本队!郭士强拒绝输球,胡金秋领衔,央视直播

中国男篮VS日本队!郭士强拒绝输球,胡金秋领衔,央视直播

体坛瞎白话
2026-02-02 08:29:49
女人穿长靴的狠活!靴筒捂得严,却比丝袜更勾人

女人穿长靴的狠活!靴筒捂得严,却比丝袜更勾人

锋哥与八卦哥
2026-01-15 14:17:42
2-0!意甲争冠几无悬念:国米领先8分一骑绝尘,4强队+1黑马争四

2-0!意甲争冠几无悬念:国米领先8分一骑绝尘,4强队+1黑马争四

体育知多少
2026-02-02 07:26:59
认知颠覆,美国移民被合法吃绝户,十年时间,全美移民资产跌9成

认知颠覆,美国移民被合法吃绝户,十年时间,全美移民资产跌9成

孤单是寂寞的毒
2026-01-30 20:19:03
年底聚会,记得:抽3种烟的人别理,点3种菜的人别交,真的很准

年底聚会,记得:抽3种烟的人别理,点3种菜的人别交,真的很准

神牛
2026-01-13 10:24:10
72岁老戏骨濮存昕官宣外孙女出道,尖嘴猴腮,长相遭吐槽:太丑了

72岁老戏骨濮存昕官宣外孙女出道,尖嘴猴腮,长相遭吐槽:太丑了

深析古今
2025-12-08 12:29:36
14投仅9分!20投仅14分!再这么打下去,你不配进全明星

14投仅9分!20投仅14分!再这么打下去,你不配进全明星

世界体育圈
2026-02-02 00:25:03
中东国家都已意识到了!就算中国高端武器再多,也无法保护他们

中东国家都已意识到了!就算中国高端武器再多,也无法保护他们

轩逸阿II
2026-01-14 04:20:15
居然要下架板蓝根颗粒、牛黄上清丸、养阴清肺丸、感冒清热颗粒

居然要下架板蓝根颗粒、牛黄上清丸、养阴清肺丸、感冒清热颗粒

百态人间
2026-01-30 15:30:24
简直是离谱!马斯克宣布将年产 1000 万台人形机器人

简直是离谱!马斯克宣布将年产 1000 万台人形机器人

XCiOS俱乐部
2026-02-01 13:44:39
史诗级暴跌之后,周末暗盘继续下挫,下周黄金白银将何去何从?

史诗级暴跌之后,周末暗盘继续下挫,下周黄金白银将何去何从?

东方豪侠
2026-02-01 09:22:01
失业的人越来越多了

失业的人越来越多了

曹多鱼的财经世界
2025-12-24 14:56:20
为什么我国一直在避免被划为“发达国家”?因为发达就得承担义务

为什么我国一直在避免被划为“发达国家”?因为发达就得承担义务

我心纵横天地间
2026-01-18 14:56:14
炸锅!2026高考时间大调整!千万考生受影响

炸锅!2026高考时间大调整!千万考生受影响

老特有话说
2026-01-30 23:06:47
辞职看世界女老师11年后现状:黯然回乡,老公已分手

辞职看世界女老师11年后现状:黯然回乡,老公已分手

咸鱼金脑袋
2026-01-17 07:06:46
2026-02-02 09:52:50
环球网资讯 incentive-icons
环球网资讯
环球网,了解世界,融入世界
1320867文章数 2709034关注度
往期回顾 全部

科技要闻

10亿元宝红包突袭 复刻微信支付还是微视?

头条要闻

牛弹琴:欧洲终于开骂了 特朗普可能会气到咆哮

头条要闻

牛弹琴:欧洲终于开骂了 特朗普可能会气到咆哮

体育要闻

德约大度祝贺阿卡 幽默互动逗笑纳达尔

娱乐要闻

春晚第三次联排阵容曝光:全是实力派

财经要闻

国六货车被迫"换头" 每次收费超200元

汽车要闻

岚图汽车1月交付10515辆 同比增长31%

态度原创

本地
数码
亲子
时尚
军事航空

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

数码要闻

2025年全球显示器市场出货1.28亿台 OLED占比激增

亲子要闻

2-5岁孩子如何在家做早教?用好这些小道具,孩子进步超快!

普通人衣服没必要买太多,准备好这些单品,简单实用又耐看

军事要闻

委内瑞拉外长会见美外交使团团长

无障碍浏览 进入关怀版