网易首页 > 网易号 > 正文 申请入驻

赛迪研究院获得大模型安全人机对齐平台软著证书

0
分享至


近日,中国电子信息产业发展研究院(赛迪研究院)人工智能研究中心在大模型安全领域取得新进展,针对模型“幻觉”这一核心痛点探索出破解新思路 —— 提出融合“用户反馈数据+领域专家审批+模型数据微调”的闭环式大模型安全人机对齐方法,成功取得计算机软件著作权登记证书,旨在为我国人工智能产业安全可控、合规有序发展提供兼具创新性与实用性的新解决方案。

当前,国际学术界关注大模型对齐技术研究。Meta团队依托1000条精心设计的高质量样本,实现了超越传统大样本训练的对齐效果,凸显了高质量数据在模型对齐中的决定性价值。Skywork AI 与2050 Research团队联合发布专项研究,提出人机协同的大规模数据整理方案——作为RLHF的 “核心裁判”,奖励模型通过学习人类偏好为LLM 输出打分,直接指导后续强化学习优化。美国MIT与IBM Research团队研究揭示,单个用户仅通过提示词与反馈(点赞/点踩),即可向模型注入未授权知识并影响所有用户的使用结果。


▲大模型安全人机对齐核心流程

赛迪研究院人工智能研究中心提出的大模型安全人机对齐方法,整体流程分为四个核心阶段(如图1所示):(1)模型在线部署与实时交互,搭建用户、专家与模型的双向沟通载体,为反馈收集奠定基础;(2)多源反馈数据精准收集,同步整合用户真实使用反馈与领域专家专业意见,构建全面的反馈数据池;(3)高质量对齐数据构建与监督微调,将多源反馈转化为结构化训练数据,定向优化模型输出逻辑;(4)模型性能全方位评估与持续迭代,基于评估结果反哺反馈收集与微调环节,形成 “部署 - 收集 - 微调 - 评估” 的完整闭环。

赛迪研究院人工智能研究中心的方法构建了三大创新路径,形成差异化技术优势:一是全用户参与的双向批改机制,用户通过 “点赞 / 点踩+文字评语” 双维度对模型回答进行 “批改”,精准标记回答的准确性、安全性问题,有效弥补纯机器评估的盲区与局限性;二是跨行业专家权威排名体系,建立涵盖医疗、法律、工业、金融、能源等关键领域的专家库,按 “批改量 + 意见采纳率” 实施动态排名,确保反馈意见的专业性与权威性;三是闭环式定向微调优化,将专家优质批改意见结构化处理,形成专属高质量训练数据集,借鉴国际先进的小学习率微调经验,定向优化模型输出逻辑,显著降低模型事实错误率,同步提升不安全、不合规内容的拒答率。

▲大模型安全人机对齐计算机软著证书

未来,赛迪研究院人工智能研究中心将持续发挥国家级智库平台优势与行业资源整合能力,紧密围绕《深入实施“人工智能+”的指导意见》《生成式人工智能服务管理暂行办法》等国家政策要求,聚焦大模型安全治理的核心需求,切实以技术创新响应国家战略部署,以实践成果护航人工智能产业高质量发展。

来源 | 网络安全和数据安全研究测评事业部 产品检测室

编辑 | 办公室



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
日内瓦三方博弈,泽连斯基拒绝投降协议

日内瓦三方博弈,泽连斯基拒绝投降协议

山河路口
2026-02-18 13:22:17
大爷花700万买房,4年后才发现房子有地下室,走近却愣住了

大爷花700万买房,4年后才发现房子有地下室,走近却愣住了

小秋情感说
2025-12-11 13:51:27
天生自带光环的3个生肖:不卷不内耗,走到哪都像被命运偏爱!

天生自带光环的3个生肖:不卷不内耗,走到哪都像被命运偏爱!

毅谈生肖
2026-02-19 17:50:42
“戏混子”没走,比资本家丑孩子更可怕的是“星二代”开始世袭了

“戏混子”没走,比资本家丑孩子更可怕的是“星二代”开始世袭了

流史岁月
2026-01-26 10:58:30
安徽36岁女子偶遇前夫送外卖笑得心花怒放,前夫哥:自由

安徽36岁女子偶遇前夫送外卖笑得心花怒放,前夫哥:自由

观察鉴娱
2026-02-16 11:53:13
春晚那几个翻跟头的机器人,把美国五角大楼吓出一身冷汗

春晚那几个翻跟头的机器人,把美国五角大楼吓出一身冷汗

温言拾光
2026-02-19 11:01:40
医生发现:经常走路锻炼的脑梗人,过不了几月,身体会迎来6好处

医生发现:经常走路锻炼的脑梗人,过不了几月,身体会迎来6好处

蜉蝣说
2026-02-16 22:04:55
事实证明,吃完贾玲“红利”的张小斐,如今又回到了她的“怪圈”

事实证明,吃完贾玲“红利”的张小斐,如今又回到了她的“怪圈”

小熊侃史
2026-02-11 12:56:17
如伊朗不能给川普能源矿产、并让驻军和开放,美以就会打,很快啊

如伊朗不能给川普能源矿产、并让驻军和开放,美以就会打,很快啊

邵旭峰域
2026-02-19 16:05:03
16岁读博的神童张炘炀,如今无业躺平啃老,坦然承认:我不是神童

16岁读博的神童张炘炀,如今无业躺平啃老,坦然承认:我不是神童

梦史
2025-12-27 10:38:02
中国为何要禁枪?1993年湖南2村械斗堪比战争,5000人混战34小时

中国为何要禁枪?1993年湖南2村械斗堪比战争,5000人混战34小时

卡索
2024-06-28 10:32:05
重要赛事!2月19晚上21:00!中央5套CCTV5、CCTV5+直播节目表

重要赛事!2月19晚上21:00!中央5套CCTV5、CCTV5+直播节目表

皮皮观天下
2026-02-19 15:20:11
记者:如果詹姆斯愿意大幅降薪,今夏他有99%可能性与骑士签约

记者:如果詹姆斯愿意大幅降薪,今夏他有99%可能性与骑士签约

懂球帝
2026-02-19 15:20:07
邓超春晚结束后,立马邀请迟蓬到家中做客,迟蓬的回复让人笑翻

邓超春晚结束后,立马邀请迟蓬到家中做客,迟蓬的回复让人笑翻

小娱乐悠悠
2026-02-19 11:03:31
你在体制内捅过的最大篓子是啥? 网友:人怎么能捅这么大的篓子

你在体制内捅过的最大篓子是啥? 网友:人怎么能捅这么大的篓子

带你感受人间冷暖
2026-02-13 10:06:39
钱再多有什么用?52岁刘强东上千亿身家,儿子却是他一生的遗憾

钱再多有什么用?52岁刘强东上千亿身家,儿子却是他一生的遗憾

墨印斋
2026-01-31 16:37:48
克劳德太香了!刘祝润练级成功 李帅杨希两翼齐飞 两大新援存隐患

克劳德太香了!刘祝润练级成功 李帅杨希两翼齐飞 两大新援存隐患

刀锋体育
2026-02-19 17:44:58
“性萧条”才是这个时代真正的危机

“性萧条”才是这个时代真正的危机

深蓝夜读
2025-09-24 16:00:09
体制内公示期有多恐怖?过来人说出实情:能捅你一刀的,都是熟人

体制内公示期有多恐怖?过来人说出实情:能捅你一刀的,都是熟人

妍妍教育日记
2026-01-10 12:48:21
匈牙利、斯洛伐克宣布暂停向乌克兰出口柴油

匈牙利、斯洛伐克宣布暂停向乌克兰出口柴油

财联社
2026-02-18 23:58:05
2026-02-19 18:56:49
中国电子信息产业发展研究院 incentive-icons
中国电子信息产业发展研究院
工信部直属的科研事业单位
2894文章数 911关注度
往期回顾 全部

科技要闻

怒烧45亿,腾讯字节阿里决战春节

头条要闻

媒体:高市2.0 日本政局发生了意料之中的变动

头条要闻

媒体:高市2.0 日本政局发生了意料之中的变动

体育要闻

中国队第二金!徐梦桃赢女子空中技巧两连冠 邵琪铜牌

娱乐要闻

明星过年百态!黄晓明等现身三亚

财经要闻

面条火腿香菇酱!上市公司这些年请你吃

汽车要闻

量产甲醇插混 吉利银河星耀6甲醇插混版申报图

态度原创

亲子
时尚
健康
房产
本地

亲子要闻

过年期间这几样东西,一口都不要给孩子吃!

冬季穿衣不用太复杂!内搭选高领、外套选简约款,大方又耐看

转头就晕的耳石症,能开车上班吗?

房产要闻

顶豪抢房潮席卷全国! 中旅馥棠公馆项目395㎡大平层加推入市!

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

无障碍浏览 进入关怀版