网易首页 > 网易号 > 正文 申请入驻

NIST发布人工智能模型风险测试工具

0
分享至

美国商务部负责为美国政府、公司和广大公众开发和测试技术的机构--国家标准与技术研究院(NIST)重新发布了一个测试平台,旨在测量恶意攻击--尤其是"毒害"人工智能模型训练数据的攻击--会如何降低人工智能系统的性能。

这个模块化、开源的网络工具于2022年首次发布,名为Dioptra(取自经典的天文和测量仪器),旨在帮助训练人工智能模型的公司和使用这些模型的人评估、分析和跟踪人工智能风险。NIST 表示,Dioptra 可用于对模型进行基准测试和研究,还可提供一个通用平台,让模型在"红队"环境中面临模拟威胁。

"测试对抗性攻击对机器学习模型的影响是 Dioptra 的目标之一,"NIST 在一份新闻稿中写道。"这个开源软件就像生成可供免费下载的孩子一样,可以帮助包括政府机构和中小型企业在内的社区进行评估,以评估人工智能开发者对其系统性能的宣称。"

NIST DioptraDiatropa的界面截图

Dioptra与NIST和NIST最近成立的人工智能安全研究所的文件同时亮相,这些文件提出了减轻人工智能某些危险的方法,比如人工智能如何被滥用来生成未经同意的色情内容。在此之前,英国人工智能安全研究所(U.K. AI Safety Institute)也推出了"检查"(Inspect)工具包,该工具包同样旨在评估模型的能力和整体模型的安全性。去年 11 月,英国在布莱切利公园举行的人工智能安全峰会上宣布,美国和英国将继续合作,共同开发先进的人工智能模型测试。

Dioptra 也是乔-拜登(Joe Biden)总统关于人工智能的行政命令(EO)的产物,该行政命令(除其他事项外)要求 NIST 协助进行人工智能系统测试。与此相关,该行政令还制定了人工智能安全和安保标准,包括要求开发模型的公司(如苹果公司)在向公众部署模型之前,必须通知联邦政府并分享所有安全测试的结果。

正如我们之前所写,人工智能基准很难制定--其中最重要的原因是,目前最复杂的人工智能模型都是黑盒子,其基础设施、训练数据和其他关键细节都被创建模型的公司保密。英国研究人工智能的非营利性研究机构艾达-拉芙蕾丝研究所(Ada Lovelace Institute)本月发布的一份报告发现,仅靠评估不足以确定人工智能模型在现实世界中的安全性,部分原因是现行政策允许人工智能供应商有选择性地选择进行哪些评估。

NIST 并未断言 Dioptra 可以完全消除模型的风险。但该机构确实提出,Dioptra 可以揭示哪些类型的攻击可能会降低人工智能系统的性能,并量化这些攻击对性能的影响。

然而,Dioptra 的一个主要局限是,它只能在可下载和本地使用的模型(如 Meta 不断扩展的 Llama 系列)上开箱即用。像 OpenAI 的 GPT-4o 这样受 API 限制的模型,至少目前还不能使用。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
他是导致台湾难以收复的关键人物,若不是他,台湾或许早就解放了

他是导致台湾难以收复的关键人物,若不是他,台湾或许早就解放了

兵卒史
2026-06-10 04:40:13
汪小菲深夜和马筱梅街头发生争执,有人赶忙劝解,场面一度尴尬!

汪小菲深夜和马筱梅街头发生争执,有人赶忙劝解,场面一度尴尬!

阿凫爱吐槽
2025-04-07 10:41:46
申裕斌说,有很多教练都在帮助我研究孙颖莎,可孙颖莎只有邱贻可一个教练

申裕斌说,有很多教练都在帮助我研究孙颖莎,可孙颖莎只有邱贻可一个教练

星Xin辰大海
2026-06-21 00:05:44
世界杯主哨首秀 马宁掏6黄牌抢镜+拒判压哨点球 霸气喝退球员质疑

世界杯主哨首秀 马宁掏6黄牌抢镜+拒判压哨点球 霸气喝退球员质疑

我爱英超
2026-06-21 10:09:07
德国总理呼吁27国联手采用美国对付日本的方式对付中国

德国总理呼吁27国联手采用美国对付日本的方式对付中国

哎呀哎呀看电影
2026-06-21 22:50:24
阿斯:皇马不卖巴尔韦德,卡马文加和楚阿梅尼可出售

阿斯:皇马不卖巴尔韦德,卡马文加和楚阿梅尼可出售

懂球帝
2026-06-21 20:08:08
再次下跌!民调称内塔尼亚胡支持率已不足3成

再次下跌!民调称内塔尼亚胡支持率已不足3成

看看新闻Knews
2026-06-22 00:05:44
某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

番外行
2026-02-26 19:53:05
王俊杰:低迷的时候半夜找郭导聊天;我们距离强队还有很长一段路

王俊杰:低迷的时候半夜找郭导聊天;我们距离强队还有很长一段路

懂球帝
2026-06-21 23:33:29
向佐曝弟弟和父母断绝关系后,向太罕见给向佑留言,劝他做个好人

向佐曝弟弟和父母断绝关系后,向太罕见给向佑留言,劝他做个好人

小鋭有话说
2026-06-21 15:41:08
《天道》:什么是人脉?你同学是市局局长,你在超市打工,这不是人脉,你同学是局长,你是科长,这个才是人脉,人脉靠的不是巴结和讨好

《天道》:什么是人脉?你同学是市局局长,你在超市打工,这不是人脉,你同学是局长,你是科长,这个才是人脉,人脉靠的不是巴结和讨好

二胡的岁月如歌
2026-06-05 15:20:00
安妮·海瑟薇官宣怀三胎,结婚14年恩爱如初,出镜露孕肚温婉动人

安妮·海瑟薇官宣怀三胎,结婚14年恩爱如初,出镜露孕肚温婉动人

译言
2026-06-20 06:52:24
捂嘴说话,红牌罚下

捂嘴说话,红牌罚下

中国新闻周刊
2026-06-21 21:27:51
C罗女友乔治娜前后反差太大,从前清纯灵动如今臃肿像复刻卡戴珊

C罗女友乔治娜前后反差太大,从前清纯灵动如今臃肿像复刻卡戴珊

述家娱记
2026-06-20 20:27:52
拉文带娇妻看世界杯,只打39场,明年薪水4896万,娇妻很漂亮

拉文带娇妻看世界杯,只打39场,明年薪水4896万,娇妻很漂亮

乡野小珥
2026-06-21 15:49:45
演员吴玉芳与乒乓球名将丈夫江嘉良,在在龙门石窟景观前

演员吴玉芳与乒乓球名将丈夫江嘉良,在在龙门石窟景观前

娱你同欢
2026-06-21 21:15:26
深交所将迎来史上最大规模IPO

深交所将迎来史上最大规模IPO

界面新闻
2026-06-21 22:23:40
最高院:银行两次催收后超三个月仍不归还,即构成信用卡诈骗罪?

最高院:银行两次催收后超三个月仍不归还,即构成信用卡诈骗罪?

周军律师聊案子
2026-05-31 10:18:12
王老吉找挪威国脚哈兰德代言,真的太划算了!

王老吉找挪威国脚哈兰德代言,真的太划算了!

总在茶余后
2026-06-21 02:53:50
重伤!巴西7000万巨星世界杯基本报销 沙特为他送上1.7亿欧大合同

重伤!巴西7000万巨星世界杯基本报销 沙特为他送上1.7亿欧大合同

狍子歪解体坛
2026-06-20 23:49:24
2026-06-22 00:39:00
cnBeta.COM incentive-icons
cnBeta.COM
提供IT行业即时资讯
68766文章数 70215关注度
往期回顾 全部

科技要闻

马斯克拿下7800亿元天价薪酬 2028年可兑现

头条要闻

媒体:两大核武国家“水仗”升级 巴基斯坦陷入恐慌

头条要闻

媒体:两大核武国家“水仗”升级 巴基斯坦陷入恐慌

体育要闻

德国的超级替补,10年前还在工厂上班

娱乐要闻

原来她就是张颂文老婆

财经要闻

“床垫界的特斯拉”破产了

汽车要闻

惊出冷汗!重庆实测奥迪A5L,华为智驾这波操作绝了…

态度原创

本地
游戏
亲子
数码
公开课

本地新闻

龙腾资江 韵动邵阳

《STRANGER THAN HEAVEN》游先看试玩报告:散装拳脚,也可以很爽"/> 主站 商城 论坛 自运营 登录 注册 《STRANGER THA...

亲子要闻

阿宝表演单杠,考考小姨们帮我数6分钟荡了多少圈?老妈数晕了

数码要闻

极摩客EVO-X3 4T桌面AI超算中心即将预售 Lisa SU亲签

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版