网易首页 > 网易号 > 正文 申请入驻

大模型安全国际标准发布,蚂蚁、OpenAI、科大讯飞等参与编制

0
分享至

4月15日-19日,第27届联合国科技大会在瑞士日内瓦召开。16日,在以“塑造AI的未来”为主题的AI边会上,世界数字技术院(WDTA)发布了一系列突破性成果,包括《生成式人工智能应用安全测试标准》和《大语言模型安全测试方法》两项国际标准。这是国际组织首次就大模型安全领域发布国际标准,代表全球人工智能安全评估和测试进入新的基准。

据了解,这两项国际标准是由OpenAI、蚂蚁集团、科大讯飞、谷歌、微软、英伟达、百度、腾讯等数十家单位的多名专家学者共同编制而成。其中《大语言模型安全测试方法》由蚂蚁集团牵头编制。



(图:WDTA发布大模型安全国际标准,OpenAI、蚂蚁集团、科大讯飞等参编)

与会的WDTA人工智能安全可信负责任工作组组长黄连金表示,随着人工智能系统,特别是大语言模型继续成为社会各方面不可或缺的一部分,以一个全面的标准来解决它们的安全挑战变得至关重要。此次发布的标准汇集了全球AI安全领域的专家智慧,填补了大语言模型和生成式AI应用方面安全测试领域的空白,为业界提供了统一的测试框架和明确的测试方法,有助于提高AI系统安全性,促进AI技术负责任发展,增强公众信任。

世界数字技术院(WDTA)是在日内瓦注册的国际非政府组织,遵从联合国指导框架,致力于在全球范围内推进数字技术,促进国际合作。AI STR(安全、可信、负责任)计划是WDTA的核心倡议,旨在确保人工智能系统的安全性、可信性和责任性。蚂蚁集团、华为、科大讯飞、国际数据空间协会(IDSA)、弗劳恩霍夫研究所、中国电子等均为其成员单位。

近年来,世界各国都在加强对于大模型安全的研究和管控。我国先后发布了《全球人工智能治理倡议》《生成式人工智能服务管理暂行办法》《生成式人工智能服务安全基本要求》等,旨在促进生成式人工智能安全可信发展,推进全球人工智能治理领域合作共识。

信息显示,此次发布的两项国际标准是大模型及生成式AI应用方面的安全测试标准。

其中,《生成式人工智能应用安全测试标准》由WDTA作为牵头单位。该标准为测试和验证生成式AI应用的安全性提供了一个框架,特别是那些使用大语言模型(LLM)构建的应用程序。它定义了人工智能应用程序架构每一层的测试和验证范围,包括基础模型选择、嵌入和矢量数据库、RAG或检索增强生成、AI应用运行时安全等等,确保AI应用各个方面都经过严格的安全性和合规性评估,保障其在整个生命周期内免受威胁和漏洞侵害。

《大语言模型安全测试方法》由蚂蚁集团作为牵头单位。该标准则为大模型本身的安全性评估提供了一套全面、严谨且实操性强的结构性方案。它提出了大语言模型的安全风险分类、攻击的分类分级方法以及测试方法,并率先给出了四种不同攻击强度的攻击手法分类标准,提供了严格的评估指标和测试程序等,可解决大语言模型固有的复杂性,全面测试其抵御敌对攻击的能力,使开发人员和组织能够识别和缓解潜在漏洞,并最终提高使用大语言模型构建的人工智能系统的安全性和可靠性。



(图:蚂蚁集团王维强作为标准参与单位代表,在会上发言)

作为标准参与单位代表,蚂蚁集团机器智能部总经理、蚂蚁安全实验室首席科学家王维强受邀参会并进行了发言。他表示,生成式AI将释放巨大的生产力,但也要对它带来的新风险高度警惕。大型科技公司应在促进生成式AI安全和负责任的发展中发挥关键作用,利用其资源、专业知识和影响力推动最佳实践,构建一个优先考虑安全、隐私和道德考量的生态系统。例如,通过制定行业标准与指南,为开发和部署生成式AI系统的开发者和机构提供清晰指导;投入研发并开放保障生成式AI安全的工具,形成产业共治。

公开资料显示,蚂蚁集团从2015年起就积极投入可信AI技术研究,目前已建立了大模型综合安全治理体系。蚂蚁集团还自研了业界首个大模型安全一体化解决方案“蚁天鉴”,用于AIGC安全性和真实性评测、大模型智能化风控、AI鲁棒和可解释性检测等。此次发布的《大语言模型安全测评方法》,便是基于“蚁天鉴”AI安全检测体系的应用实践,与全球生态伙伴交流编制。此外,蚂蚁集团在公司内成立了科技伦理委员会和专门团队来评估和管理生成式AI的风险,公司所有AI产品均需通过科技伦理评测机制,确保AI安全可信。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一对网恋男女奔现,男子为考验女友带去看破房子,结局令人舒爽

一对网恋男女奔现,男子为考验女友带去看破房子,结局令人舒爽

雅清故事汇
2024-04-30 15:17:55
赛季报销?广东大将伤病恢复不乐观 杜锋没他难冲冠

赛季报销?广东大将伤病恢复不乐观 杜锋没他难冲冠

胖子喷球
2024-05-01 14:09:27
什么情况?江苏一地多所学校公众号接连关停!老师叫好:有利于大家安心教学

什么情况?江苏一地多所学校公众号接连关停!老师叫好:有利于大家安心教学

上观新闻
2024-04-28 17:18:44
汪小菲卖北京6千万豪宅!大S私人物品全曝光 网友:好特殊的品味

汪小菲卖北京6千万豪宅!大S私人物品全曝光 网友:好特殊的品味

达达哥
2024-04-29 10:40:58
梅州主帅:今天是我执教生涯中最疯狂的一场比赛

梅州主帅:今天是我执教生涯中最疯狂的一场比赛

懂球帝
2024-05-01 00:44:18
霸王茶姬找到了“天选代言人”

霸王茶姬找到了“天选代言人”

未来消费
2024-04-30 16:45:11
主动投案!广西消防系统一名支队长被公诉

主动投案!广西消防系统一名支队长被公诉

正义网
2024-04-30 16:46:28
闹大了!东航客机应急滑梯被放出 疑因机组矛盾 涉事人身份被扒!

闹大了!东航客机应急滑梯被放出 疑因机组矛盾 涉事人身份被扒!

钱多多多多
2024-04-30 17:38:22
“中国有望实现沙伊复交后又一突破”

“中国有望实现沙伊复交后又一突破”

观察者网
2024-04-30 22:00:18
95岁老人被银行冻结30万,不料老人政法系毕业,结果令银行傻眼

95岁老人被银行冻结30万,不料老人政法系毕业,结果令银行傻眼

谈史论天地
2024-04-30 11:50:03
发生关系时,男人戴避孕套那几十秒,女人心里在想什么?

发生关系时,男人戴避孕套那几十秒,女人心里在想什么?

绘世纪实
2024-04-28 16:54:35
辽粤比赛风云突变!广东男篮表态,提拔6大00后新星,杜锋摊牌

辽粤比赛风云突变!广东男篮表态,提拔6大00后新星,杜锋摊牌

开心体育站
2024-05-01 14:27:52
松下压缩机撤回日本,撕下国产空调遮羞布,核心技术在日企手里

松下压缩机撤回日本,撕下国产空调遮羞布,核心技术在日企手里

柏铭锐谈
2024-04-28 15:42:39
别再往家里买这10种“大垃圾”,钱花不少还占地方,扔都嫌麻烦

别再往家里买这10种“大垃圾”,钱花不少还占地方,扔都嫌麻烦

韩胖说装修
2024-04-30 21:27:52
印度裔高管嘲笑华裔,称他们在美永远低人一等,无法坐到他的位置

印度裔高管嘲笑华裔,称他们在美永远低人一等,无法坐到他的位置

周观环宇
2024-05-01 00:04:06
扫地出门!曝拜仁“罪臣”将被出售!“冠军队长”+抢断王来投

扫地出门!曝拜仁“罪臣”将被出售!“冠军队长”+抢断王来投

头狼追球
2024-05-01 07:38:50
湖南一28岁美女硕士,因无法接受丈夫身份,从13楼一跃而下

湖南一28岁美女硕士,因无法接受丈夫身份,从13楼一跃而下

一个人讲故事
2024-04-29 21:05:07
变调了,“美政府决定不制裁”

变调了,“美政府决定不制裁”

观察者网
2024-04-26 20:47:15
法国前总理的儿子:我和中国有很强的联结

法国前总理的儿子:我和中国有很强的联结

一条
2024-04-27 13:04:24
同样演车祸截肢,对比31岁钟楚曦和30岁周雨彤,破碎感的一目了然

同样演车祸截肢,对比31岁钟楚曦和30岁周雨彤,破碎感的一目了然

奴染
2024-04-30 22:51:58
2024-05-01 15:22:44
数智前线
数智前线
关注数字化和智能化
560文章数 605关注度
往期回顾 全部

科技要闻

余承东卸任华为终端CEO 新任命为董事长

头条要闻

王毅和阿根廷外长会谈 阿方:奉行对华友好政策不改变

头条要闻

王毅和阿根廷外长会谈 阿方:奉行对华友好政策不改变

体育要闻

"意甲最佳"金玟哉 踢回了中超水平...

娱乐要闻

黄子韬被曝求婚徐艺洋 大量亲密照曝光

财经要闻

俞敏洪,踏足A股!

汽车要闻

预售2.89-3.49万 奔腾小马正式开启预售

态度原创

数码
亲子
本地
手机
公开课

数码要闻

发烧友将QLC SSD转换为SLC 大幅提高了耐用性和性能

亲子要闻

孩子对物体尺寸真的没有感觉,萌娃试图坐在超小号凳子上,没想到真让她坐上去了

本地新闻

食味印象 | 潍坊:碳水脑袋的人间乐园

手机要闻

苹果 iOS 17.5 引入“维修模式”,手机送修前无需再关闭“查找”

公开课

父亲年龄越大孩子越不聪明?

无障碍浏览 进入关怀版