网易首页 > 网易号 > 正文 申请入驻

数月 → 几天:OpenAI 被曝缩水模型安全测试,AI 竞赛埋下隐患

0
分享至

IT之家 4 月 12 日消息,金融时报(FT)昨日(4 月 11 日)发布博文,报道称 OpenAI 大幅压缩最新大型语言模型(LLM)安全测试时间,此前需要数月时间,而最新 o3 模型仅有几天时间。

竞争驱动,安全让步

据八位知情人士透露,OpenAI 大幅压缩模型的安全测试时间,留给员工和第三方测试团队“评估”(evaluations,即测试模型风险和性能)时间仅有数天时间,而此前通常会耗时数月时间。

IT之家援引博文介绍,OpenAI 面临来自 Meta、Google 及 xAI 等对手的激烈竞争,需快速推出新模型以维持市场优势。o3 模型计划最早下周发布,留给测试者安全检查时间不到一周,而此前 GPT-4 的测试期长达六个月。

一位测试过 GPT-4 的人士透露,过去安全测试更彻底,某些危险能力在测试两个月后才被发现,而如今竞争压力迫使公司追求速度,忽视潜在风险。

测试不足,监管缺位

全球目前尚未统一 AI 安全测试标准,但欧盟《AI 法案》将于今年晚些时候上线,要求企业对其最强大的模型进行安全测试。

AI Futures Project 负责人 Daniel Kokotajlo 表示,由于缺乏强制监管,企业不会主动披露模型的危险能力,竞争压力进一步加剧了风险。

OpenAI 曾承诺构建定制模型版本,测试其潜在滥用风险,例如是否能协助制造更具传染性的生物病毒。

这种测试需投入大量资源,包括聘请外部专家、创建特定数据集并进行“微调”(fine-tuning)。但 OpenAI 仅对较老旧的模型进行有限微调,最新模型如 o1 和 o3-mini 未全面测试。前 OpenAI 安全研究员 Steven Adler 批评,若不兑现测试承诺,公众有权知情。

安全测试未覆盖最终模型

另一问题在于,安全测试通常基于早期“检查点”(checkpoints),而非最终发布模型。一位前 OpenAI 技术人员表示,发布未经测试的更新模型是“不良做法”,而 OpenAI 辩称,其检查点与最终模型“基本一致”,并通过自动化测试提高效率,确保安全。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
奇葩亲戚朋友的要求有多离谱?网友:这年头还有想吃绝户的

奇葩亲戚朋友的要求有多离谱?网友:这年头还有想吃绝户的

解读热点事件
2025-12-21 00:05:08
5秒10枪震惊全美,特朗普知道事情闹大了,紧急改口,搬出三板斧

5秒10枪震惊全美,特朗普知道事情闹大了,紧急改口,搬出三板斧

井普椿的独白
2026-01-30 17:24:55
金晨事件后续,内部聊天曝光,太抠门没谈拢,多段绯闻记者放实锤

金晨事件后续,内部聊天曝光,太抠门没谈拢,多段绯闻记者放实锤

李健政观察
2026-01-29 20:20:56
日本连续59个月近乎“完全就业”!在日留学生毕业即就业……

日本连续59个月近乎“完全就业”!在日留学生毕业即就业……

东京在线
2026-01-28 20:31:12
时隔13年!穆里尼奥将重返伯纳乌:再战皇马 冲击欧冠奇迹

时隔13年!穆里尼奥将重返伯纳乌:再战皇马 冲击欧冠奇迹

叶青足球世界
2026-01-30 20:02:38
网上报名参加“网红”马尔代夫潜水团,16人被骗,组织者称“女朋友宫外孕要手术”等,拒不退款后失联;涉案超20万元,警方已立案

网上报名参加“网红”马尔代夫潜水团,16人被骗,组织者称“女朋友宫外孕要手术”等,拒不退款后失联;涉案超20万元,警方已立案

扬子晚报
2026-01-31 08:06:47
戴笠随意处置国军高官?别被电视剧骗了!他连为何应钦站岗都不配

戴笠随意处置国军高官?别被电视剧骗了!他连为何应钦站岗都不配

鹤羽说个事
2026-01-30 10:46:27
没拿过亚军!德约此前10次参加澳网男单决赛全部夺冠

没拿过亚军!德约此前10次参加澳网男单决赛全部夺冠

懂球帝
2026-01-30 23:12:37
太阳报:穆德里克和美国女演员频繁互动,邀请对方去迪士尼玩

太阳报:穆德里克和美国女演员频繁互动,邀请对方去迪士尼玩

懂球帝
2026-01-30 19:00:05
印度回国主播高烧20天,疑似感染尼帕病毒,网友强烈呼吁隔离!

印度回国主播高烧20天,疑似感染尼帕病毒,网友强烈呼吁隔离!

今朝牛马
2026-01-30 20:25:04
吴清座谈会发声,定调七大要点

吴清座谈会发声,定调七大要点

21世纪经济报道
2026-01-30 22:23:20
摩纳哥“悲伤王妃”罕见秀恩爱,生日收亲王送30万胸针!

摩纳哥“悲伤王妃”罕见秀恩爱,生日收亲王送30万胸针!

ChicMyGeek
2026-01-30 17:22:08
王钰栋留洋最新消息:德甲只是桥头堡,第一站大概率去德乙

王钰栋留洋最新消息:德甲只是桥头堡,第一站大概率去德乙

姜大叔侃球
2026-01-30 20:08:18
36岁唇腭裂患者每天直播8小时声援嫣然医院,李亚鹏在极目新闻视频下暖心回应

36岁唇腭裂患者每天直播8小时声援嫣然医院,李亚鹏在极目新闻视频下暖心回应

极目新闻
2026-01-30 16:28:21
德约38次打进大满贯男子单打决赛,为公开赛时代最多

德约38次打进大满贯男子单打决赛,为公开赛时代最多

懂球帝
2026-01-30 22:49:32
德国大师赛:肖国栋憾负世界第一,澳洲第一人血洗小罗伯逊进四强

德国大师赛:肖国栋憾负世界第一,澳洲第一人血洗小罗伯逊进四强

世界体坛观察家
2026-01-31 06:06:41
奥迪Q5L目前25.5万元起售!老车主哭倒一片

奥迪Q5L目前25.5万元起售!老车主哭倒一片

汽车网评
2026-01-30 20:43:36
这是姚笛和吴镇宇当年的合照,当时确实非常火

这是姚笛和吴镇宇当年的合照,当时确实非常火

喜欢历史的阿繁
2026-01-28 16:29:16
68岁尔冬升10岁女儿近照曝光,小姑娘长得很漂亮,像极了尔冬升

68岁尔冬升10岁女儿近照曝光,小姑娘长得很漂亮,像极了尔冬升

草莓解说体育
2026-01-30 18:09:35
铁了心对付中国!暴跌58%,俄罗斯大幅加税,中国汽车出口骤降

铁了心对付中国!暴跌58%,俄罗斯大幅加税,中国汽车出口骤降

趣文说娱
2026-01-30 15:01:14
2026-01-31 08:36:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
327416文章数 606928关注度
往期回顾 全部

科技要闻

意念控制机器人不是科幻 1-2年就落地

头条要闻

特朗普听到"中英破冰"秒垮脸 失心疯的全过程被拍下

头条要闻

特朗普听到"中英破冰"秒垮脸 失心疯的全过程被拍下

体育要闻

“假赌黑”的子弹,还要再飞一会儿吗?

娱乐要闻

警方通报金晨交通事故,否认网传骗保

财经要闻

白银,暴跌!黄金,40年最大跌幅!

汽车要闻

合资品牌首搭800V/5C快充 东风日产NX8将于3、4月上市

态度原创

健康
时尚
本地
艺术
公开课

耳石症分类型,症状大不同

女友BELLA+封面 | Ginny&Jayna:连锁反应

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

艺术要闻

惊艳!越南摄影师镜头下的妩媚女子!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版