网易首页 > 网易号 > 正文 申请入驻

数月 → 几天:OpenAI 被曝缩水模型安全测试,AI 竞赛埋下隐患

0
分享至

IT之家 4 月 12 日消息,金融时报(FT)昨日(4 月 11 日)发布博文,报道称 OpenAI 大幅压缩最新大型语言模型(LLM)安全测试时间,此前需要数月时间,而最新 o3 模型仅有几天时间。

竞争驱动,安全让步

据八位知情人士透露,OpenAI 大幅压缩模型的安全测试时间,留给员工和第三方测试团队“评估”(evaluations,即测试模型风险和性能)时间仅有数天时间,而此前通常会耗时数月时间。

IT之家援引博文介绍,OpenAI 面临来自 Meta、Google 及 xAI 等对手的激烈竞争,需快速推出新模型以维持市场优势。o3 模型计划最早下周发布,留给测试者安全检查时间不到一周,而此前 GPT-4 的测试期长达六个月。

一位测试过 GPT-4 的人士透露,过去安全测试更彻底,某些危险能力在测试两个月后才被发现,而如今竞争压力迫使公司追求速度,忽视潜在风险。

测试不足,监管缺位

全球目前尚未统一 AI 安全测试标准,但欧盟《AI 法案》将于今年晚些时候上线,要求企业对其最强大的模型进行安全测试。

AI Futures Project 负责人 Daniel Kokotajlo 表示,由于缺乏强制监管,企业不会主动披露模型的危险能力,竞争压力进一步加剧了风险。

OpenAI 曾承诺构建定制模型版本,测试其潜在滥用风险,例如是否能协助制造更具传染性的生物病毒。

这种测试需投入大量资源,包括聘请外部专家、创建特定数据集并进行“微调”(fine-tuning)。但 OpenAI 仅对较老旧的模型进行有限微调,最新模型如 o1 和 o3-mini 未全面测试。前 OpenAI 安全研究员 Steven Adler 批评,若不兑现测试承诺,公众有权知情。

安全测试未覆盖最终模型

另一问题在于,安全测试通常基于早期“检查点”(checkpoints),而非最终发布模型。一位前 OpenAI 技术人员表示,发布未经测试的更新模型是“不良做法”,而 OpenAI 辩称,其检查点与最终模型“基本一致”,并通过自动化测试提高效率,确保安全。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
白百何工作室放聊天记录了!锤了剧组没撒谎,东京之前就有矛盾

白百何工作室放聊天记录了!锤了剧组没撒谎,东京之前就有矛盾

萌神木木
2025-11-09 20:07:33
孙悦:湖人包机我坐科比旁边,因为那是队友挑剩下的位置

孙悦:湖人包机我坐科比旁边,因为那是队友挑剩下的位置

懂球帝
2025-11-10 09:14:37
特朗普41岁次子讲述原生家庭:父亲定下六不准,母亲“又美又凶”

特朗普41岁次子讲述原生家庭:父亲定下六不准,母亲“又美又凶”

法老不说教
2025-11-07 15:24:59
第二个“恒大”出现!年营收7000亿,曾经是广东第一大民企

第二个“恒大”出现!年营收7000亿,曾经是广东第一大民企

墨印斋
2025-11-08 15:28:54
数百人在内蒙古一菜地“免费摘白菜”,菜农损失近百万,知情人:有少数人还钱菜农没收

数百人在内蒙古一菜地“免费摘白菜”,菜农损失近百万,知情人:有少数人还钱菜农没收

潇湘晨报
2025-11-09 12:43:19
笑不活!湖南一女生在商场上厕所,看到穿裙子的标志,就冲了进去

笑不活!湖南一女生在商场上厕所,看到穿裙子的标志,就冲了进去

火山诗话
2025-11-10 07:29:48
低价“银行直供房”激增,有房产低于市价25%

低价“银行直供房”激增,有房产低于市价25%

第一财经资讯
2025-11-09 22:19:17
2-1!日本爆大冷:掀翻欧洲冠军+7分夺小组头名,世少赛20队出线

2-1!日本爆大冷:掀翻欧洲冠军+7分夺小组头名,世少赛20队出线

侃球熊弟
2025-11-10 03:37:42
长沙不雅视频后续!女医生同款睡裙超22万人购买,幕后偷拍者曝光

长沙不雅视频后续!女医生同款睡裙超22万人购买,幕后偷拍者曝光

壹月情感
2025-11-09 18:01:35
朱元璋为啥不愿传位给朱棣?史学家:其实谁都可以,唯独朱棣不行

朱元璋为啥不愿传位给朱棣?史学家:其实谁都可以,唯独朱棣不行

掠影后有感
2025-11-10 08:02:51
“青云租”爆雷员工揭内幕:每个员工每月需投资30台手机,11万台集中流向两个村庄 丨封面头条

“青云租”爆雷员工揭内幕:每个员工每月需投资30台手机,11万台集中流向两个村庄 丨封面头条

封面新闻
2025-11-09 18:45:20
医院17分钟视频瓜后续,疑似因吃醋被偷拍,女方与前夫合影被扒

医院17分钟视频瓜后续,疑似因吃醋被偷拍,女方与前夫合影被扒

大双
2025-11-09 22:52:39
联盟第一!雷霆19分逆转灰熊达成10胜 亚历山大35+7+6

联盟第一!雷霆19分逆转灰熊达成10胜 亚历山大35+7+6

醉卧浮生
2025-11-10 09:24:08
京东第一辆车,价格定了

京东第一辆车,价格定了

扬子晚报
2025-11-09 20:34:08
雷军这回栽了,小米法务被这个女人拿捏,太打脸

雷军这回栽了,小米法务被这个女人拿捏,太打脸

公子麦少
2025-11-07 14:39:17
烟台宝马车女司机死得太惨!知情人:家里有小朋友在等她下班回家

烟台宝马车女司机死得太惨!知情人:家里有小朋友在等她下班回家

魔都姐姐杂谈
2025-11-09 20:05:54
高市早苗疯言台湾问题,日本国内有人惊恐万状!

高市早苗疯言台湾问题,日本国内有人惊恐万状!

新民晚报
2025-11-10 10:18:20
31岁女子为嫁高富帅与母亲互殴,女主鞠躬道歉:他出轨了,卖房钱都给他了

31岁女子为嫁高富帅与母亲互殴,女主鞠躬道歉:他出轨了,卖房钱都给他了

潇湘晨报
2025-11-10 11:00:20
藏不住了!刘涛台球桌造型惊艳全网,她的魅力勾魂顶不住!

藏不住了!刘涛台球桌造型惊艳全网,她的魅力勾魂顶不住!

喜欢历史的阿繁
2025-11-10 10:30:24
九江一架风力发电机叶片空中断裂,目击者称“玻璃纤维满天飞”,当地:正在处理

九江一架风力发电机叶片空中断裂,目击者称“玻璃纤维满天飞”,当地:正在处理

极目新闻
2025-11-10 11:38:48
2025-11-10 12:16:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
314304文章数 606727关注度
往期回顾 全部

科技要闻

存储芯片大厂涨价50%!华强北一天一个价

头条要闻

牛弹琴:特朗普宣布要发钱了 每个美国人至少2000美元

头条要闻

牛弹琴:特朗普宣布要发钱了 每个美国人至少2000美元

体育要闻

战绩崩盘!东契奇交易余震撕裂独行侠

娱乐要闻

郝蕾风波升级?

财经要闻

俄罗斯大幅加税 中国汽车出口骤降58%

汽车要闻

智能又务实 奇瑞瑞虎9X不只有性价比

态度原创

艺术
房产
家居
旅游
手机

艺术要闻

“隶书之冠”刘炳森:楷书艺术之美惊艳四座

房产要闻

封关倒计时!三亚主城 2.3 万 /㎡+ 即买即住,手慢无!

家居要闻

现代自由 功能美学居所

旅游要闻

行进的海岸线丨渤海湾畔“渔旅融合” 小渔村启动蓝色新引擎

手机要闻

「鲜Phone画报」OPPO Reno15 Pro|轻系蝶结,闪耀星光

无障碍浏览 进入关怀版