网易首页 > 网易号 > 正文 申请入驻

六年来首次!OpenAI新模型开放权重,Altman称为"全球最佳开放模型"

0
分享至

OpenAI向开源模型迈出重要一步:六年来首次推出开放权重模型。

美东时间8月5日周二,OpenAI发布了两个开放权重语言模型gpt-oss-120b和gpt-oss-20b。这是OpenAI自2019年推出GPT-2以来首次发布开放权重模型,也是OpenAI与微软签署独家云服务协议六年来问世的首批此类模型。

评论认为,OpenAI的新模型直接回应了Meta、微软支持的Mistral AI以及中国初创新星DeepSeek等竞争对手在开放权重模型领域的挑战。

CEO Sam Altman在社交媒体表示:

"gpt-oss是一个重大突破,这是最先进的开放权重推理模型,具有与o4-mini相当的强大现实世界性能,可以在你自己的电脑(或手机的较小版本)上本地运行。我们相信这是世界上最好、最实用的开放模型。"

gpt-oss-120b和gpt-oss-20b被设计为低成本的GPT模型选项,开发者、研究人员和企业可以轻松运行和定制。gpt-oss-20b可在16GB内存的笔记本电脑上运行,gpt-oss-120b需要约80GB内存,两款模型均支持高级推理、工具使用和思维链处理。

Altman称,这两款模型可在个人电脑(PC)甚至手机上本地运行,无需互联网连接,为用户提供完全的控制权和隐私保护。

同时,亚马逊宣布将首次向客户提供OpenAI的模型,计划在其Bedrock和SageMaker平台上提供OpenAI的开放AI权重新模型。这是云计算巨头亚马逊首次提供OpenAI的产品。

gpt-oss-20b和120b的发布标志着OpenAI战略转向的重要节点,此前该公司多次推迟开放权重模型发布,并进行了广泛的安全测试和评估,以确保模型不被恶意利用。

所谓的开放权重是介于开源和闭源的一种中间形态,意味着企业和政府机构可以自主运行该模型,因为他们可以查看模型的权重并进行修改。而开源的情况下,用户可以查看模型的源代码组成,有时包括训练和权重分配方式。

此前评论认为,OpenAI推出开放权重模型可能削弱微软在AI业务中的独家优势。本周二OpenAI称,微软会将gpt-oss-20b 模型的 GPU 优化版本引入 Windows 设备。这些模型由ONNX Runtime支持,支持本地推理,可通过Foundry Local 和 AI Toolkit for VS Code 获取,从而让Windows 开发者更轻松地使用开放模型进行构建。

gpt-oss-120b部分测试性能甚至超过o4-mini 20b部分测试超过o3‑mini

OpenAI介绍,两款gpt-oss模型采用了其最先进的预训练和后训练技术,特别注重推理、效率和跨部署环境的实用性。它们都是使用专家混合(MoE)架构的Transformer,以减少处理输入所需的活跃参数数量。

gpt-oss-120b每个token激活5.1亿参数,总参数量为1170亿;gpt-oss-20b激活3.6B参数,总参数量为210亿。模型使用交替的密集和局部带状稀疏注意力模式,支持高达128k的上下文长度。

OpenAI称gpt-oss-20b是一款中型开放模型,gpt-oss-120b则是可在“大多数台式机和笔记本电脑”上运行的大型开放模型。

OpenAI 表示,较小的模型至少需要 16GB 显存或统一内存才能发挥最佳性能,并且“非常适合高端消费级GPU和搭载苹果芯片的Mac电脑”。较大的全尺寸模型则需要至少 60GB 显存或统一内存。

在性能评估方面,OpenAI披露,gpt-oss-120b在核心推理基准测试中接近OpenAI o4-mini的表现。较小的gpt-oss-20b模型在相同评估中达到或超过OpenAI o3-mini的性能。

gpt-oss-120b在竞赛编码(Codeforces)、通用问题求解(MMLU 和 HLE)以及工具调用(TauBench)方面均优于 OpenAI o3‑mini,并匹敌甚至超越了 OpenAI o4-mini。它在健康相关查询(HealthBench⁠)和竞赛数学(AIME 2024 和 2025)方面的表现甚至超过o4-mini。

即使规模较小,gpt-oss-20b在上述同类的评估中也匹敌甚至超越了OpenAI o3‑mini,甚至在竞赛数学和健康方面也超越了后者。

安全防护与恶意使用预防

OpenAI对开放权重模型的安全性给予了特别关注,因为一旦发布,对手可能对模型进行恶意微调。该公司在预训练期间过滤了与化学、生物、放射性和核(CBRN)相关的有害数据。

为直接评估风险,OpenAI对模型进行了专门的生物学和网络安全数据微调,创建了攻击者可能制作的特定领域非拒绝版本。经过内部和外部测试,这些恶意微调的模型无法达到其准备框架中的"高能力"阈值。

OpenAI还与三个独立专家组合作,对其恶意微调评估提供反馈。Altman强调:"我们努力减轻最严重的安全问题,特别是在生物安全方面。gpt-oss模型在内部安全基准测试中的表现与我们的前沿模型相当。"

生态系统部署与市场影响

两个模型在Apache 2.0许可下免费提供,用户可以通过Hugging Face和GitHub等平台下载。云服务提供商亚马逊、Baseten和微软也将提供这些模型。

OpenAI与包括Azure、vLLM、Ollama、AWS、Fireworks等领先部署平台合作,使开发者能够广泛使用这些模型。微软还将GPU优化版本的gpt-oss-20b模型引入Windows设备。

该公司正在举办红队挑战赛,奖金池为50万美元,鼓励全球研究人员、开发者和爱好者帮助识别新的安全问题。Altman表示:"我们相信这将带来更多好处而非坏处,我们期待这一发布能够实现新型研究并创造新型产品。"

竞争压力推动战略转变

OpenAI此次发布开放权重模型很大程度上受到市场竞争压力驱动,特别是来自中国DeepSeek的挑战。自2019年以来,该公司一直专注于通过API提供专有模型服务,而竞争对手纷纷推出开放权重替代方案。

OpenAI总裁Greg Brockman在本周二的记者会上表示:"看到生态系统的发展令人兴奋,我们很高兴能为此做出贡献,真正推动前沿发展,然后看看会发生什么。"

OpenAI与英伟达、AMD、Cerebras和Groq等芯片制造商合作,确保模型在各种芯片上良好运行。英伟达CEO黄仁勋在声明中称:"OpenAI向世界展示了在英伟达AI上可以构建什么——现在他们正在推进开源软件的创新。"

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
太可恨!飞机一落地上海,女孩立马报案!更多年轻受害人浮出水面……

太可恨!飞机一落地上海,女孩立马报案!更多年轻受害人浮出水面……

环球网资讯
2026-03-26 21:48:04
调查发现:坚持走路锻炼的老人,过不了半个月,会迎来4大改善

调查发现:坚持走路锻炼的老人,过不了半个月,会迎来4大改善

39健康网
2026-03-02 12:30:48
连蔡依林都在玩,“雪山救狐狸”到底是什么梗?对话视频原创作者:最初只是为了卖酱板鸭,特意设置反转剧情,没想到会这么火

连蔡依林都在玩,“雪山救狐狸”到底是什么梗?对话视频原创作者:最初只是为了卖酱板鸭,特意设置反转剧情,没想到会这么火

极目新闻
2026-03-25 19:37:57
惊呆了!网传某妇产医院一少妇哭求医生,改她儿子的血型鉴定书…

惊呆了!网传某妇产医院一少妇哭求医生,改她儿子的血型鉴定书…

火山詩话
2026-03-26 11:40:00
出大事了,特朗普通报全球,美头号敌人已亮相,担心的事即将发生

出大事了,特朗普通报全球,美头号敌人已亮相,担心的事即将发生

策略述
2026-03-26 13:45:17
日均接诊1.5万人次、手术500台,广东这家华南医疗航母火遍全省

日均接诊1.5万人次、手术500台,广东这家华南医疗航母火遍全省

健身狂人
2026-03-27 00:11:10
即将沦为“穷人房”的5种房子,不好住不好卖,聪明人已逐渐转手

即将沦为“穷人房”的5种房子,不好住不好卖,聪明人已逐渐转手

猫叔东山再起
2026-03-26 09:10:08
勇士双杀篮网锁定附加赛,桑托斯生涯之夜,库明加换波神真赚了?

勇士双杀篮网锁定附加赛,桑托斯生涯之夜,库明加换波神真赚了?

司峰阿道
2026-03-26 14:45:09
中国军事专家送日本3句话,太绝了,真不是吓唬他们

中国军事专家送日本3句话,太绝了,真不是吓唬他们

安安说
2026-03-26 11:21:19
14.99万!“史上最便宜”特斯拉来了

14.99万!“史上最便宜”特斯拉来了

首席品牌观察
2026-03-24 16:18:39
中国公布喜讯

中国公布喜讯

杨兴文
2026-03-26 21:08:26
“面相骗不了人”这句话,在他身上,以一种让人揪心的方式被验证

“面相骗不了人”这句话,在他身上,以一种让人揪心的方式被验证

动物奇奇怪怪
2026-03-26 01:52:14
中土敲定合作,一根管道连通两国,这是对俄罗斯的警告?

中土敲定合作,一根管道连通两国,这是对俄罗斯的警告?

近史博览
2026-03-27 02:18:27
俄罗斯宣传三天攻占爱沙尼亚!炮制公投,又是特别军事行动?

俄罗斯宣传三天攻占爱沙尼亚!炮制公投,又是特别军事行动?

项鹏飞
2026-03-24 20:28:43
毛新宇参观祖宅时突然发现家谱记载:原来毛主席是毛太华第20代孙

毛新宇参观祖宅时突然发现家谱记载:原来毛主席是毛太华第20代孙

老杉说历史
2026-03-14 20:54:20
奴颜媚骨具象化,高市早苗三十年前照片被扒出,原来她从未变过!

奴颜媚骨具象化,高市早苗三十年前照片被扒出,原来她从未变过!

社会酱
2026-03-23 17:34:19
强闯中国驻日使馆不法之徒照片曝光,3月15日刚晋升三等陆尉

强闯中国驻日使馆不法之徒照片曝光,3月15日刚晋升三等陆尉

澎湃新闻
2026-03-26 14:34:04
300元抢红薯叶,国内仅2元一斤!美国高校:抑制96%肺部异变

300元抢红薯叶,国内仅2元一斤!美国高校:抑制96%肺部异变

果壳
2026-03-26 09:29:42
女同主播出轨大哥 被"正宫"直播对质!真实长相曝光

女同主播出轨大哥 被"正宫"直播对质!真实长相曝光

游民星空
2026-03-25 20:08:13
浙江男子马达加斯加开“手机网吧”爆火:全天候营业,收费1.5元/小时,每天约200人次来玩

浙江男子马达加斯加开“手机网吧”爆火:全天候营业,收费1.5元/小时,每天约200人次来玩

极目新闻
2026-03-26 19:21:35
2026-03-27 03:27:00
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
143603文章数 2653030关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

数码
手机
教育
游戏
公开课

数码要闻

英特尔发Q1.26版Arc Pro专业显卡驱动,支持B70 / B65显卡

手机要闻

1499 iQOO Z11系列发布丨9020mAh电池 165Hz高刷

教育要闻

精准研判,提质增效丨我校召开2026届毕业生就业工作研判会

PS1大IP游戏藏私货!成人手绘与盗版马里奥ROM塞满

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版