网易首页 > 网易号 > 正文 申请入驻

OpenAI发布两款"开源"AI推理模型

0
分享至

OpenAI周二宣布推出两款开放权重的AI推理模型,具备与其o系列模型相似的能力。该公司表示,这两款模型均可从在线开发者平台Hugging Face免费下载,并称这些模型在多个开放模型比较基准测试中表现"最先进"。

这两款模型有两种规格:功能更强大的gpt-oss-120b模型可在单个英伟达GPU上运行,而轻量级的gpt-oss-20b模型可在配备16GB内存的消费级笔记本电脑上运行。

此次发布标志着OpenAI自五年多前发布GPT-2以来的首个"开放"语言模型。

在发布会上,OpenAI表示其开放模型将能够向云端AI模型发送复杂查询。这意味着如果OpenAI的开放模型无法处理某些任务(如图像处理),开发者可以将开放模型连接到该公司功能更强大的封闭模型。

虽然OpenAI在早期曾开源AI模型,但该公司通常倾向于专有的封闭源代码开发方式。后一种策略帮助OpenAI建立了通过API向企业和开发者销售AI模型访问权限的大型业务。

然而,CEO萨姆·奥特曼在1月份表示,他认为OpenAI在开源技术方面一直"站在历史的错误一边"。该公司目前面临来自中国AI实验室的日益增长的压力,包括DeepSeek、阿里巴巴的Qwen和月之暗面AI,这些实验室已开发出世界上一些最强大和最受欢迎的开放模型。

7月,特朗普政府还敦促美国AI开发者开源更多技术,以促进符合美国价值观的AI在全球范围内的采用。

通过发布gpt-oss,OpenAI希望赢得开发者和特朗普政府的青睐,这两者都见证了中国AI实验室在开源领域的崛起。

"回到我们2015年创立时,OpenAI的使命是确保通用人工智能造福全人类,"OpenAI CEO萨姆·奥特曼在与TechCrunch分享的声明中说道。"为此,我们很高兴看到世界在美国创建的开放AI技术栈上进行构建,这基于民主价值观,对所有人免费提供,造福广大用户。"

模型性能表现

OpenAI旨在使其开放模型成为其他开放权重AI模型中的领导者,该公司声称已经做到了这一点。

在Codeforces竞技编程测试中,gpt-oss-120b和gpt-oss-20b分别得分2622和2516,超越了DeepSeek的R1,但表现不及o3和o4-mini。

在"人类最后考试"这一跨多学科众包问题的挑战性测试中,gpt-oss-120b和gpt-oss-20b分别得分19%和17.3%。同样,这一表现不及o3,但超越了DeepSeek和Qwen的领先开放模型。

值得注意的是,OpenAI的开放模型比其最新的AI推理模型o3和o4-mini产生更多幻觉。

在OpenAI内部的PersonQA基准测试中,gpt-oss-120b和gpt-oss-20b分别在49%和53%的问题中产生幻觉。这是OpenAI o1模型(16%幻觉率)的三倍多,也高于o4-mini模型的36%。

新模型训练

OpenAI表示其开放模型采用了与专有模型相似的训练过程。该公司称每个开放模型都利用专家混合(MoE)技术,针对任何给定问题调用更少的参数,使其运行更高效。对于拥有1170亿总参数的gpt-oss-120b,OpenAI表示该模型每个Token仅激活51亿参数。

该公司还表示其开放模型使用高计算强化学习(RL)进行训练,这是一个后训练过程,通过大型英伟达GPU集群在模拟环境中教授AI模型分辨对错。这一技术也用于训练OpenAI的o系列模型,开放模型具有类似的思维链过程,它们需要额外的时间和计算资源来处理答案。

由于后训练过程,OpenAI表示其开放AI模型擅长驱动AI智能体,能够在思维链过程中调用网络搜索或Python代码执行等工具。然而,OpenAI表示其开放模型仅支持文本,无法像该公司其他模型一样处理或生成图像和音频。

OpenAI在Apache 2.0许可证下发布gpt-oss-120b和gpt-oss-20b,这通常被认为是最宽松的许可证之一。该许可证允许企业在无需向该公司付费或获得许可的情况下将OpenAI的开放模型商业化。

然而,与AI2等AI实验室的完全开源产品不同,OpenAI表示不会发布用于创建其开放模型的训练数据。考虑到针对包括OpenAI在内的AI模型提供商的多项诉讼指控这些公司不当使用受版权保护的作品训练其AI模型,这一决定并不令人意外。

OpenAI在最近几个月多次推迟其开放模型的发布,部分原因是为了解决安全担忧。除了该公司的典型安全政策外,OpenAI在白皮书中表示还调查了恶意行为者是否可能微调其gpt-oss模型以在网络攻击或创建生物或化学武器方面提供更多帮助。

在OpenAI和第三方评估人员的测试后,该公司表示gpt-oss可能会略微增强生物能力。然而,即使在微调后,也没有发现证据表明这些开放模型能够达到其在这些领域的"高能力"危险阈值。

虽然OpenAI的模型似乎在开放模型中表现最先进,但开发者正热切期待DeepSeek R2(其下一代AI推理模型)的发布,以及Meta新超级智能实验室的新开放模型。

Q&A

Q1:OpenAI发布的这两款开源推理模型有什么区别?

A:OpenAI发布了两种规格的模型:gpt-oss-120b是功能更强大的大型模型,可在单个英伟达GPU上运行;gpt-oss-20b是轻量级模型,可在配备16GB内存的消费级笔记本电脑上运行。两款模型都具备与o系列模型相似的推理能力。

Q2:这些开源模型相比其他模型性能如何?

A:在Codeforces竞技编程测试中,这两款模型超越了DeepSeek的R1,但表现不及OpenAI自家的o3和o4-mini。在"人类最后考试"测试中同样如此。不过值得注意的是,这些开源模型的幻觉率较高,分别为49%和53%。

Q3:开发者可以如何使用OpenAI这些开源模型?

A:这两款模型可从Hugging Face平台免费下载,采用Apache 2.0许可证发布,允许企业无需付费即可商业化使用。当模型无法处理某些任务时,开发者还可以将开源模型连接到OpenAI功能更强大的封闭模型。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
杜月笙晚年找算命先生算命,算命先生一席话,杜月笙吓得浑身颤抖

杜月笙晚年找算命先生算命,算命先生一席话,杜月笙吓得浑身颤抖

千秋文化
2026-04-01 20:28:29
爆了!打出来了!33分10板10助4断!开拓者快交易杨瀚森!

爆了!打出来了!33分10板10助4断!开拓者快交易杨瀚森!

贵圈真乱
2026-04-06 11:35:40
中年夫妻更年期太扎心!网友吐槽,丈夫55岁内退,对啥都没兴趣了

中年夫妻更年期太扎心!网友吐槽,丈夫55岁内退,对啥都没兴趣了

火山詩话
2026-04-06 15:55:10
南京博物院事件真相来了:果然,那些人真狗啊!

南京博物院事件真相来了:果然,那些人真狗啊!

李月亮
2026-02-10 20:58:01
麦当劳推出“一指神器” 边吃汉堡边打游戏

麦当劳推出“一指神器” 边吃汉堡边打游戏

3DM游戏
2026-04-05 17:24:04
与黑鹰行动相比,美军此次成功解救飞行员,是川普军事改革的胜利

与黑鹰行动相比,美军此次成功解救飞行员,是川普军事改革的胜利

壹家言
2026-04-06 07:52:53
抓李镇全头发被罚下,米特里策社媒致歉:我失去了冷静没控制好自己

抓李镇全头发被罚下,米特里策社媒致歉:我失去了冷静没控制好自己

懂球帝
2026-04-06 15:04:10
控糖新选择:山姆大罐燕麦,糖尿病友的健康“主食宝藏”

控糖新选择:山姆大罐燕麦,糖尿病友的健康“主食宝藏”

南通濠生活
2026-04-06 00:10:23
中朝边境鸭绿江口现状:朝鲜领土正在不断增加,中方却在逐渐减少

中朝边境鸭绿江口现状:朝鲜领土正在不断增加,中方却在逐渐减少

普览
2026-02-26 21:29:19
王楚钦两度绝境反击,感人话语催泪,松岛发文点名三人

王楚钦两度绝境反击,感人话语催泪,松岛发文点名三人

格斗社
2026-04-06 14:11:36
65场限制让最佳阵容大洗牌!名嘴力挺马刺卡斯尔:亲眼看完我服了

65场限制让最佳阵容大洗牌!名嘴力挺马刺卡斯尔:亲眼看完我服了

仰卧撑FTUer
2026-04-06 15:43:05
杜月笙面馆吃饭,一伙地痞流氓找他要保护费,杜月笙:嫌命长吗?

杜月笙面馆吃饭,一伙地痞流氓找他要保护费,杜月笙:嫌命长吗?

千秋文化
2026-04-01 20:35:51
李宇春咋穿成这样?为艺术献身我真的看不懂

李宇春咋穿成这样?为艺术献身我真的看不懂

老吴教育课堂
2026-04-05 16:36:25
场均33.5分,得分王没了。
因为只打了64场。

场均33.5分,得分王没了。 因为只打了64场。

岁月有情1314
2026-04-06 18:33:58
张本智和父亲怒斥:请别再骂我儿子,他比99%的中国人都优秀!

张本智和父亲怒斥:请别再骂我儿子,他比99%的中国人都优秀!

拳击时空
2026-04-06 06:37:58
离婚10年,男子朋友圈刷前妻发讣告携子连夜奔丧:忘不了老人的好

离婚10年,男子朋友圈刷前妻发讣告携子连夜奔丧:忘不了老人的好

丫头舫
2026-04-06 10:10:58
中方已做最坏准备,一旦中美爆发战争,中国三大底牌一个比一个狠

中方已做最坏准备,一旦中美爆发战争,中国三大底牌一个比一个狠

独醉笑清风
2026-04-06 14:22:28
情人关系早已过时!2026最火的两性关系

情人关系早已过时!2026最火的两性关系

风起见你
2026-04-06 18:48:09
不怪国内那么多人想娶她,确实漂亮。

不怪国内那么多人想娶她,确实漂亮。

情感大头说说
2026-04-05 18:05:23
脑梗最危险信号,原来不是手脚麻,而是频繁出现这6个症状

脑梗最危险信号,原来不是手脚麻,而是频繁出现这6个症状

白话电影院
2026-04-06 18:19:45
2026-04-06 19:35:00
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
17425文章数 49697关注度
往期回顾 全部

科技要闻

前同事被蒸馏成Token,AI能否偷走职场经验

头条要闻

特朗普咆哮式发帖威胁伊朗 美政界人士:他像精神错乱

头条要闻

特朗普咆哮式发帖威胁伊朗 美政界人士:他像精神错乱

体育要闻

球员系列赛大满贯!赵心童10-3世界第一 加冕赛季第4冠

娱乐要闻

唐嫣罗晋新加坡遛娃,6岁女儿身高抢镜

财经要闻

史诗级暴跌"一周年" A股接下来如何走?

汽车要闻

阿维塔06T快上市了 旅行车还能这么玩?

态度原创

艺术
家居
数码
房产
健康

艺术要闻

草书入门的“最强宝典”!因内容太妙,作者不敢留名,比学王羲之都靠谱

家居要闻

温馨多元 爱的具象化

数码要闻

三星再挥涨价大棒:二季度DRAM价格拟飙升30%

房产要闻

小阳春全面启动!现房,才是这波行情里最稳的上车票

干细胞抗衰4大误区,90%的人都中招

无障碍浏览 进入关怀版