网易首页 > 网易号 > 正文 申请入驻

OpenAI、谷歌等深夜更新多款模型,展示开源、智能体、世界模型进展

0
分享至

北京时间8月6日凌晨,多家海外大模型厂商发布了最新产品。AI创业公司Anthropic发布了Claude Opus 4.1,称这一模型是Opus 4在代理任务、现实世界编码和推理方面的升级版。谷歌推出了新一代世界模型Genie 3,并表示这是公司第一个支持实时交互的世界模型。OpenAI则开源了gpt-oss-120b和gpt-oss-20b两个推理模型,这是OpenAI时隔六年再次开源模型。

这三家大模型厂商的新产品面向的使用场景各不相同,但不难看出,通过此次新品发布,OpenAI和Anthropic都展示了产品策略上变化。

其中,OpenAI的开闭源策略发生了转变。随着DeepSeek引领开源的方向,今年4月,OpenAI CEO山姆·奥尔特曼(Sam Altman)就表示,OpenAI认为推出强大、有推理能力的新开源模型“非常重要”。此次OpenAI兑现了推出新开源模型的承诺。山姆·奥尔特曼称,这两款开源模型是OpenAI耗资数十亿美元的研究成果。

此次OpenAI开源的gpt-oss-120b参数量为1170亿,采用MoE(专家)架构,激活参数量51亿。另一个开源模型gpt-oss-20b参数量为210亿,同样采用MoE架构,激活参数量36亿。

据OpenAI公布的基准测试结果,gpt-oss-120b在竞赛编码、工具调用基准测试中的得分接近或超过闭源的o4-mini模型,gpt-oss-20b在基准测试中的分数则与o3-mini相当或超过o3-mini。这两款模型的推理性能在开源模型中都属于第一梯队。

值得注意的是,此次OpenAI更新的重点不仅在于开源,还在于让新模型可以在电脑、手机这类端侧设备上本地部署。

gpt-oss-120b可以在单张80GB容量的GPU上运行,gpt-oss-20b可以16GB内存的消费级设备上运行。据OpenAI展示的视频,将gpt-oss-120b本地部署在电脑上,该模型可以根据提示词生成一个射击类游戏,改变提示词后,还能将游戏中的图标变成草莓的形状。山姆·奥尔特曼表示,这两款开源模型能在笔记本上本地部署,gpt-oss-20b还能部署在手机上。

Anthropic的策略改变,则是决定更频繁地推出产品渐进式更新,而不是只专注于更新重大版本。此次Anthropic推出了Claude Opus 4.1。该公司表示,以往公司只专注于发布重大版本更新,此次更新意味着公司转向推动编码模型渐进式改进,公司还将在未来几周内推出更多更新。

从新发布的产品看,Claude Opus 4.1主要是在深入研究、数据分析、代理(agentic)搜索方面的能力也比前一代有所提升。Anthropic表示,新产品擅长处理复杂的多步骤问题,该公司将其定位为更有效的AI智能体(Agent)。

在SWE-bench Verify基准测试中,Claude Opus 4.1得分74.5%,超过Opus 4的72.5%,显示编码能力较前一代有所提升。此外,该模型在Terminal-Bench(代理终端编程)、GPQA Diamond(研究生级别推理能力)、MMMLU(多语言问答)基准测试中的得分分别为43.3%、80.9%、89.5%,超过Opus 4的39.2%、79.6%、88.8%。据Anthropic介绍,GitHub平台用户、Rakuten Group客户的反馈显示,Opus 4.1在代码修改精准度和调试效率上有明显改善。

谷歌则是沿着世界模型的路径往前迈了一步。

在去年推出Genie 1和Genie 2世界模型以及Veo 2和Veo3视频生成模型的基础上,此次谷歌推出通用世界模型Genie 3。不同于以往,Genie 3是谷歌第一个允许进行实时交互的世界模型。谷歌称,世界模型是迈向AGI(通用人工智能)的关键垫脚石,因为世界模型允许AI智能体在丰富的模拟环境中不受限制地训练,同时能为机器人训练提供场所。

据谷歌介绍,Genie 3可以生成多样化的交互环境。该模型对世界物理特性的建模可以模拟水、光等自然现象,可以生成包含动物、植物在内的生态系统,还可以创造动画角色,并模拟复杂环境下各种元素的相互作用。在Genie 3生成的动态世界里,可以以每秒24帧的速度进行导航,并在720p的分辨率下保持长达几分钟的画面一致性,该模型的视觉记忆还可以追溯至一分钟前。

据谷歌发布的演示视频,生成机器人跑步的画面,Genie 2只能生成8秒具有一致性的画面,而Genie 3可以生成长达几分钟的画面;Genie 3可以模拟灯光节期间在水面上行驶的摩托艇,摩托艇撞到灯笼、岸边的效果十分真实;输入提示词“教室前的黑板写着Genie-3,下面用粉笔画着苹果、咖啡和树,教室空无一人,窗外是树木和行驶的汽车”,Genie 3生成的画面是一个推进的视角,展示了黑板,然后镜头转向旁边的窗户,能看到窗外的汽车和树木,画面十分自然逼真。

不过,谷歌也指出,虽然Genie 3突破了世界模型的能力边界,但仍有局限性,例如,可执行的动作空间有限、难以在一个共享环境中模拟多个智能体的交互、难以准确模拟真实世界的位置、交互持续时长无法长达数小时。

虽然标志着基础大模型迭代的GPT-5迟迟未能面世,但这些频繁的大模型更新,仍展示了AI的能力在继续升级。无论是开源可供端侧部署的模型、推动智能体技术演进还是让世界模型变得可以交互,都让大模型的可用性有所增加。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
为进组做准备,颖儿直播打热玛吉,疼到捏扁解压球,太敬业了

为进组做准备,颖儿直播打热玛吉,疼到捏扁解压球,太敬业了

TVB的四小花
2026-03-26 13:38:07
带娃出国的中产后悔了:想回来,但回国失败

带娃出国的中产后悔了:想回来,但回国失败

视觉志
2026-03-24 10:36:13
迟迟都等不到中企复工,巴拿马头号帮手已介入,中方加强港口管制

迟迟都等不到中企复工,巴拿马头号帮手已介入,中方加强港口管制

黑鹰观军事
2026-03-25 13:49:59
全球首次!俄军10倍音速锆石高超音速导弹发射车:最后一刻被摧毁

全球首次!俄军10倍音速锆石高超音速导弹发射车:最后一刻被摧毁

Ck的蜜糖
2026-03-26 12:30:25
中国选美冠军白欣禾,胸前的美人痣真好看,仙气飘飘像刘奕菲

中国选美冠军白欣禾,胸前的美人痣真好看,仙气飘飘像刘奕菲

可乐谈情感
2026-03-24 18:06:38
Anthropic冲塔ASI自进化,要做全球操作系统!Claude OS一刀砍向6.4万亿帝国

Anthropic冲塔ASI自进化,要做全球操作系统!Claude OS一刀砍向6.4万亿帝国

新智元
2026-03-25 19:40:39
千万粉丝挖机小何塌房了,挖机被厂家回收,厂家出面爆出真相

千万粉丝挖机小何塌房了,挖机被厂家回收,厂家出面爆出真相

新游戏大妹子
2026-03-26 13:10:14
克拉拉擦边香艳床戏包贝尔再演坏淫!这部网大爽得太肤浅

克拉拉擦边香艳床戏包贝尔再演坏淫!这部网大爽得太肤浅

释凡电影
2026-03-24 04:57:40
好消息!湖北多地将放“春假”!

好消息!湖北多地将放“春假”!

越乔
2026-03-26 15:04:49
登顶Top.1,女神新作又爆了

登顶Top.1,女神新作又爆了

来看美剧
2026-03-24 19:35:04
有一种“算计”叫郭晋安欧倩怡,离婚一年后才看懂郭晋安有多精明

有一种“算计”叫郭晋安欧倩怡,离婚一年后才看懂郭晋安有多精明

小椰的奶奶
2026-03-27 00:02:26
老友鼓励加图索晋级世界杯,但意大利锋线却只能依赖20岁的他

老友鼓励加图索晋级世界杯,但意大利锋线却只能依赖20岁的他

里芃芃体育
2026-03-27 00:10:08
杜锋下课警钟敲响,球迷贴脸输出,赛后点名陈家政争议发言遭声讨

杜锋下课警钟敲响,球迷贴脸输出,赛后点名陈家政争议发言遭声讨

晚雾空青
2026-03-26 14:00:12
为啥一听说给农民涨养老金,就有一群人激烈反对?真相太沉重

为啥一听说给农民涨养老金,就有一群人激烈反对?真相太沉重

复转这些年
2026-03-14 23:48:05
成龙昔日兰博基尼,705万被山东小伙买走,全球就这1辆,车牌很讲究

成龙昔日兰博基尼,705万被山东小伙买走,全球就这1辆,车牌很讲究

西莫的艺术宫殿
2026-03-23 20:15:44
复出遥遥无期!热刺进攻核心再次接受手术 此前已伤缺10月

复出遥遥无期!热刺进攻核心再次接受手术 此前已伤缺10月

雪狼侃体育
2026-03-26 23:13:58
出大事了,美以陷入孤立,特朗普连夜反水,德总统公开嘲讽美国

出大事了,美以陷入孤立,特朗普连夜反水,德总统公开嘲讽美国

无人倾听无人倾听
2026-03-26 23:16:56
丫蛋有三个孩子,大儿子王天琦是她与前夫王金龙所生,2011年出生

丫蛋有三个孩子,大儿子王天琦是她与前夫王金龙所生,2011年出生

南权先生
2026-03-23 15:17:49
乌干达高层放话支持以色列:历史恩怨正在反转

乌干达高层放话支持以色列:历史恩怨正在反转

桂系007
2026-03-26 23:58:56
穷可以让一个女人卑微到什么程度?看网友的评论引起万千共鸣

穷可以让一个女人卑微到什么程度?看网友的评论引起万千共鸣

夜深爱杂谈
2026-03-01 21:28:54
2026-03-27 01:00:49
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
248338文章数 621905关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

旅游
教育
数码
房产
公开课

旅游要闻

老外为羊拿铁扎堆魔都街头 法国游客花式夸上海

教育要闻

精准研判,提质增效丨我校召开2026届毕业生就业工作研判会

数码要闻

英特尔发Q1.26版Arc Pro专业显卡驱动,支持B70 / B65显卡

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版