网易首页 > 网易号 > 正文 申请入驻

AI混战日:OpenAI开源、Claude发最强coding模型、Google惊艳的世界模型也亮相

0
分享至

硅谷最重要的三家模型大厂,同一天发布了各自非常具有节点意义的模型。这种混战日有阵子没见到了。

8月5日注定会成为AI技术和商业竞争格局演变里重要的一个时刻。

同一天,Google先扔出了Genie 3模型——一个你可以和模型生成的3D世界实时交互的世界模型。 接着Anthropic直接更新了它最主力的Claude Opus系列,发布Claude 4.1 Opus,coding能力继续突破。 然后OpenAI预告了许久许久的开源模型,也终于来了。如此前泄露的,OpenAI发布了名为GPT-oss的,开放权重的模型。这是它继GPT-2之后,再度开源它的语言模型。

三个模型发布在24小时内接连发生,但与过去充满火药味的直接竞争不同,这次各家更多是在各自擅长的领域展示着不同的进化方向。AI的叙事,正在从“谁的模型更强”的单一维度,走向更复杂和多元的竞争格局。

1

OpenAI GPT-oss:迟到的“开源”,精明的卡位

OpenAI终于交出了它的开放权重模型作业:GPT-oss,一个13B参数的密集模型。这并非一个能与GPT-4o或Claude 4.1匹敌的SOTA模型,其性能大致对标Llama 3 8B或Qwen2 7B。在一些基准测试上,它的表现甚至略逊于同量级对手。

但它的意义不在于性能,而在于“OpenAI”这个名字和它附带的许可证。

首先,依然要说,这不是一次彻底的开源。

GPT-oss使用的是OpenAI自定义的“OpenAI Model License 1.0”,其中最关键的条款是,禁止任何年度收入超过1亿美元或日活跃用户超过100万的商业实体,使用GPT-oss来开发或提供与OpenAI核心产品(如API、ChatGPT)竞争的服务。这个“毒丸”条款精准地将所有潜在的大公司竞争对手排除在外,同时又能让广大的中小开发者和研究者进入其生态。

其次,这是OpenAI自GPT-2以来首次开放权重,是一次重大的战略转向。它不再仅仅是那个高高在上的闭源领导者,而是试图通过一个“够用”的开放模型,将开发者吸引到它的生态系统中——用GPT-oss进行本地开发、微调,然后无缝迁移到更强大的OpenAI闭源模型上。

回到OpenAI为什么要发开源模型,一切都源于DeepSeek的冲击——当一个免费的开源的模型,达到了它闭源收费极高的模型对于它自己的大部分用户来说所感受到的水准,这是致命打击。今天的GPT-oss是OpenAI的一种防御,也是它想要做的生态扩张的动作,对抗DeepSeek、Qwen等开源力量对其开发者基础的侵蚀。

1

Google Genie 3:从生成世界到“玩”世界

GPT-oss更多是商业策略的产物,Google同日发布的Genie 3更多带来的是技术想象力。

Genie 3被定义为一个已经被说烂了的词——“世界模型”,但它还是更进了一步,不再满足于生成视频或3D资产,而是直接生成一个可交互的3D世界。

你给它一张图片、一段文字描述,甚至是一个草图,Genie 3就能创造出一个风格一致、符合物理逻辑的3D环境,并且允许你实时地在其中行动和互动。它能理解“向左走”、“跳起来”这类自然语言指令,并即时渲染出对应的第一人称视角画面。

这是通过一种名为“时空视频Transformer”(SVT)的架构实现的。Genie 3在超过20万小时的公开游戏视频(主要是2D平台游戏)上进行训练,学会了理解动作和世界的因果关系。它不仅能生成世界,还能推断出世界中不同物体和角色的行为模式。比如让一个细节处的树在不同场景永远保持一致。

这意味着AI第一次拥有了创造一个可供“玩耍”的虚拟空间的能力,为游戏开发、模拟器、机器人训练乃至元宇宙的实现路径,提供了一个极具震撼力的雏形。

Google的Genie 3收获了近乎一致的惊叹。英伟达的两位高级研究科学家Jim Fan和Phillip Isola不约而同地表达了震撼。Isola称其“太疯狂了”,而Jim Fan则形容这是“一次量子跃迁(quantum leap)”。

这个能从单张图片中幻想出整个互动游戏世界的AI,通过学习海量视频内化了物理世界的直观知识,可能正是通往通用机器人的一大步。

1

Claude 4.1 Opus:程序员的“新神”

Anthropic则继续在它最锋利的“矛”上加码。新发布的Claude 4.1 Opus,目标明确——成为最强的编程助手。

根据官方数据,在衡量代码生成、调试和逻辑推理能力的HumanEval+基准测试上,Claude 4.1 Opus的得分达到了惊人的85.2%,首次超越了此前由GPT-4o创下的84.9%的纪录。在内部的Agentic Coding评估中,它解决问题的能力也比前代提升了近一倍。

除了更强的能力,Claude 4.1还更快、更便宜。对于开发者和企业用户来说,这意味着在实际工作流中,AI coding的效率和性价比都得到了实质性提升。Anthropic依然是选择了一条最务实、离钱最近的道路。这现在已经是它的某种护城河了。

这些模型,尤其是OpenAI的开源模型在真实环境里的表现是接下来行业关注的重点。我们也会继续实际评测这些模型。而仔细观察,其实这次的“混战日”与过往非常不同,三个模型彼此之间并非直接的“互相狙击”,而更像是凑在一起把注意力放到最大。

这一方面说明,像OpenAI此前喜欢做的、抢在同一时间发布同类模型来压制对手的做法,在今天越来越难。GPT-5不再是一个完全能由开发团队自己决定训练完成节点的模型,而是一个更像实验的研究,需要等待诸多变量最终成熟。当你的大杀器无法准时就位时,单纯靠“实力”来竞争的阶段就过去了,策略变得重要,OpenAI用一个策略性的“开源”产品来稳固阵地成了必然选择。

另一方面,其实更重要的是,今天硅谷的重要公司们已经开始“分工明确”。

Anthropic的Claude在编程上的能力真的在“遥遥领先”,并且它也从中获得了好处并且打算把这个优势继续巩固下去;OpenAI则处于前所未有的动荡期,它投入更多精力来建设一整套生态系统,以维持住其仍然存在但也并不厚的先发优势,同时寄希望于等待GPT-5的成熟,这一套组合拳下来,稳住军心稳住估值把故事讲下去;而Google,在核心LLM能力追上第一梯队后,显然又开始扮演起“下一个Transformer时刻”的缔造者角色。从VEO3到Genie 3,它在投入别人没法或不愿投入的资源,去赌下一个范式的突破。

模型的进步没有停,AI世界更热闹了。

* 作者:Gemini Prompt:王兆洋

点个爱心,再走 吧

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
黄仁勋给大家指出一条明路

黄仁勋给大家指出一条明路

贩财局
2026-05-12 16:36:15
三名美人并排站着,你最偏爱哪一个

三名美人并排站着,你最偏爱哪一个

可乐谈情感
2026-05-13 01:20:36
世界杯还没开踢,中国球迷先“退票”了

世界杯还没开踢,中国球迷先“退票”了

每日经济新闻
2026-05-11 22:56:12
越来越多的小城市和县城,只剩下体制内经济了!

越来越多的小城市和县城,只剩下体制内经济了!

灯锦年
2026-05-12 21:06:47
八村垒谈成为自由球员:我爱湖人,但谈判的事还是交给经纪人

八村垒谈成为自由球员:我爱湖人,但谈判的事还是交给经纪人

懂球帝
2026-05-12 18:21:06
曹操撩寡妇时说的金句,如今成了约会开场白,男人经常挂在嘴边

曹操撩寡妇时说的金句,如今成了约会开场白,男人经常挂在嘴边

掠影后有感
2026-05-11 11:31:38
国乒凯旋回京,蒯曼父亲公开长文,全网吵翻了

国乒凯旋回京,蒯曼父亲公开长文,全网吵翻了

生活新鲜市
2026-05-13 05:32:49
他是汪精卫都厌恶的汉奸,花200金条逃走,晚年出书5元售价无人买

他是汪精卫都厌恶的汉奸,花200金条逃走,晚年出书5元售价无人买

大运河时空
2026-05-11 16:30:05
完整监控曝光!故意挑衅逆行撞死一人的小伙已无生命危险

完整监控曝光!故意挑衅逆行撞死一人的小伙已无生命危险

映射生活的身影
2026-05-11 20:29:40
穿礼服后退款后续:女子身份曝光社死,工作遭牵连,商家准备起诉

穿礼服后退款后续:女子身份曝光社死,工作遭牵连,商家准备起诉

八斗小先生
2026-05-12 17:23:09
记者:麦基和斯佩尔曼这俩大爷的态度 北京未来很难过上海这一关

记者:麦基和斯佩尔曼这俩大爷的态度 北京未来很难过上海这一关

狼叔评论
2026-05-13 01:50:16
抢在中方接机前,特朗普随行人员名单变了,英伟达第一个被踢出局

抢在中方接机前,特朗普随行人员名单变了,英伟达第一个被踢出局

影孖看世界
2026-05-12 21:58:56
《低智商犯罪》:近期最解压的悬疑喜剧

《低智商犯罪》:近期最解压的悬疑喜剧

阿废冷眼观察所
2026-05-12 19:31:01
3分钟倾家荡产?年入千亿“精神鸦片”,正精准掏空中国人的钱包

3分钟倾家荡产?年入千亿“精神鸦片”,正精准掏空中国人的钱包

潋滟晴方DAY
2026-05-13 01:49:48
“汉坦病毒”来袭,医生提醒:宁可每天看电视,也不要出门做6事

“汉坦病毒”来袭,医生提醒:宁可每天看电视,也不要出门做6事

路医生健康科普
2026-05-11 17:39:53
她不顾家人反对嫁给大17岁男人,生下一个女儿,丈夫让她很意外

她不顾家人反对嫁给大17岁男人,生下一个女儿,丈夫让她很意外

仙味少女心
2026-05-12 02:16:23
如果在家突发心梗,黄金6分钟自救法,快了解,关键时刻可自救

如果在家突发心梗,黄金6分钟自救法,快了解,关键时刻可自救

健康科普365
2026-01-20 16:05:03
张柏芝谢霆锋活动偶遇,他那一秒的表情,让全网都破防了…

张柏芝谢霆锋活动偶遇,他那一秒的表情,让全网都破防了…

陈意小可爱
2026-05-12 13:04:00
这不是选举,而是一场生死之战:美国选民的真实觉醒

这不是选举,而是一场生死之战:美国选民的真实觉醒

斌闻天下
2026-05-11 08:31:49
彭加木被找到了!知情人:DNA专家说99%就是彭加木,但有个遗憾!

彭加木被找到了!知情人:DNA专家说99%就是彭加木,但有个遗憾!

拳击时空
2026-05-12 05:55:35
2026-05-13 06:44:49
硅星人 incentive-icons
硅星人
硅(Si)是创造未来的基础,欢迎来到这个星球。
3073文章数 10497关注度
往期回顾 全部

科技要闻

宇树发布载人变形机甲,定价390万元起

头条要闻

特朗普称将同中方讨论对台军售和黎智英案 外交部回应

头条要闻

特朗普称将同中方讨论对台军售和黎智英案 外交部回应

体育要闻

骑士终于玩明白了?

娱乐要闻

白鹿风波升级!掉粉20万评论区沦陷

财经要闻

利润再腰斩 京东干外卖后就没过过好日子

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

数码
时尚
家居
健康
军事航空

数码要闻

看电视的人越来越多了 3亿台电视在线 小米第一

普通人真该学学如何穿搭!多穿裙子比裤子更时髦,大方提气质

家居要闻

极简主义下的居住场域与空间

干细胞能让人“返老还童”吗

军事要闻

知情人士披露:美国或考虑恢复对伊朗军事行动

无障碍浏览 进入关怀版