网易首页 > 网易号 > 正文 申请入驻

AI混战日:OpenAI开源、Claude发最强coding模型、Google惊艳的世界模型也亮相

0
分享至

硅谷最重要的三家模型大厂,同一天发布了各自非常具有节点意义的模型。这种混战日有阵子没见到了。

8月5日注定会成为AI技术和商业竞争格局演变里重要的一个时刻。

同一天,Google先扔出了Genie 3模型——一个你可以和模型生成的3D世界实时交互的世界模型。 接着Anthropic直接更新了它最主力的Claude Opus系列,发布Claude 4.1 Opus,coding能力继续突破。 然后OpenAI预告了许久许久的开源模型,也终于来了。如此前泄露的,OpenAI发布了名为GPT-oss的,开放权重的模型。这是它继GPT-2之后,再度开源它的语言模型。

三个模型发布在24小时内接连发生,但与过去充满火药味的直接竞争不同,这次各家更多是在各自擅长的领域展示着不同的进化方向。AI的叙事,正在从“谁的模型更强”的单一维度,走向更复杂和多元的竞争格局。

1

OpenAI GPT-oss:迟到的“开源”,精明的卡位

OpenAI终于交出了它的开放权重模型作业:GPT-oss,一个13B参数的密集模型。这并非一个能与GPT-4o或Claude 4.1匹敌的SOTA模型,其性能大致对标Llama 3 8B或Qwen2 7B。在一些基准测试上,它的表现甚至略逊于同量级对手。

但它的意义不在于性能,而在于“OpenAI”这个名字和它附带的许可证。

首先,依然要说,这不是一次彻底的开源。

GPT-oss使用的是OpenAI自定义的“OpenAI Model License 1.0”,其中最关键的条款是,禁止任何年度收入超过1亿美元或日活跃用户超过100万的商业实体,使用GPT-oss来开发或提供与OpenAI核心产品(如API、ChatGPT)竞争的服务。这个“毒丸”条款精准地将所有潜在的大公司竞争对手排除在外,同时又能让广大的中小开发者和研究者进入其生态。

其次,这是OpenAI自GPT-2以来首次开放权重,是一次重大的战略转向。它不再仅仅是那个高高在上的闭源领导者,而是试图通过一个“够用”的开放模型,将开发者吸引到它的生态系统中——用GPT-oss进行本地开发、微调,然后无缝迁移到更强大的OpenAI闭源模型上。

回到OpenAI为什么要发开源模型,一切都源于DeepSeek的冲击——当一个免费的开源的模型,达到了它闭源收费极高的模型对于它自己的大部分用户来说所感受到的水准,这是致命打击。今天的GPT-oss是OpenAI的一种防御,也是它想要做的生态扩张的动作,对抗DeepSeek、Qwen等开源力量对其开发者基础的侵蚀。

1

Google Genie 3:从生成世界到“玩”世界

GPT-oss更多是商业策略的产物,Google同日发布的Genie 3更多带来的是技术想象力。

Genie 3被定义为一个已经被说烂了的词——“世界模型”,但它还是更进了一步,不再满足于生成视频或3D资产,而是直接生成一个可交互的3D世界。

你给它一张图片、一段文字描述,甚至是一个草图,Genie 3就能创造出一个风格一致、符合物理逻辑的3D环境,并且允许你实时地在其中行动和互动。它能理解“向左走”、“跳起来”这类自然语言指令,并即时渲染出对应的第一人称视角画面。

这是通过一种名为“时空视频Transformer”(SVT)的架构实现的。Genie 3在超过20万小时的公开游戏视频(主要是2D平台游戏)上进行训练,学会了理解动作和世界的因果关系。它不仅能生成世界,还能推断出世界中不同物体和角色的行为模式。比如让一个细节处的树在不同场景永远保持一致。

这意味着AI第一次拥有了创造一个可供“玩耍”的虚拟空间的能力,为游戏开发、模拟器、机器人训练乃至元宇宙的实现路径,提供了一个极具震撼力的雏形。

Google的Genie 3收获了近乎一致的惊叹。英伟达的两位高级研究科学家Jim Fan和Phillip Isola不约而同地表达了震撼。Isola称其“太疯狂了”,而Jim Fan则形容这是“一次量子跃迁(quantum leap)”。

这个能从单张图片中幻想出整个互动游戏世界的AI,通过学习海量视频内化了物理世界的直观知识,可能正是通往通用机器人的一大步。

1

Claude 4.1 Opus:程序员的“新神”

Anthropic则继续在它最锋利的“矛”上加码。新发布的Claude 4.1 Opus,目标明确——成为最强的编程助手。

根据官方数据,在衡量代码生成、调试和逻辑推理能力的HumanEval+基准测试上,Claude 4.1 Opus的得分达到了惊人的85.2%,首次超越了此前由GPT-4o创下的84.9%的纪录。在内部的Agentic Coding评估中,它解决问题的能力也比前代提升了近一倍。

除了更强的能力,Claude 4.1还更快、更便宜。对于开发者和企业用户来说,这意味着在实际工作流中,AI coding的效率和性价比都得到了实质性提升。Anthropic依然是选择了一条最务实、离钱最近的道路。这现在已经是它的某种护城河了。

这些模型,尤其是OpenAI的开源模型在真实环境里的表现是接下来行业关注的重点。我们也会继续实际评测这些模型。而仔细观察,其实这次的“混战日”与过往非常不同,三个模型彼此之间并非直接的“互相狙击”,而更像是凑在一起把注意力放到最大。

这一方面说明,像OpenAI此前喜欢做的、抢在同一时间发布同类模型来压制对手的做法,在今天越来越难。GPT-5不再是一个完全能由开发团队自己决定训练完成节点的模型,而是一个更像实验的研究,需要等待诸多变量最终成熟。当你的大杀器无法准时就位时,单纯靠“实力”来竞争的阶段就过去了,策略变得重要,OpenAI用一个策略性的“开源”产品来稳固阵地成了必然选择。

另一方面,其实更重要的是,今天硅谷的重要公司们已经开始“分工明确”。

Anthropic的Claude在编程上的能力真的在“遥遥领先”,并且它也从中获得了好处并且打算把这个优势继续巩固下去;OpenAI则处于前所未有的动荡期,它投入更多精力来建设一整套生态系统,以维持住其仍然存在但也并不厚的先发优势,同时寄希望于等待GPT-5的成熟,这一套组合拳下来,稳住军心稳住估值把故事讲下去;而Google,在核心LLM能力追上第一梯队后,显然又开始扮演起“下一个Transformer时刻”的缔造者角色。从VEO3到Genie 3,它在投入别人没法或不愿投入的资源,去赌下一个范式的突破。

模型的进步没有停,AI世界更热闹了。

* 作者:Gemini Prompt:王兆洋

点个爱心,再走 吧

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
广东:力争到2026年底 建成50个以上特色鲜明、功能突出的生产性服务业集聚区

广东:力争到2026年底 建成50个以上特色鲜明、功能突出的生产性服务业集聚区

财联社
2026-03-26 10:15:09
中东睿评|表层冲突烈火焚烧,深层矛盾坚如寒冰:美以对伊朗战争的表与里

中东睿评|表层冲突烈火焚烧,深层矛盾坚如寒冰:美以对伊朗战争的表与里

澎湃新闻
2026-03-25 13:14:37
法国艺术圈地震!芭蕾女神、哲学少女,都被钢琴家送给了爱泼斯坦!

法国艺术圈地震!芭蕾女神、哲学少女,都被钢琴家送给了爱泼斯坦!

新欧洲
2026-02-18 19:44:34
别想再回国!中国体坛 4 大叛徒,夺冠后否认是国人,如今遭报应

别想再回国!中国体坛 4 大叛徒,夺冠后否认是国人,如今遭报应

动物奇奇怪怪
2026-03-25 14:18:48
叔本华:性欲是一切欲望的焦点

叔本华:性欲是一切欲望的焦点

听哲学
2026-03-24 21:42:04
87年薄一波去杭州探望陈云,期间二人神秘交谈,薄提醒:你悠着点

87年薄一波去杭州探望陈云,期间二人神秘交谈,薄提醒:你悠着点

谈古论今历史有道
2026-03-25 15:15:03
张雪峰死因:吃外卖撑住了?

张雪峰死因:吃外卖撑住了?

李万卿
2026-03-26 10:48:19
前球探:切尔西担忧加纳乔的表现,他在曼联的问题又出现了

前球探:切尔西担忧加纳乔的表现,他在曼联的问题又出现了

懂球帝
2026-03-26 12:27:11
稳居西部第二!马刺三大年轻核心,已成联盟无解难题!

稳居西部第二!马刺三大年轻核心,已成联盟无解难题!

田先生篮球
2026-03-26 14:23:29
丑橘是转基因水果?专家直言:这几种水果,再便宜也不要买

丑橘是转基因水果?专家直言:这几种水果,再便宜也不要买

白宸侃片
2026-03-26 11:19:02
农用无人机载客!大疆:吊销“驾照”

农用无人机载客!大疆:吊销“驾照”

热点科技
2026-03-26 11:30:59
四川高县村支书暴打残疾村妇致轻伤 法院判决免于刑事处罚引争议

四川高县村支书暴打残疾村妇致轻伤 法院判决免于刑事处罚引争议

律法刑道
2026-03-26 10:55:03
中国资产,大涨!美联储,降息大消息!

中国资产,大涨!美联储,降息大消息!

中国基金报
2026-03-26 08:22:37
1955年蒋介石想吃奉化老家的黄花泥螺,保密局知道后如何搞到的?

1955年蒋介石想吃奉化老家的黄花泥螺,保密局知道后如何搞到的?

铜臭的历史味
2026-03-16 13:05:54
林彪的儿子要结婚,叶群在全国选美,毛主席得知说了5个字

林彪的儿子要结婚,叶群在全国选美,毛主席得知说了5个字

扬平说史
2026-03-25 21:04:04
曼联标价700万卖滕哈格爱将!2次出租英冠均重伤,实力平庸还倒霉

曼联标价700万卖滕哈格爱将!2次出租英冠均重伤,实力平庸还倒霉

罗米的曼联博客
2026-03-26 11:16:06
英国上将揭露:1997年香港回归真相,谁敢抗衡中国解放军?

英国上将揭露:1997年香港回归真相,谁敢抗衡中国解放军?

老范谈史
2026-03-18 23:51:08
马奎尔曝续约曼联最后要求,评价红牌停赛!重返国家队让妈妈落泪

马奎尔曝续约曼联最后要求,评价红牌停赛!重返国家队让妈妈落泪

罗米的曼联博客
2026-03-26 12:11:02
美军全球调兵、要打地面战争?伊朗:要给特朗普一个“巨大惊喜”

美军全球调兵、要打地面战争?伊朗:要给特朗普一个“巨大惊喜”

野史日记
2026-03-25 10:00:12
巴拿马接手港口仅一个月,中远海运集运宣布恢复中东六国新订舱业务!

巴拿马接手港口仅一个月,中远海运集运宣布恢复中东六国新订舱业务!

趣味萌宠的日常
2026-03-26 14:04:01
2026-03-26 15:16:49
硅星人 incentive-icons
硅星人
硅(Si)是创造未来的基础,欢迎来到这个星球。
2959文章数 10472关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

头条要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

数码
时尚
家居
本地
艺术

数码要闻

配件制造商清单泄露:2026款iPad将搭载A18芯片

2026年了,最好看的还是“这件针织”!

家居要闻

傍海而居 静观蝴蝶海

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

艺术要闻

哪一座桥不是风景?

无障碍浏览 进入关怀版