网易首页 > 网易号 > 正文 申请入驻

AI混战日:OpenAI开源、Claude发最强coding模型、Google惊艳的世界模型也亮相

0
分享至


硅谷最重要的三家模型大厂,同一天发布了各自非常具有节点意义的模型。这种混战日有阵子没见到了。

8月5日注定会成为AI技术和商业竞争格局演变里重要的一个时刻。

同一天,Google先扔出了Genie 3模型——一个你可以和模型生成的3D世界实时交互的世界模型。 接着Anthropic直接更新了它最主力的Claude Opus系列,发布Claude 4.1 Opus,coding能力继续突破。 然后OpenAI预告了许久许久的开源模型,也终于来了。如此前泄露的,OpenAI发布了名为GPT-oss的,开放权重的模型。这是它继GPT-2之后,再度开源它的语言模型。

三个模型发布在24小时内接连发生,但与过去充满火药味的直接竞争不同,这次各家更多是在各自擅长的领域展示着不同的进化方向。AI的叙事,正在从“谁的模型更强”的单一维度,走向更复杂和多元的竞争格局。

1

OpenAI GPT-oss:迟到的“开源”,精明的卡位

OpenAI终于交出了它的开放权重模型作业:GPT-oss,一个13B参数的密集模型。这并非一个能与GPT-4o或Claude 4.1匹敌的SOTA模型,其性能大致对标Llama 3 8B或Qwen2 7B。在一些基准测试上,它的表现甚至略逊于同量级对手。


但它的意义不在于性能,而在于“OpenAI”这个名字和它附带的许可证。

首先,依然要说,这不是一次彻底的开源。

GPT-oss使用的是OpenAI自定义的“OpenAI Model License 1.0”,其中最关键的条款是,禁止任何年度收入超过1亿美元或日活跃用户超过100万的商业实体,使用GPT-oss来开发或提供与OpenAI核心产品(如API、ChatGPT)竞争的服务。这个“毒丸”条款精准地将所有潜在的大公司竞争对手排除在外,同时又能让广大的中小开发者和研究者进入其生态。

其次,这是OpenAI自GPT-2以来首次开放权重,是一次重大的战略转向。它不再仅仅是那个高高在上的闭源领导者,而是试图通过一个“够用”的开放模型,将开发者吸引到它的生态系统中——用GPT-oss进行本地开发、微调,然后无缝迁移到更强大的OpenAI闭源模型上。


回到OpenAI为什么要发开源模型,一切都源于DeepSeek的冲击——当一个免费的开源的模型,达到了它闭源收费极高的模型对于它自己的大部分用户来说所感受到的水准,这是致命打击。今天的GPT-oss是OpenAI的一种防御,也是它想要做的生态扩张的动作,对抗DeepSeek、Qwen等开源力量对其开发者基础的侵蚀。

1

Google Genie 3:从生成世界到“玩”世界

GPT-oss更多是商业策略的产物,Google同日发布的Genie 3更多带来的是技术想象力。

Genie 3被定义为一个已经被说烂了的词——“世界模型”,但它还是更进了一步,不再满足于生成视频或3D资产,而是直接生成一个可交互的3D世界。


你给它一张图片、一段文字描述,甚至是一个草图,Genie 3就能创造出一个风格一致、符合物理逻辑的3D环境,并且允许你实时地在其中行动和互动。它能理解“向左走”、“跳起来”这类自然语言指令,并即时渲染出对应的第一人称视角画面。


这是通过一种名为“时空视频Transformer”(SVT)的架构实现的。Genie 3在超过20万小时的公开游戏视频(主要是2D平台游戏)上进行训练,学会了理解动作和世界的因果关系。它不仅能生成世界,还能推断出世界中不同物体和角色的行为模式。比如让一个细节处的树在不同场景永远保持一致。


这意味着AI第一次拥有了创造一个可供“玩耍”的虚拟空间的能力,为游戏开发、模拟器、机器人训练乃至元宇宙的实现路径,提供了一个极具震撼力的雏形。

Google的Genie 3收获了近乎一致的惊叹。英伟达的两位高级研究科学家Jim Fan和Phillip Isola不约而同地表达了震撼。Isola称其“太疯狂了”,而Jim Fan则形容这是“一次量子跃迁(quantum leap)”。


这个能从单张图片中幻想出整个互动游戏世界的AI,通过学习海量视频内化了物理世界的直观知识,可能正是通往通用机器人的一大步。

1

Claude 4.1 Opus:程序员的“新神”

Anthropic则继续在它最锋利的“矛”上加码。新发布的Claude 4.1 Opus,目标明确——成为最强的编程助手。

根据官方数据,在衡量代码生成、调试和逻辑推理能力的HumanEval+基准测试上,Claude 4.1 Opus的得分达到了惊人的85.2%,首次超越了此前由GPT-4o创下的84.9%的纪录。在内部的Agentic Coding评估中,它解决问题的能力也比前代提升了近一倍。


除了更强的能力,Claude 4.1还更快、更便宜。对于开发者和企业用户来说,这意味着在实际工作流中,AI coding的效率和性价比都得到了实质性提升。Anthropic依然是选择了一条最务实、离钱最近的道路。这现在已经是它的某种护城河了。

这些模型,尤其是OpenAI的开源模型在真实环境里的表现是接下来行业关注的重点。我们也会继续实际评测这些模型。而仔细观察,其实这次的“混战日”与过往非常不同,三个模型彼此之间并非直接的“互相狙击”,而更像是凑在一起把注意力放到最大。


这一方面说明,像OpenAI此前喜欢做的、抢在同一时间发布同类模型来压制对手的做法,在今天越来越难。GPT-5不再是一个完全能由开发团队自己决定训练完成节点的模型,而是一个更像实验的研究,需要等待诸多变量最终成熟。当你的大杀器无法准时就位时,单纯靠“实力”来竞争的阶段就过去了,策略变得重要,OpenAI用一个策略性的“开源”产品来稳固阵地成了必然选择。

另一方面,其实更重要的是,今天硅谷的重要公司们已经开始“分工明确”。

Anthropic的Claude在编程上的能力真的在“遥遥领先”,并且它也从中获得了好处并且打算把这个优势继续巩固下去;OpenAI则处于前所未有的动荡期,它投入更多精力来建设一整套生态系统,以维持住其仍然存在但也并不厚的先发优势,同时寄希望于等待GPT-5的成熟,这一套组合拳下来,稳住军心稳住估值把故事讲下去;而Google,在核心LLM能力追上第一梯队后,显然又开始扮演起“下一个Transformer时刻”的缔造者角色。从VEO3到Genie 3,它在投入别人没法或不愿投入的资源,去赌下一个范式的突破。

模型的进步没有停,AI世界更热闹了。

* 作者:Gemini Prompt:王兆洋

点个爱心,再走 吧

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
原来我们都被骗了,陈若琳恋情真相大白,郭晶晶的话早有预兆

原来我们都被骗了,陈若琳恋情真相大白,郭晶晶的话早有预兆

枫尘余往逝
2025-11-04 18:47:49
利物浦1.36亿打水漂?新援灾难表现带到世预赛!2失良机+球荒15场

利物浦1.36亿打水漂?新援灾难表现带到世预赛!2失良机+球荒15场

我爱英超
2025-11-15 06:53:18
一旦台海爆发冲突,最难的不是台湾,而是距大陆仅50公里的东引岛

一旦台海爆发冲突,最难的不是台湾,而是距大陆仅50公里的东引岛

放开他让wo来
2025-11-08 22:41:14
至此,蔡振华留下的王牌全部打完了

至此,蔡振华留下的王牌全部打完了

中场阴谋家
2025-11-01 08:18:57
吴艳妮穿紧身三角裤太窄被批“露骨”,到底碍了谁的眼?

吴艳妮穿紧身三角裤太窄被批“露骨”,到底碍了谁的眼?

傲娇的马甲线
2025-09-17 18:06:44
三胎天王嫂的大瓜?

三胎天王嫂的大瓜?

热闹吃瓜大姐
2025-11-13 20:34:24
韩国有多强?李在明:全世界能打赢我们的国家,只有四个!

韩国有多强?李在明:全世界能打赢我们的国家,只有四个!

南宗历史
2025-11-15 19:32:39
刘銮雄长子移居英国晒近照,两鬓花白身姿健硕,在当地陪子女生活

刘銮雄长子移居英国晒近照,两鬓花白身姿健硕,在当地陪子女生活

揽星河的笔记
2025-11-11 19:10:19
薄一波晚年反省,当年不该支持此人上台,他给国家带来大麻烦

薄一波晚年反省,当年不该支持此人上台,他给国家带来大麻烦

扬平说史
2025-11-06 20:22:42
生活普法|92、95、98是否都属于卖淫?

生活普法|92、95、98是否都属于卖淫?

奇葩游戏酱
2025-11-09 01:23:56
清仓后为何偏留100股?许多散户仍懵懂,此文给你讲透

清仓后为何偏留100股?许多散户仍懵懂,此文给你讲透

慧眼看世界哈哈
2025-11-14 10:23:45
2026年初运势全面反弹,事业爱情双丰收的三个星座,未来越来越旺

2026年初运势全面反弹,事业爱情双丰收的三个星座,未来越来越旺

小晴星座说
2025-11-15 19:41:40
全运会乒乓:王曼昱拒绝让分轰11-0,马龙首秀丢局,陈熠剃光头

全运会乒乓:王曼昱拒绝让分轰11-0,马龙首秀丢局,陈熠剃光头

知轩体育
2025-11-14 22:56:39
震撼!潍坊藏着山东最大水库:当年7万人挖出来的,如今美成仙境

震撼!潍坊藏着山东最大水库:当年7万人挖出来的,如今美成仙境

青眼财经
2025-11-14 21:34:08
欧盟没想到:中国大棒朝他来了,同意供货,但又一个“前提条件”

欧盟没想到:中国大棒朝他来了,同意供货,但又一个“前提条件”

娱乐的硬糖吖
2025-11-15 15:50:32
中国可能已被五场战争包围,最先爆发战争的可能不是台湾

中国可能已被五场战争包围,最先爆发战争的可能不是台湾

boss外传
2025-10-17 15:30:03
赴日签证大变天!游客“薅羊毛”的时代或将结束...

赴日签证大变天!游客“薅羊毛”的时代或将结束...

今日日本
2025-11-13 14:05:13
中国不算最差的!世界十大人口大国:仍有4国没参加过世界杯!

中国不算最差的!世界十大人口大国:仍有4国没参加过世界杯!

邱泽云
2025-11-15 17:37:03
霍震霆没想到,儿媳郭晶晶再次官宣喜讯,让整个富太圈沉默

霍震霆没想到,儿媳郭晶晶再次官宣喜讯,让整个富太圈沉默

乡野小珥
2025-11-14 00:17:03
广东:女子给男性剪发,穿着难以想象,网友:正经吗?

广东:女子给男性剪发,穿着难以想象,网友:正经吗?

心轩专栏
2025-11-02 21:59:42
2025-11-15 22:31:00
硅星人 incentive-icons
硅星人
硅(Si)是创造未来的基础,欢迎来到这个星球。
2633文章数 10398关注度
往期回顾 全部

科技要闻

撕掉流量外衣,小米还剩什么?

头条要闻

高市对华挑衅后日本同时被四国痛批 特朗普划清界限

头条要闻

高市对华挑衅后日本同时被四国痛批 特朗普划清界限

体育要闻

樊振东和他的尖子班 勇闯地表最强乒乓球赛

娱乐要闻

钟嘉欣婚变风波升级!被骗婚?

财经要闻

小米之“惑”

汽车要闻

"冰彩沙"全配齐 红旗HS6 PHEV预售17.88万起

态度原创

艺术
游戏
家居
旅游
公开课

艺术要闻

惊艳!她的造型和用色让人叹为观止!

《超英派遣中心》IGN 9分:第二季还要等多久出?

家居要闻

现代简逸 寻找生活的光

旅游要闻

【2025打卡中国】淮安松弛感拉满 法国博主:原来这就是《西游记》作者家乡!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版