网易首页 > 网易号 > 正文 申请入驻

AI混战日:OpenAI开源、Claude发最强coding模型、Google惊艳的世界模型也亮相

0
分享至

硅谷最重要的三家模型大厂,同一天发布了各自非常具有节点意义的模型。这种混战日有阵子没见到了。

8月5日注定会成为AI技术和商业竞争格局演变里重要的一个时刻。

同一天,Google先扔出了Genie 3模型——一个你可以和模型生成的3D世界实时交互的世界模型。 接着Anthropic直接更新了它最主力的Claude Opus系列,发布Claude 4.1 Opus,coding能力继续突破。 然后OpenAI预告了许久许久的开源模型,也终于来了。如此前泄露的,OpenAI发布了名为GPT-oss的,开放权重的模型。这是它继GPT-2之后,再度开源它的语言模型。

三个模型发布在24小时内接连发生,但与过去充满火药味的直接竞争不同,这次各家更多是在各自擅长的领域展示着不同的进化方向。AI的叙事,正在从“谁的模型更强”的单一维度,走向更复杂和多元的竞争格局。

1

OpenAI GPT-oss:迟到的“开源”,精明的卡位

OpenAI终于交出了它的开放权重模型作业:GPT-oss,一个13B参数的密集模型。这并非一个能与GPT-4o或Claude 4.1匹敌的SOTA模型,其性能大致对标Llama 3 8B或Qwen2 7B。在一些基准测试上,它的表现甚至略逊于同量级对手。

但它的意义不在于性能,而在于“OpenAI”这个名字和它附带的许可证。

首先,依然要说,这不是一次彻底的开源。

GPT-oss使用的是OpenAI自定义的“OpenAI Model License 1.0”,其中最关键的条款是,禁止任何年度收入超过1亿美元或日活跃用户超过100万的商业实体,使用GPT-oss来开发或提供与OpenAI核心产品(如API、ChatGPT)竞争的服务。这个“毒丸”条款精准地将所有潜在的大公司竞争对手排除在外,同时又能让广大的中小开发者和研究者进入其生态。

其次,这是OpenAI自GPT-2以来首次开放权重,是一次重大的战略转向。它不再仅仅是那个高高在上的闭源领导者,而是试图通过一个“够用”的开放模型,将开发者吸引到它的生态系统中——用GPT-oss进行本地开发、微调,然后无缝迁移到更强大的OpenAI闭源模型上。

回到OpenAI为什么要发开源模型,一切都源于DeepSeek的冲击——当一个免费的开源的模型,达到了它闭源收费极高的模型对于它自己的大部分用户来说所感受到的水准,这是致命打击。今天的GPT-oss是OpenAI的一种防御,也是它想要做的生态扩张的动作,对抗DeepSeek、Qwen等开源力量对其开发者基础的侵蚀。

1

Google Genie 3:从生成世界到“玩”世界

GPT-oss更多是商业策略的产物,Google同日发布的Genie 3更多带来的是技术想象力。

Genie 3被定义为一个已经被说烂了的词——“世界模型”,但它还是更进了一步,不再满足于生成视频或3D资产,而是直接生成一个可交互的3D世界。

你给它一张图片、一段文字描述,甚至是一个草图,Genie 3就能创造出一个风格一致、符合物理逻辑的3D环境,并且允许你实时地在其中行动和互动。它能理解“向左走”、“跳起来”这类自然语言指令,并即时渲染出对应的第一人称视角画面。

这是通过一种名为“时空视频Transformer”(SVT)的架构实现的。Genie 3在超过20万小时的公开游戏视频(主要是2D平台游戏)上进行训练,学会了理解动作和世界的因果关系。它不仅能生成世界,还能推断出世界中不同物体和角色的行为模式。比如让一个细节处的树在不同场景永远保持一致。

这意味着AI第一次拥有了创造一个可供“玩耍”的虚拟空间的能力,为游戏开发、模拟器、机器人训练乃至元宇宙的实现路径,提供了一个极具震撼力的雏形。

Google的Genie 3收获了近乎一致的惊叹。英伟达的两位高级研究科学家Jim Fan和Phillip Isola不约而同地表达了震撼。Isola称其“太疯狂了”,而Jim Fan则形容这是“一次量子跃迁(quantum leap)”。

这个能从单张图片中幻想出整个互动游戏世界的AI,通过学习海量视频内化了物理世界的直观知识,可能正是通往通用机器人的一大步。

1

Claude 4.1 Opus:程序员的“新神”

Anthropic则继续在它最锋利的“矛”上加码。新发布的Claude 4.1 Opus,目标明确——成为最强的编程助手。

根据官方数据,在衡量代码生成、调试和逻辑推理能力的HumanEval+基准测试上,Claude 4.1 Opus的得分达到了惊人的85.2%,首次超越了此前由GPT-4o创下的84.9%的纪录。在内部的Agentic Coding评估中,它解决问题的能力也比前代提升了近一倍。

除了更强的能力,Claude 4.1还更快、更便宜。对于开发者和企业用户来说,这意味着在实际工作流中,AI coding的效率和性价比都得到了实质性提升。Anthropic依然是选择了一条最务实、离钱最近的道路。这现在已经是它的某种护城河了。

这些模型,尤其是OpenAI的开源模型在真实环境里的表现是接下来行业关注的重点。我们也会继续实际评测这些模型。而仔细观察,其实这次的“混战日”与过往非常不同,三个模型彼此之间并非直接的“互相狙击”,而更像是凑在一起把注意力放到最大。

这一方面说明,像OpenAI此前喜欢做的、抢在同一时间发布同类模型来压制对手的做法,在今天越来越难。GPT-5不再是一个完全能由开发团队自己决定训练完成节点的模型,而是一个更像实验的研究,需要等待诸多变量最终成熟。当你的大杀器无法准时就位时,单纯靠“实力”来竞争的阶段就过去了,策略变得重要,OpenAI用一个策略性的“开源”产品来稳固阵地成了必然选择。

另一方面,其实更重要的是,今天硅谷的重要公司们已经开始“分工明确”。

Anthropic的Claude在编程上的能力真的在“遥遥领先”,并且它也从中获得了好处并且打算把这个优势继续巩固下去;OpenAI则处于前所未有的动荡期,它投入更多精力来建设一整套生态系统,以维持住其仍然存在但也并不厚的先发优势,同时寄希望于等待GPT-5的成熟,这一套组合拳下来,稳住军心稳住估值把故事讲下去;而Google,在核心LLM能力追上第一梯队后,显然又开始扮演起“下一个Transformer时刻”的缔造者角色。从VEO3到Genie 3,它在投入别人没法或不愿投入的资源,去赌下一个范式的突破。

模型的进步没有停,AI世界更热闹了。

* 作者:Gemini Prompt:王兆洋

点个爱心,再走 吧

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
四强又只剩王楚钦了!7人相继被淘汰,林诗栋引失望,陈垣宇惊喜

四强又只剩王楚钦了!7人相继被淘汰,林诗栋引失望,陈垣宇惊喜

篮球资讯达人
2026-02-28 22:31:49
哈梅内伊四位亲属据称在袭击中身亡!伊南部一体育馆遭空袭,20名女排球员丧生,伊方:科威特美海军基地所有基础设施被摧毁,大量美军伤亡

哈梅内伊四位亲属据称在袭击中身亡!伊南部一体育馆遭空袭,20名女排球员丧生,伊方:科威特美海军基地所有基础设施被摧毁,大量美军伤亡

每日经济新闻
2026-03-01 09:22:18
美以联手袭击,黄金、美元、A股将迎来怎样的变化?

美以联手袭击,黄金、美元、A股将迎来怎样的变化?

文曲塘财经研究
2026-02-28 20:03:29
5-2!独造3球,9500万欧先生踢疯了!4连胜,利物浦积分追平曼联

5-2!独造3球,9500万欧先生踢疯了!4连胜,利物浦积分追平曼联

体育世界
2026-03-01 01:20:40
春节消费大洗牌!烟酒卖不动,它却暴涨500倍,或称赚钱新风口

春节消费大洗牌!烟酒卖不动,它却暴涨500倍,或称赚钱新风口

圆梦的小老头
2026-03-01 01:40:20
刚开战就反转?外媒称伊朗获中国反舰王牌,白宫彻底坐不住了

刚开战就反转?外媒称伊朗获中国反舰王牌,白宫彻底坐不住了

胖福的小木屋
2026-02-28 21:40:48
后续!绝情臭豆腐最新进展:负责人正脸曝光社死,店老板公开道歉

后续!绝情臭豆腐最新进展:负责人正脸曝光社死,店老板公开道歉

离离言几许
2026-02-28 18:08:15
一年流出视频294部的小宝到底探过多少朵花?

一年流出视频294部的小宝到底探过多少朵花?

挪威森林
2026-01-25 17:18:42
伊朗外长披露哈梅内伊最新情况

伊朗外长披露哈梅内伊最新情况

第一财经资讯
2026-02-28 23:22:00
山西婚闹致死案:新郎被4个伴郎暴打致死,婚礼结束直接办丧事

山西婚闹致死案:新郎被4个伴郎暴打致死,婚礼结束直接办丧事

明智家庭教育
2025-12-02 11:20:34
普拉蒂尼:现在没有特别突出的球员,上一个真正杰出的是梅西

普拉蒂尼:现在没有特别突出的球员,上一个真正杰出的是梅西

懂球帝
2026-03-01 01:18:21
3000万打工人逃离北上广,却不知道县城已被161个家族瓜分

3000万打工人逃离北上广,却不知道县城已被161个家族瓜分

流苏晚晴
2026-02-27 18:06:43
伊朗外交部声明!

伊朗外交部声明!

环球时报国际
2026-02-28 22:46:42
火箭内讧爆发!乌度卡愤怒批评,刺头想要揍他,态度太差该放弃了

火箭内讧爆发!乌度卡愤怒批评,刺头想要揍他,态度太差该放弃了

你的篮球频道
2026-03-01 07:35:41
伊朗伊斯兰共和国军队发布第1号公告

伊朗伊斯兰共和国军队发布第1号公告

界面新闻
2026-02-28 19:53:31
河村勇辉本场首发出战34分钟 得到11分19助4篮板1抢断

河村勇辉本场首发出战34分钟 得到11分19助4篮板1抢断

环球体坛啄木鸟
2026-02-28 17:16:45
结婚不到一年,娶了“白月光”的李国庆,口碑彻底反转了

结婚不到一年,娶了“白月光”的李国庆,口碑彻底反转了

萧鑟科普解说
2026-02-26 06:07:11
感谢美国:五毛一度的中国电,换个姿势就能卖11元

感谢美国:五毛一度的中国电,换个姿势就能卖11元

星海情报局
2026-02-28 18:00:35
“清华学霸”李一诺:27岁博士毕业,4年生3个娃,替世界首富花钱

“清华学霸”李一诺:27岁博士毕业,4年生3个娃,替世界首富花钱

北有南栀
2026-02-28 17:55:03
镖人血亏2亿,吴京不服,又抬三部狠片,要问鼎中国第一巨星了

镖人血亏2亿,吴京不服,又抬三部狠片,要问鼎中国第一巨星了

娱乐圈笔娱君
2026-02-28 18:15:17
2026-03-01 10:40:50
硅星人 incentive-icons
硅星人
硅(Si)是创造未来的基础,欢迎来到这个星球。
2894文章数 10458关注度
往期回顾 全部

科技要闻

小米超跑概念车全球首秀!杀入顶豪俱乐部

头条要闻

哈梅内伊遇袭身亡 特朗普:被击毙的领导人都无计可施

头条要闻

哈梅内伊遇袭身亡 特朗普:被击毙的领导人都无计可施

体育要闻

球队主力全报销?顶风摆烂演都不演了

娱乐要闻

周杰伦儿子正面照曝光,与父亲好像

财经要闻

中东局势升级 如何影响A股、黄金和原油

汽车要闻

极石汽车2月交付1298台 销量涨至上年200%

态度原创

健康
旅游
艺术
数码
军事航空

转头就晕的耳石症,能开车上班吗?

旅游要闻

跟着“滇超”去旅行 | 大理⇌保山:风花雪月遇上边地烟火

艺术要闻

2025第四届“精神·图式”——中国写意油画双年展 | 入选油画选刊

数码要闻

小米穿戴2月OTA更新进展公布,覆盖手环、手表产品

军事要闻

美国以色列联合袭击伊朗 实时战况

无障碍浏览 进入关怀版