网易首页 > 网易号 > 正文 申请入驻

AI混战日:OpenAI开源、Claude发最强coding模型、Google惊艳的世界模型也亮相

0
分享至


硅谷最重要的三家模型大厂,同一天发布了各自非常具有节点意义的模型。这种混战日有阵子没见到了。

8月5日注定会成为AI技术和商业竞争格局演变里重要的一个时刻。

同一天,Google先扔出了Genie 3模型——一个你可以和模型生成的3D世界实时交互的世界模型。 接着Anthropic直接更新了它最主力的Claude Opus系列,发布Claude 4.1 Opus,coding能力继续突破。 然后OpenAI预告了许久许久的开源模型,也终于来了。如此前泄露的,OpenAI发布了名为GPT-oss的,开放权重的模型。这是它继GPT-2之后,再度开源它的语言模型。

三个模型发布在24小时内接连发生,但与过去充满火药味的直接竞争不同,这次各家更多是在各自擅长的领域展示着不同的进化方向。AI的叙事,正在从“谁的模型更强”的单一维度,走向更复杂和多元的竞争格局。

1

OpenAI GPT-oss:迟到的“开源”,精明的卡位

OpenAI终于交出了它的开放权重模型作业:GPT-oss,一个13B参数的密集模型。这并非一个能与GPT-4o或Claude 4.1匹敌的SOTA模型,其性能大致对标Llama 3 8B或Qwen2 7B。在一些基准测试上,它的表现甚至略逊于同量级对手。


但它的意义不在于性能,而在于“OpenAI”这个名字和它附带的许可证。

首先,依然要说,这不是一次彻底的开源。

GPT-oss使用的是OpenAI自定义的“OpenAI Model License 1.0”,其中最关键的条款是,禁止任何年度收入超过1亿美元或日活跃用户超过100万的商业实体,使用GPT-oss来开发或提供与OpenAI核心产品(如API、ChatGPT)竞争的服务。这个“毒丸”条款精准地将所有潜在的大公司竞争对手排除在外,同时又能让广大的中小开发者和研究者进入其生态。

其次,这是OpenAI自GPT-2以来首次开放权重,是一次重大的战略转向。它不再仅仅是那个高高在上的闭源领导者,而是试图通过一个“够用”的开放模型,将开发者吸引到它的生态系统中——用GPT-oss进行本地开发、微调,然后无缝迁移到更强大的OpenAI闭源模型上。


回到OpenAI为什么要发开源模型,一切都源于DeepSeek的冲击——当一个免费的开源的模型,达到了它闭源收费极高的模型对于它自己的大部分用户来说所感受到的水准,这是致命打击。今天的GPT-oss是OpenAI的一种防御,也是它想要做的生态扩张的动作,对抗DeepSeek、Qwen等开源力量对其开发者基础的侵蚀。

1

Google Genie 3:从生成世界到“玩”世界

GPT-oss更多是商业策略的产物,Google同日发布的Genie 3更多带来的是技术想象力。

Genie 3被定义为一个已经被说烂了的词——“世界模型”,但它还是更进了一步,不再满足于生成视频或3D资产,而是直接生成一个可交互的3D世界。


你给它一张图片、一段文字描述,甚至是一个草图,Genie 3就能创造出一个风格一致、符合物理逻辑的3D环境,并且允许你实时地在其中行动和互动。它能理解“向左走”、“跳起来”这类自然语言指令,并即时渲染出对应的第一人称视角画面。


这是通过一种名为“时空视频Transformer”(SVT)的架构实现的。Genie 3在超过20万小时的公开游戏视频(主要是2D平台游戏)上进行训练,学会了理解动作和世界的因果关系。它不仅能生成世界,还能推断出世界中不同物体和角色的行为模式。比如让一个细节处的树在不同场景永远保持一致。


这意味着AI第一次拥有了创造一个可供“玩耍”的虚拟空间的能力,为游戏开发、模拟器、机器人训练乃至元宇宙的实现路径,提供了一个极具震撼力的雏形。

Google的Genie 3收获了近乎一致的惊叹。英伟达的两位高级研究科学家Jim Fan和Phillip Isola不约而同地表达了震撼。Isola称其“太疯狂了”,而Jim Fan则形容这是“一次量子跃迁(quantum leap)”。


这个能从单张图片中幻想出整个互动游戏世界的AI,通过学习海量视频内化了物理世界的直观知识,可能正是通往通用机器人的一大步。

1

Claude 4.1 Opus:程序员的“新神”

Anthropic则继续在它最锋利的“矛”上加码。新发布的Claude 4.1 Opus,目标明确——成为最强的编程助手。

根据官方数据,在衡量代码生成、调试和逻辑推理能力的HumanEval+基准测试上,Claude 4.1 Opus的得分达到了惊人的85.2%,首次超越了此前由GPT-4o创下的84.9%的纪录。在内部的Agentic Coding评估中,它解决问题的能力也比前代提升了近一倍。


除了更强的能力,Claude 4.1还更快、更便宜。对于开发者和企业用户来说,这意味着在实际工作流中,AI coding的效率和性价比都得到了实质性提升。Anthropic依然是选择了一条最务实、离钱最近的道路。这现在已经是它的某种护城河了。

这些模型,尤其是OpenAI的开源模型在真实环境里的表现是接下来行业关注的重点。我们也会继续实际评测这些模型。而仔细观察,其实这次的“混战日”与过往非常不同,三个模型彼此之间并非直接的“互相狙击”,而更像是凑在一起把注意力放到最大。


这一方面说明,像OpenAI此前喜欢做的、抢在同一时间发布同类模型来压制对手的做法,在今天越来越难。GPT-5不再是一个完全能由开发团队自己决定训练完成节点的模型,而是一个更像实验的研究,需要等待诸多变量最终成熟。当你的大杀器无法准时就位时,单纯靠“实力”来竞争的阶段就过去了,策略变得重要,OpenAI用一个策略性的“开源”产品来稳固阵地成了必然选择。

另一方面,其实更重要的是,今天硅谷的重要公司们已经开始“分工明确”。

Anthropic的Claude在编程上的能力真的在“遥遥领先”,并且它也从中获得了好处并且打算把这个优势继续巩固下去;OpenAI则处于前所未有的动荡期,它投入更多精力来建设一整套生态系统,以维持住其仍然存在但也并不厚的先发优势,同时寄希望于等待GPT-5的成熟,这一套组合拳下来,稳住军心稳住估值把故事讲下去;而Google,在核心LLM能力追上第一梯队后,显然又开始扮演起“下一个Transformer时刻”的缔造者角色。从VEO3到Genie 3,它在投入别人没法或不愿投入的资源,去赌下一个范式的突破。

模型的进步没有停,AI世界更热闹了。

* 作者:Gemini Prompt:王兆洋

点个爱心,再走 吧

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美国以军事突袭方式抓捕主权国家领导人已是“惯犯”,上一次是抓捕巴拿马领导人诺列加,罪名也是“涉毒”

美国以军事突袭方式抓捕主权国家领导人已是“惯犯”,上一次是抓捕巴拿马领导人诺列加,罪名也是“涉毒”

极目新闻
2026-01-03 22:27:59
天冷了,少吃猪肉多吃它,比鱼肉便宜,比牛羊肉鲜美,随手一炒

天冷了,少吃猪肉多吃它,比鱼肉便宜,比牛羊肉鲜美,随手一炒

阿龙美食记
2025-11-08 14:10:15
明星哭穷“百万不够养家”?一查名下开公司、住豪宅,网友不买账

明星哭穷“百万不够养家”?一查名下开公司、住豪宅,网友不买账

蕾爸退休日记
2026-01-04 17:17:12
乌克兰一小时摧毁两套防空系统破纪录!新年重创俄多座炼油厂

乌克兰一小时摧毁两套防空系统破纪录!新年重创俄多座炼油厂

项鹏飞
2026-01-01 11:08:16
上海一游乐场娃娃机内放活物,顾客质疑机器内不适宜动物长期生存,商场回应:已撤离

上海一游乐场娃娃机内放活物,顾客质疑机器内不适宜动物长期生存,商场回应:已撤离

观威海
2026-01-04 09:26:04
吓!日本多地连发随机砍人伤人事件,有中国公民受伤!

吓!日本多地连发随机砍人伤人事件,有中国公民受伤!

英国报姐
2026-01-04 21:20:22
蒋介石枪毙韩复榘前,问冯玉祥意见,冯玉祥:我要有权早把他毙了

蒋介石枪毙韩复榘前,问冯玉祥意见,冯玉祥:我要有权早把他毙了

史之铭
2025-12-08 14:13:22
面相变了!退出春晚解散公司,贾玲近况曝光,如今下场并不意外

面相变了!退出春晚解散公司,贾玲近况曝光,如今下场并不意外

伴君终老
2026-01-05 01:02:49
老公常驻欧洲7年,同学聚会巧遇他公司高管,说:他5年前就辞职了

老公常驻欧洲7年,同学聚会巧遇他公司高管,说:他5年前就辞职了

红豆讲堂
2025-12-24 16:15:42
骑虎难下!面对美军入侵委内瑞拉,俄罗斯并没有更多合适的动作

骑虎难下!面对美军入侵委内瑞拉,俄罗斯并没有更多合适的动作

余們搞笑段子
2026-01-05 01:02:00
台军老兵叮嘱儿子:如果两岸开战,一枪干掉让你冲锋的长官!

台军老兵叮嘱儿子:如果两岸开战,一枪干掉让你冲锋的长官!

浩渺青史
2025-11-17 16:56:51
俄罗斯最高法院:批评政治人物不构成犯罪

俄罗斯最高法院:批评政治人物不构成犯罪

桂系007
2025-12-23 23:13:39
少女心:毛绒与格纹的甜系独白

少女心:毛绒与格纹的甜系独白

疾跑的小蜗牛
2025-12-31 18:01:58
淘宝成功,乐福逆袭成球队替补核心,一特质杨瀚森需要多向其学习

淘宝成功,乐福逆袭成球队替补核心,一特质杨瀚森需要多向其学习

拾叁懂球
2026-01-05 01:44:20
美国抓走马杜罗计划曾外泄 美媒收到计划后未公布

美国抓走马杜罗计划曾外泄 美媒收到计划后未公布

新京报
2026-01-04 13:56:12
特朗普公布马杜罗被捕后照片:戴手铐 双眼被黑布蒙住

特朗普公布马杜罗被捕后照片:戴手铐 双眼被黑布蒙住

界面新闻
2026-01-04 06:55:01
一位两袖清风的领袖,是如何用二十年搞垮一个发达国家

一位两袖清风的领袖,是如何用二十年搞垮一个发达国家

马探解说体育
2025-12-25 16:23:47
宝马5系给出14.09万优惠!网友直呼:这还要啥奔驰?

宝马5系给出14.09万优惠!网友直呼:这还要啥奔驰?

汽车网评
2026-01-04 21:31:57
被逮捕的四位央视主持人,以权谋私,出卖国家,个个都是阶下囚

被逮捕的四位央视主持人,以权谋私,出卖国家,个个都是阶下囚

林轻吟
2025-07-01 10:54:30
早日康复,摩纳哥全队身穿印“加油拓实”的T恤支持南野拓实

早日康复,摩纳哥全队身穿印“加油拓实”的T恤支持南野拓实

懂球帝
2026-01-04 11:42:18
2026-01-05 04:12:49
硅星人 incentive-icons
硅星人
硅(Si)是创造未来的基础,欢迎来到这个星球。
2765文章数 10425关注度
往期回顾 全部

科技要闻

雷军:骂小米汽车有流量,但别故意抹黑

头条要闻

拘押马杜罗的拘留中心"环境令人作呕" 内部画面披露

头条要闻

拘押马杜罗的拘留中心"环境令人作呕" 内部画面披露

体育要闻

女子世界第一,9年前在咖啡店洗碗

娱乐要闻

《小城大事》上星央八 热血筑梦正当时

财经要闻

李迅雷:扩内需必须把重心从"投"转向"消"

汽车要闻

最高续航310km 岚图泰山8或将上半年发布

态度原创

房产
亲子
教育
旅游
时尚

房产要闻

单盘最高狂卖64亿!海南楼市2025年最全榜单发布!

亲子要闻

同学们注意了!已被列入“黑名单”的6种饮料,一口都别再喝了!

教育要闻

备考27新传研究生需要知道的50件事。

旅游要闻

一票“畅玩”京津冀

这才是中年女人该有的打扮,不扮嫩、不穿花,简约大方还显贵

无障碍浏览 进入关怀版