网易首页 > 网易号 > 正文 申请入驻

硅谷三巨头齐放大招,现在就等梁文锋了

0
分享至


硅谷AI圈今年夏天的诸神之战昨夜正式拉开序幕——OpenAI在GPT-2之后终于再次拥抱开源,发布了一个“号称”最强的开源推理大模型gpt-oss.


谷歌同样没闲着,直接丢出了一个“开天辟地”式的大杀器——Genie 3。它可以让用户一句话生成一个长达数分钟的可以交互的三维虚拟世界,效果炸裂。

而OpenAI的老冤家,不认AGI只管在AI编程赛道上蒙眼狂奔的Anthropic也不甘寂寞。它更新了自己最顶(gui)级的大模型:Claude Opus 4.1,将AI编程能力的上限再次提升。


虽然在不同维度上,昨晚的3个新产品发布都具有相当重要的意义,但是这还只是未来几天硅谷AI圈“神仙打架”的序幕,好戏还在后面呢。

而且就像御三家之前发布的所有产品一样,背后团队中,国人依然是中流砥柱。所以,就连硅谷的吃瓜群众,也在期待来自东方的DeepSeek和Qwen。希望国内的AI力量,不会缺席这场夏末的AI盛宴。


01

OpenAI终于迎来了他的DeepSeek时刻


OpenAI时隔6年首次推出“开放权重”大语言模型:gpt-oss-120b和gpt-oss-20b。两个模型都采用了Transformer架构,并融入MoE设计。gpt-oss-120b总参数1170亿,激活参数51亿。gpt-oss-20b总参数210亿,每token激活36亿参数。

模型采用了分组多查询注意力机制,组大小为8,以及旋转位置编码(RoPE),原生支持128k上下文。

性能上来看,OpenAI官方的说法是现在同体量下开源推理模型的SOTA:


gpt-oss-120b模型在核心推理基准测试中实现了与 OpenAI o4-mini 接近的性能,可以在单张80 GB GPU 上高效运行。gpt-oss-20b 在常见基准测试中能达到与 OpenAI o3-mini 类似的性能,可以在仅具有 16 GB 内存的端侧运行。



从模型体量上来看,OpenAI这次放出的两个模型都是针对的本地部署的需求和市场,补齐之前的产品层面的短板。而且在许可证里,依然很鸡贼的进行了限制,不允许年收入高于1亿美元或者日活超过100万的实体商用。

发布之后,网友们也迫不及待地进行了本地化的部署,性能反馈还不错。


在RTX5090上运行20B的版本,每秒能达到160-180tokens的输出速度。


模型能力上看,用户的实际反馈也都还不错。这位网友在M4 MacBook上一次通过了3个常用的编程能力测试。


根据大模型能力测试机构Intelligence Evaluation公布的众测结果,OpenAI这两款模型的性能确实在远远小于DeepSeek R1和Qwen 3的体量下,获得了接近于两个中国开源模型的性能。


客观地说,这次模型的发布最大的意义在于让OpenAI再次回到了开源牌桌之上,让用户也多了一个方便单机本地部署,能力还不错的模型可以选择,但也只能算是一次补作业式的发布。而所有人对OpenAI的期待,依然还是落在之后到来的GPT-5上,到底OpenAI能给业界还能带来多大的震撼,让我们拭目以待。

02

谷歌Genie 3:炸裂,但是期货

虽然OpenAI没有放出GPT-5,但是谷歌也不会允许OpenAI独食流量,发布了一个非常“战未来”的模型——Genie-3。

像开头的视频一样,这是一个文生虚拟世界的模型,允许用户用文字生成一个720p清晰度24 FPS流畅度的动态世界实时交互的世界模型,具有非常好的一致性和真实感。用户可以自己用文字或按钮的方式来控制探索这个世界中的各个细节。


图注:走到一个铝架子旁边,然后走到那个大型的红色工业搅拌机旁边

通俗一点来说,如果说像Sora或者Veo 3这样的文生视频模型对应的是电影的话,Genie-3生成的就是一个游戏或者说一个虚拟剧本杀。用户不仅是在屏幕前看这个世界,更可以主动的通过自己的行为,和这个生成的世界进行互动。

而不同于视频模型的是,这样的“世界模型”需要对用户的行进实时的反馈和互动,而且还必须符合现实世界的基本逻辑规律。比如你用手向后推一个漂浮的气球,气球不能向天上飞,而要向后飞。你用手轻推一辆汽车,它不能马上就高速跑起来。

所以如果用户对于视频模型中一些小的瑕疵还能接受的话,世界模型就一定需要对物理反馈处理的非常精准,虽然不一定能到LeCun要求的“理解物理世界”的水平,但是相比于视频模型生成的一闪而过的画面,生成的虚拟世界如果处理不好这些物理交互逻辑,那就是没有意义的产品。

而我们看到谷歌提供的Demo中,随着用户输入不同的指令,世界会实时给出不同的反馈,生成不同的内容。想要做到这一点,需要的处理的技术问题是非常有挑战性的。


而如果在未来,谷歌真的能把这条路彻底跑通,且不说“世界模型”背后的技术对机器人和自动驾驶领域会不会产生什么颠覆性的改变,就算对VR,游戏以及文生视频行赛道生的影响,也将是难以想象的。

可惜的是,虽然Genie 3看起来足够惊艳,但依然停留在官方演示阶段,所有的发布内容都为官方放出,没有提供普通用户试用,还是经典的谷歌版期货。

但虽说是期货,可现如今,这样具有跨时代意义的产品和技术突破,似乎只有对AI进行饱和式火力覆盖的谷歌,才能做到。

从技术层面来讲,即便是像OpenAI这样的创业公司,也只能能在Transformer这一类模型上和谷歌形成你追我赶之势。虽然一年多以前,是OpenAI推出的Sora炸裂全场,拉爆了人们对于视频生成模型的期待。但是真正有实力能持续投入,在时间维度上持续保持领先的产品,依然是谷歌和它的Veo。而Genie 3,也是谷歌多年默默耕耘,迭代了数个大版本的成果。


考虑到即便是Transformer,也是发源于谷歌,希望它能善待每一株火苗,早日让我们感受到燎原的热浪。

03

偏科冠军的执着:2%提升


一张图就能很好地概括Anthropic昨晚的发布,AI编程能力上限又提高了2%。

但需要强调的是,这里的2%,不仅仅是Claude自己的提升,而是代表了现在AI编程能力的上限。


因为从用户真实反馈和市场占有率上来看,Claude Opus几乎就是现在AI Coding的口碑和占有率最高的模型。


而AI编码,几乎就是现阶段大模型商业化最彻底,未来上限最高的一个分支赛道。所以面对OpenAI的血脉压制,Anthropic选择的是将所有资源和精力都花在提升自己模型的编程能力上。通过这个竞争策略,让自己能够持续留在大模型商业化的牌桌上,保留同谷歌和OpenAI持续对抗的可能。

所以从这个角度说,Opus 4.1的发布,似乎是在另外两家发布补课和“战未来”的产品时,向自己的所有客户坚定地说,放心,你们选我错不了。

04

AI圣诞夜背后的国人力量

昨夜硅谷AI圈的三弹连发,背后依然少不了华人科学家和工程师的身影。


OpenAI发布的gpt-oss系列模型的核心团队成员之一,就有参与多个项目的北大校友任泓宇。


在OpenAI期间,他主要负责后训练团队,主要研究方向为语言模型训练优化。

而他现在,也已经被小扎重金挖到了Meta,成为了Meta超(一)级(亿)智(薪)能(酬)实验室的成员。

在去OpenAI之前,他曾经在苹果,微软,谷歌,英伟达都工作或者实习过。2018年从北大本科毕业后,他在斯坦福大学获得了计算机博士学位。


而在社交网络上,他也专门感谢了另一位华人科学家Wang Xin在项目后训练阶段的贡献。


她本科毕业于上海交大,后来在加州大学伯克利分校获得了计算机博士学位。


之后在微软,苹果工作过,于今年2月份加入了OpenAI,主要负责模型的后训练工作。

而在谷歌发布Genie 3团队名单中,也有1名华人参与。


Emma Wang本科毕业于上海交通大学,在哈佛大学获得博士学位。2019年博士毕业后加入谷歌,主要负责模型的优化。2023年,她加入了DeepMind团队,之后参与了Genie 3服务系统的设计和优化了,降低了10倍的延迟,大大提升了模型的吞吐量,从让模型而实现了24fps的流畅度和亚秒级响应延迟。



欢迎在评论区留言~
如需开白请加小编微信:dongfangmark


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
网友比赛前搜哈日本赢,网友调侃:发国补了

网友比赛前搜哈日本赢,网友调侃:发国补了

映射生活的身影
2026-01-26 01:59:15
六旬老人跟团北京5日游,第3天猝死!连续两天凌晨集合,导游临时在车上通知增加游览项目,法院判了

六旬老人跟团北京5日游,第3天猝死!连续两天凌晨集合,导游临时在车上通知增加游览项目,法院判了

扬子晚报
2026-01-24 22:29:57
退脏衣女记者全网社死!正脸很白净,坏到骨子里,山东文旅遭围攻

退脏衣女记者全网社死!正脸很白净,坏到骨子里,山东文旅遭围攻

观察鉴娱
2026-01-26 08:49:45
陈惠敏亲自来到深圳送别梁小龙最后一面,可是他也老得不能看了!

陈惠敏亲自来到深圳送别梁小龙最后一面,可是他也老得不能看了!

小娱乐悠悠
2026-01-26 11:11:09
国防部新闻发言人蒋斌就近期涉军问题发布消息

国防部新闻发言人蒋斌就近期涉军问题发布消息

中国军视网
2026-01-24 15:55:20
美国运动员成功徒手攀爬台北101,蒋万安:累计动员上百人次整备

美国运动员成功徒手攀爬台北101,蒋万安:累计动员上百人次整备

海峡导报社
2026-01-25 18:26:10
掉下去必死!31岁美国男子徒手攀爬台北101:91分钟登顶 看着都怕

掉下去必死!31岁美国男子徒手攀爬台北101:91分钟登顶 看着都怕

风过乡
2026-01-25 17:36:53
县道桥梁4根桥墩3根开裂?福建福鼎市交通局:2009年建成,初查主体结构正常,将养护加固

县道桥梁4根桥墩3根开裂?福建福鼎市交通局:2009年建成,初查主体结构正常,将养护加固

大风新闻
2026-01-26 12:06:03
雷军无奈宣布:全部下架!

雷军无奈宣布:全部下架!

电动知家
2026-01-25 15:31:25
不到24小时,19国同意加入,特朗普却突然改口,向联合国释放信号

不到24小时,19国同意加入,特朗普却突然改口,向联合国释放信号

书纪文谭
2026-01-25 20:33:26
南京地铁集团有限公司原党委委员、副总经理许巧祥接受纪律审查和监察调查

南京地铁集团有限公司原党委委员、副总经理许巧祥接受纪律审查和监察调查

扬子晚报
2026-01-26 12:37:04
主要政府官员将随行,有望重启“黄金时代”对话,英国期待首相访华“开新篇”

主要政府官员将随行,有望重启“黄金时代”对话,英国期待首相访华“开新篇”

环球网资讯
2026-01-26 06:59:08
死亡率高达75%!印度暴发疫情,或人传人,潜伏期最长45天,尚无疫苗

死亡率高达75%!印度暴发疫情,或人传人,潜伏期最长45天,尚无疫苗

上观新闻
2026-01-26 10:17:11
伊朗宣布:“散布镇压抗议视频”属重罪,可判死刑

伊朗宣布:“散布镇压抗议视频”属重罪,可判死刑

桂系007
2026-01-26 08:58:31
委内瑞拉爆发示威

委内瑞拉爆发示威

陆弃
2026-01-25 11:04:33
李湘的事儿大吗?

李湘的事儿大吗?

奖一罚十
2026-01-23 21:25:51
日本为何禁肉1200年?乃是统治者“制度设计”,解禁后人均身高迅速上涨

日本为何禁肉1200年?乃是统治者“制度设计”,解禁后人均身高迅速上涨

齐天候
2026-01-25 23:29:25
172:233!日本新首相人选出炉,高市开始豪赌,最后三种可能性

172:233!日本新首相人选出炉,高市开始豪赌,最后三种可能性

时时有聊
2026-01-25 21:11:46
晚点独家丨可灵AI月活破1200万,AI规模化生产好内容的拐点将至

晚点独家丨可灵AI月活破1200万,AI规模化生产好内容的拐点将至

晚点LatePost
2026-01-21 14:09:35
“中国正遵循拿破仑名言:别在对手犯错时打断他”

“中国正遵循拿破仑名言:别在对手犯错时打断他”

观察者网
2026-01-26 09:05:09
2026-01-26 13:35:00
直面派 incentive-icons
直面派
讲述值得讲述的真实故事
245文章数 236关注度
往期回顾 全部

科技要闻

印奇再上牌桌,阶跃融资50亿

头条要闻

被自称前女友的网友实名举报涉毒 短剧"顶流":别搞我

头条要闻

被自称前女友的网友实名举报涉毒 短剧"顶流":别搞我

体育要闻

叛逆的大公子,要砸了贝克汉姆这块招牌

娱乐要闻

张雨绮被实名举报代孕、插足婚姻

财经要闻

从美式斩杀线看中国社会的制度韧性构建

汽车要闻

宾利第四台Batur敞篷版发布 解锁四项定制创新

态度原创

本地
艺术
时尚
房产
家居

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

艺术要闻

溥心畬的花鸟,淡雅清新

伊姐周日热推:电视剧《太平年》;电视剧《暗恋者的救赎》......

房产要闻

6大碾压级优势!2025海口最强书包房来了!

家居要闻

流韵雅居,让复杂变纯粹

无障碍浏览 进入关怀版