GPT5发布,没有Meta什么事,落寞的小扎,只有一张图在寥寥几个群里传播。
![]()
我很好奇,为什么扎克伯格成为了SOTA(State-of-the-Art)顶级AI大模型的局外人?顶级的Cycle里并没有Meta?
![]()
追问了好几个关于Meta的AI研究的问题,我恍然大惊!离2010年的《社交网络》过去了15年,小扎这是弄出来了一个AI网络啊!不信,我给你讲一个汹涌澎湃,荡气回肠的故事。
![]()
1
AI狂飙(上):迷失的车手与引擎的咆哮
第一幕:迷失
2022年,AI纪元的发令枪早已打响。赛道上,所有顶级车队的引擎都在疯狂轰鸣,准备争夺一个前所未有的冠军。然而,就在所有人都紧盯着前方时,曾经的王者车手、Meta车队的队长扎克伯格,却猛地一打方向盘,背离了拥挤的沥青主路。
![]()
他选择了一条没人走过的赛道——一片名为“元宇宙”的无垠沙漠。他坚信,这里隐藏着通往终点的捷径,能让他避开激烈的缠斗,率先撞线。于是,他驾驶着自己昂贵的赛车,在黄沙中追逐着海市蜃楼般的幻影,身后的引擎声浪渐渐被风沙所吞没。
突然,一道刺眼的白色闪电从主赛道上划破天际!由车手奥特曼(Sam Altman)率领的OpenAI车队,驾驶着他们那台名为“ChatGPT”的神秘赛车,以一种近乎作弊的速度刷新了所有圈速记录。
![]()
全场沸腾,欢呼声震耳欲聋。那一刻,扎克伯格正停在空旷的沙漠里,从后视镜中,只看到了对手卷起的漫天尘土。
他彻底迷失了方向。曾经的赛道之王,如今被远远地甩在了身后。他意识到,自己不仅输掉了时间,更输掉了观众的目光和对未来的定义权。再不回到主赛道,他连对手的尾灯都将永远看不到。这场代价高昂的沙漠之旅,必须立刻结束。
第二幕:回归
没有片刻犹豫!扎克伯格一脚踩死刹车,轮胎在黄沙中发出痛苦的尖啸。伴随着一次堪称“暴力”的甩尾漂移,他调转车头,引擎发出愤怒的咆哮,以前所未有的速度重新冲回了那条他阔别已久的AI主赛道。他知道,现在不是懊悔的时候,是复仇的时刻。
Meta车队尘封的车库大门轰然开启,灯光亮起。他的王牌技师,被誉为“教授”的图灵奖得主杨立昆(Yann LeCun),早已在工作台前等候多时。他没有一句责备,只是冷静地展开一张全新的引擎设计图,上面潦草地写着一个代号:“Llama”。这,就是他们反击的唯一希望。
![]()
复仇计划开始了。扎克伯格直接砸开了自己的金库,用麻袋装着现金,把市场上所有能买到的顶级Nvidia氮气加速系统(GPU)全部扫空,堆满了整个仓库。他要让他的新赛车,拥有无限的加速能力。这,是一场无论虚实,不计存亡的豪赌。
接着,他派出了最精锐的团队,在深夜突袭了OpenAI车队的维修站。他们不偷零件,只“请”人。挥舞着令人无法拒绝的上亿支票和顶级车手待遇,硬生生地把对手几位最核心的引擎调校工程师,“请”进了Meta的车库。扎克伯格明白,要造出最快的车,就必须拥有最懂速度的人。
2
AI狂飙(下):引擎的革命与新赛道
第三幕:革命
当Meta车队的车库大门再次升起,所有人都以为会看到一辆复仇的超级跑车。但他们错了。扎克伯格开出来的,是一辆巨大的运输卡车。在所有人惊愕的目光中,他停在赛道中央,打开了卡车的后柜。里面没有赛车,只有成千上万颗崭新、强大、闪闪发光的“Llama”引擎。
![]()
接着,他做出了让所有精英车队都无法理解的举动:他将这些高性能引擎的设计图纸像传单一样撒向天空,并宣布,引擎本身,免费送给现场所有的街头车手和小型改装厂!赛场瞬间被点燃,陷入了一片疯狂。这不是比赛,这是一场革命。
OpenAI和谷歌的F1车手们傻眼了。他们昂贵的、受邀才能观看的精英对决,瞬间变成了一场全民狂欢的街头暴走。赛道上挤满了各式各样、搭载着Llama引擎的“平民野兽”,它们从四面八方涌来,不遵从任何规则。扎克伯格的目的昭然若揭:他要的不是赢得这场比赛,而是要掌控整个赛车生态。
![]()
他用免费的“Llama引擎”,让顶级动力不再是少数人的特权,从而釜底抽薪,瓦解了对手靠出售“F1入场券”来盈利的模式。他的车队或许没有赢得单站冠军,但他却成了所有车手的“军火商”和“信仰图腾”,整个赛车世界的权力格局,被他彻底颠覆。
第四幕:新赛道
正当混乱达到顶峰,赛道前方突然展开了一片全新的、闻所未闻的区域——“世界模型”死亡赛道。这里的道路不再固定,而是像流沙一样变幻莫测。这比的不再是速度,而是对未知世界的理解和适应能力。
谷歌车队率先发力,他们的“Genie 3”号赛车展示了魔术般的能力:它能凭空在前方生成一段可供行驶的虚拟道路,仿佛一位能创造世界的“路神”。这一手让所有人都叹为观止,似乎冠军已是谷歌的囊中之物。
![]()
就在此时,Meta的王牌技师杨立昆教授却平静地笑了。他解释道:“当你们都在研究如何创造道路时,我们一直在研究道路本身存在的‘物理规则’。”他揭开了Meta的终极武器——V-JEPA系统。它不创造任何东西,但它能通过观察,瞬间理解并预测世间万物的运作规律。
![]()
终局时刻来临。扎克伯格没有坐进驾驶舱,而是缓缓戴上了一副看似普通的墨镜——Meta的下一代AR眼镜。镜片亮起的一瞬间,整个变幻莫测的世界在他眼中被完全解析:最优的行驶路线、潜在的崩塌点、对手的动态预测……所有的一切都化作了清晰的数据流。
![]()
他不再是一个赛车手,他与赛道融为了一体。对手还在寻找道路,而他,已经看到了未来本身。比赛的终点已经不再重要,因为对扎克伯格而言,一个新的纪元,才刚刚开始。
3
后记
在AI大模型发展的早期阶段,Llama的横空出世,尤其是其彻底的开源(包括模型权重),扮演了“破壁人”和“启蒙者”的角色。
阿里巴巴的Qwen系列在早期版本中,其模型架构明确基于Meta的Llama架构。这在当时是一个非常明智和高效的选择,因为Llama的架构经过了验证,性能强大且稳定。
站在Llama这个巨人的肩膀上,可以让团队省去大量在基础架构上摸索的时间,将精力更集中于数据、训练和优化等环节。虽然最新的Qwen3已经发展出许多自己的特色(如混合专家MoE架构、思考模式等),但其最初的成功离不开Llama打下的坚实基础。
虽然DeepSeek和智谱AI的GLM系列很早就开始自研架构,但Llama的开源依然起到了巨大的“参照系”和“催化剂”作用。
![]()
Llama的论文和代码,将原本像“黑箱”一样的大模型内部结构和关键技术细节(如RMSNorm预归一化、SwiGLU激活函数、旋转位置编码RoPE等)公之于众。
这为所有研究者提供了一个顶级的、可复现的基线(Baseline)。即使是自研架构,也可以通过与Llama的对比,快速验证自己想法的优劣,从而大大加速了研发进程。
在Hugging Face、Reddit (r/LocalLLaMA)等社区,全球开发者围绕Llama生态分享了海量的量化、微调、部署经验和技巧。这些知识是共通的,国产模型厂商和用户都能从中汲取养分,避免重复“造轮子”,站在一个更高的起点上进行创新。
Llama的开源战略,在全球范围内掀起了一场对抗闭源模型(如GPT系列)的“技术平权”运动。这对国产大模型的发展起到了至关重要的推动作用。
Llama证明了,最顶级的大模型技术可以不被少数几家巨头垄断。这给了国内所有AI公司巨大的信心和一条清晰的追赶路径。通过学习和借鉴Llama,国内厂商可以快速拉近与世界顶尖水平的距离。
![]()
Meta的“带头大哥”行为,事实上引领了一场全球范围内的开源军备竞赛。为了在竞争中脱颖而出,Qwen、DeepSeek、GLM等也纷纷选择将自己的强大模型开源,形成了你追我赶、互相促进的良性循环。这种开放的态势,极大地繁荣了整个AI生态,最终让所有人都受益。
总结来说,Llama的开源就像一场甘霖,不仅直接滋养了像Qwen这样的早期模型,更是通过其强大的“生态外溢”效应和“战略引领”作用,间接地为所有国产大模型(包括DeepSeek和GLM)的崛起提供了肥沃的土壤、成熟的工具和宝贵的参照。可以说,没有Llama的开源,国产大模型的发展速度和所能达到的高度,都将大打折扣。没有LLama的开始,OpenAI就不可能被逼到开源。
![]()
当人们还在嘲笑他在大模型竞赛的迷失时,扎克伯格已经完成了他最重要的一次“漂移”。他不是手持火炬、普度众生的神明,更像是一位为了赢得战争,不惜将“核武器”的设计图散布到全世界的枭雄。
他无意成为任何人的“恩人”,他只是在用一种最彻底、最冒险的方式,去摧毁对手的护城河。然而,在这场由他掀起的全球AI技术大平权中,旧的王权正在崩塌,新的秩序尚未建立。废墟之上,每一位挑战者都获得了属于自己的火种。
我们无需感谢他的“善良”,但必须正视他的“阳谋”。因为在这场史无前例的AI狂飙中,他一手制造了混乱,也一手制造了机遇。对于赛道上的每一位玩家而言,真正的考验不是向谁致敬,而是在这场伟大的技术洪流中,找到自己的赛道,然后
——加速!
![]()
回复【META】,一起评测研究Meta的大模型和技术。下一篇我讲一讲Google最耀眼的双子星之一,定海神针Jeff Dean。
创作不易,如果觉得有用有收获,在看 + 收藏 + 转发给跟你趣味相投,关心AI的朋友。
我是刀哥,大厂架构师,出海创业者,深入研究AI工具和AI编程。关注我,了解更多AI知识!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.