![]()
外界关于Meta的很多“八卦”都被一个重要人物实锤了。
《金融时报》的最新专访中,杨立昆不仅亲口承认了Llama 4的“造假”,还回应了外界关于他与Meta新晋AI一把手Alexandr Wang之间不和的传闻。
他称Wang太年轻没有经验,也并不知道研究员想要什么。
至于他自己,并没有如外界所想象的那样因为要给Wang汇报工作而苦恼,因为Wang“不能告诉像我这样的研究人员该怎么做”。
离开Meta,在杨立昆口中更偏向于路线分歧——大部分Meta的人被大语言模型“洗脑”,而杨立昆的心则早就飞向他认为更有前景的“世界模型”。
01
Facebook往事
杨立昆出生于巴黎,他从很早的时候就认为,人类什么都是后天习得的,智能的本质就是学习。
20世纪80年代博士毕业后,杨立昆奔赴加拿大,在多伦多大学跟随“AI教父”杰弗里·辛顿进行博士后研究,后加入著名的贝尔实验室。引入卷积神经网络是他最突出的贡献之一,为此他被称为“卷积神经网络之父”。
![]()
杨立昆回忆,在贝尔实验室似乎有无穷的资金,这也帮助他将构想变为现实。他刚入职贝尔的时候,老板曾告诉他:“你知道吗,在贝尔实验室,省钱是出不了名的。”
到2013年,深度学习的成功已成定局,图像识别应用取得了令人瞩目的成果。谷歌刚刚启动了谷歌大脑项目,一年后便收购了英国人工智能实验室DeepMind。
也是在那时,马克·扎克伯格打来了电话。他想在Facebook组建一个人工智能部门。
为了争取杨立昆的加入,扎克伯格邀请他到自己在加州的家中共进晚餐。
杨立昆回忆说,一位私人厨师准备了“鸡肉,配上了一些很不错的白葡萄酒”。
杨立昆最终同意加入,但有三个条件:他不必辞去在纽约大学的工作;他不必搬到加州;新实验室的研究成果必须公开。
扎克伯格同意了,交易达成。杨立昆加入全球最大的科技公司之一Facebook,组建一个新的人工智能研究实验室,专注于基础研究,名为Facebook人工智能研究院(FAIR)。
杨立昆说,对当时的他来说,Facebook就像一张白纸,可以让他拥有完全的研究自由。“资金显然不会成为问题。”
2018年,杨立昆作为“深度学习三剑客”之一,和辛顿等人一起获得了图灵奖,这是计算机领域的最高荣誉。
也是在那一年,杨立昆在Facebook的头衔发生了变化,从领导FAIR的AI总监,变为了整个公司的“首席AI科学家”。
三年后,扎克伯格醉心元宇宙,不惜将公司改名为Meta。但元宇宙回报给扎克伯格的只有尴尬,但好在,AI的浪潮接踵而至,给了扎克伯格新的“救赎”。
而杨立昆和Meta的故事,却向着终点走去了。
02
心急的扎克伯格
与Llama“造假”丑闻
OpenAI的ChatGPT诞生后,Meta内部一片混乱,公司领导层决定全力投入大型语言模型Llama的开发。
Llama,正生发于杨立昆领导的FAIR部门。
扎克伯格成立了一个生成式人工智能(GenAI)部门,负责加速产品研发。
杨立昆坚持要求公开发布该模型。Llama 2发布时向所有用户开放了权重,这意味着人们可以免费下载和调整模型,这是一个“分水岭”时刻,它“改变了整个行业”。该模型成为开源LLM的黄金标准,展示了一种与谷歌和OpenAI完全不同的风貌,后者封闭且权力集中。
如此这般,Meta一度视为人工智能研究领域的“好人”。
然而,杨立昆透露,扎克伯格对GenAI部门施加了更大压力,要求其加快人工智能的研发和部署,这导致了沟通不畅。
“我们有很多新想法和非常棒的东西,他们应该付诸实施。但他们却只选择那些基本上安全可靠、已被证明行之有效的东西。这样做,你就落后了。”
后续的Llama系列产品都表现不佳。
2025年4月发布的Llama 4更是惨遭滑铁卢,Meta还被指控操纵基准测试结果以使其看起来更出色。
这次的采访中,杨立昆承认“结果确实有些造假”,团队为了获得更好的测试结果,在不同的基准测试中使用了不同的模型。
“马克(扎克伯格)非常生气,基本上对所有参与此事的人都失去了信心。所以他基本上把整个GenAI组织边缘化了。很多人已经离开了,还有很多人还没离开,他们也会离开。”
在这之后,Meta快速进入“后Llama”时代。
![]()
去年六月,Meta 向数据标注初创公司Scale AI 投资超过140亿美元,并聘请了其28岁的联合创始人兼CEO Alexandr Wang。
Wang成为了首席AI官,领导新成立的“超级智能实验室”,这个新部门吞并了Meta过去已有的AI部门。此外,Wang还直接负责监督开发前沿人工智能模型的工作,Llama乃至整个开源路线都眼瞅着被扎克伯格抛弃了。
在这个过程中,Meta还曾因试图以1亿美元的签约奖金从竞争对手那里挖走顶尖研究人员而登上新闻头条。
“未来会证明这究竟是好主意还是坏主意。”
杨立昆称Wang“年轻”且“缺乏经验”。
“他学得很快,也知道自己不懂什么……但他没有科研经验,不知道如何开展科研,也不知道科研人员会喜欢什么,不喜欢什么。”
但他否认被Wang指挥做事。
首先,他强调自己并不怕与年轻人共事:“当时(我加入这家公司的时候)Facebook工程师的平均年龄是27岁。我的年龄是工程师平均年龄的两倍。”
其次,Wang对他的影响力有限:“Alex(Wang)也没有告诉我该怎么做。你不能告诉研究人员该怎么做。你更不能告诉像我这样的研究人员该怎么做。”
03
离开Meta,创办新公司
否认了Wang对自己的影响力,杨立昆解释自己为何离职的时候更多强调路线的不同。
他说,继续留在Meta在政治上变得困难重重。虽然扎克伯格欣赏杨立昆的世界模型研究,但公司新一轮超级智能项目招聘的那批人却“完全被大语言模型(LLM)洗脑了”。
杨立昆被疏远了。
“我确信Meta公司里很多人,或许包括Alex(Wang)在内,都不希望我告诉世人——LLM在超级智能领域基本上是一条死路。但我不会因为某些人认为我错了就改变我的想法。我没错。作为一名科学家,我的职业操守不允许我这样做。”
他认为,大型语言模型虽然有用,但本质上受到语言的限制。要达到人类水平的智能,就必须理解我们所处的物理世界是如何运作的。
为达到这个目的,他寄希望于V-JEPA的架构,即所谓的“世界模型”。世界模型旨在通过学习视频和空间数据(而不仅仅是语言)来理解物理世界。这种模型还能够进行规划、推理并拥有持久记忆。
他将这种智能称为“先进机器智能”(Advanced Machine Intelligence,简称AMI)。
促使他离开的另一个原因是,他利用世界模型和AMI 所做的工作也展现出Meta不感兴趣的潜在用途,例如喷气式发动机和重工业。
当然,Meta不赏光,杨立昆也毫不费力地找到了愿意投资“下一代人工智能技术”的投资者。
04
未来属于“世界模型”?
杨立昆离开Meta后,将创立自己的公司,名叫“先进机器智能实验室(Advanced Machine Intelligence Labs )”。
新公司的CEO将由法国医疗保健人工智能初创公司Nabla的联合创始人兼首席执行官亚历克斯·勒布伦领导。杨立昆自己担任执行董事长。
“我是一名科学家,一个有远见的人。我能激励人们去做有趣的事情。我很擅长预测哪种技术会成功,哪种会失败。但我当不了CEO,我既太缺乏条理,也太老了!”
![]()
杨立昆认为自己进入了新的、最具发展潜力的领域。
对于OpenAI前首席技术官的新公司“思考机器实验室(Thinking Machines Lab)”,杨立昆说:“希望投资者知道自己在做什么。”
对于OpenAI联合创始人兼前首席科学家伊利亚·苏茨克维的新公司“安全超级智能(Safe Superintelligence)”,杨立昆评价:“我知道投资者根本不知道自己在做什么。”
相比之下,他的新架构充满希望——利用视频让人工智能模型理解我们世界的物理规律,从而使它们能够更好地预测接下来会发生什么。该模型还依赖于“情感”,即过去的经验和评估,来指导其预测。
“如果我掐你一下,你会感到疼痛。但你对我的心理认知会受到我掐你这件事的影响。下次我再靠近你的时候,你会本能地躲开。这就是你的预判,它(掐一下)引发的情绪是恐惧或对疼痛的逃避。”
杨立昆透露,这种技术的“雏形”会在12个月内问世,并在几年内有更大规模的版本。它还不是超级智能,但却是通往超级智能的一条道路。
“也许有某些尚未被发现的障碍,但(这条路)至少还有希望。”
当被问到希望给这个世界留下什么,杨立昆毫不犹豫地表示,提高智能水平才是关键。
“我们真正应该拥有的就是更多的智能。”有了更多的智能,人类的苦难就会减少,决策会更加理性,对世界和宇宙的理解也会更加深刻。
“我们饱受愚蠢之苦。”
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.