网易首页 > 网易号 > 正文 申请入驻

备受Meta折磨,LeCun依旧猛发论文!新作:JEPAs能感知数据密度

0
分享至

闻乐 发自 凹非寺
量子位 | 公众号 QbitAI

备受Meta审核规定“折磨”,依旧猛发论文!

表示可能要辞职的LeCun带着最新研究来了,仍然和三位FAIR同事合作。

Yann LeCun团队新论文发现了自监督模型JEPAs(联合嵌入预测架构)的隐藏技能——

学会了数据的“密度”

这里的“数据密度”可以理解成数据的常见程度:密度高的样本是更典型、更常见的数据,密度低的是少见的、甚至异常的数据。



JEPAs原本被视为仅擅长特征提取的模型,这次LeCun团队发现该模型在训练过程中悄悄掌握了感知数据常见程度的能力。

这就意味着,只要JEPAs训练成功了,不用额外做什么,就能用它来判断一个样本的常见程度

打破了学界长期以来“JEPAs仅学特征、与数据密度无关”的认知。

核心发现:反坍缩能精准学习数据密度

要理解这一新发现的突破,首先来说一下JEPAs。


△源自《A Path Towards Autonomous Machine Intelligence》图12

JEPAs作为LeCun团队近年重点推进的自监督学习框架,核心优势在于无需人工标注,模型就能自主从海量数据中学习特征规律,学完后就可以直接适配图像识别、跨模态匹配等下游任务,是AI领域高效学习的代表性模型。



此前学界普遍认为,JEPAs的训练只有两个核心目标:

  • 一是latent空间预测。即给原始数据(如图像)做轻微扰动(裁剪、调色)后,扰动数据的特征表示(模型内部理解的数据形态)能从原始数据特征中精准预测;
  • 二是反坍缩。防止所有样本的特征趋同一致。

而论文的新发现就是从反坍缩中得来。

如果所有数据的特征都一样,模型相当于白学,所以过去大家都将反坍缩单纯视为避免特征失效的保障手段,没有意识到它还有更深层的作用。

LeCun团队就聚焦于反坍缩的的隐藏价值,研究通过变量替换公式高维统计特性推导证明,反坍缩不仅能防止特征坍缩,更能让JEPAs精准学习数据密度

从理论层面看,当JEPAs输出高斯嵌入(高维空间中近似均匀分布于超球面的特征)时,模型必须通过雅可比矩阵(反映模型对样本微小变化的响应程度)感知数据密度,才能满足训练时的约束条件,这意味着学习数据密度并不是偶然,而是JEPAs训练过程中的必然结果



为了让这种隐藏的密度感知能力落地实用,团队还提出了关键工具JEPA-SCORE

这是从JEPAs 中提取数据密度的量化指标,核心作用就是给样本的常见度打分



根据公式来看计算逻辑简洁高效,只需要获取JEPAs处理目标样本时的雅可比矩阵,计算矩阵的特征值后取对数求和,得到的结果就是JEPA-SCORE,分数越高说明样本越典型(数据密度高),分数越低则样本越罕见或异常(数据密度低)。

更重要的是,JEPA-SCORE还具备极强的通用性,无限制适配,既不挑数据集,也不挑JEPAs架构

无论是ImageNet、手写数字MNIST,还是未参与预训练的陌生数据(星云图集),都能精准计算;

不管是I-JEPA、DINOv2(单模态视觉模型),还是MetaCLIP(多模态模型),只要是成功训练的JEPAs家族模型,都能直接使用,且无需额外训练模型。

为了验证这一发现的可靠性,团队还开展了多组实验。

在ImageNet数据集中,不同JEPAs模型对典型样本(如飞行姿态的鸟类)和罕见样本(如栖息姿态的鸟类)的JEPA-SCORE判定高度重合,证明这是JEPAs的共性能力,并不是某个模型的偶然;

面对未参与预训练的星系图像数据集,其JEPA-SCORE显著低于ImageNet数据,说明模型能精准识别陌生数据;



而在数据筛选和异常检测的实用测试中,JEPA-SCORE的效果也优于传统方法。


△异常检测场景

研究团队

此次研究并非LeCun一人之功。

另外三位核心研究者也都是Meta FAIR的研究员。

Randall Balestriero是布朗大学计算机科学助理教授,长期深耕人工智能与深度学习领域。



2013年起研究可学习信号处理,他参与的技术曾用于NASA火星车火星地震探测。

2021年获莱斯大学博士学位,后进入Meta AI做博士后,师从Yann LeCun。

Nicolas Ballas拥有法国格勒诺布尔大学博士学位。

2010年4月至9月,他担任了LTU Technologies的研发实习生,从事应用于图像检索的大规模聚类相关工作。

自2017年起,他在FAIR担任研究科学家,已任职超过8年。

Michael Rabbat是FAIR的创始成员,拥有伊利诺伊大学厄巴纳-香槟分校的工程学士学位、莱斯大学的工程硕士学位,以及威斯康星大学麦迪逊分校的电气工程博士学位。



他的研究方向聚焦于优化算法、分布式算法及信号处理三大领域。

加入Meta之前,Mike曾担任麦吉尔大学电气与计算机工程系教授。

论文地址:https://arxiv.org/abs/2510.05949

— 完 —

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
男子27年前倒卖1.2万克黄金被警方查获 个人买卖黄金不再构罪后,如今能追回吗?

男子27年前倒卖1.2万克黄金被警方查获 个人买卖黄金不再构罪后,如今能追回吗?

红星新闻
2025-11-04 09:56:18
重磅突破!中方高管回归安世 10天内资产解冻 中荷纷争按下暂停键

重磅突破!中方高管回归安世 10天内资产解冻 中荷纷争按下暂停键

芯事情报局
2025-11-04 07:10:03
特朗普:大型台企将生产线向美国转移

特朗普:大型台企将生产线向美国转移

参考消息
2025-11-03 17:36:11
学校食堂卖帝王蟹引发关注 南京大学:已对现有菜式进行调整

学校食堂卖帝王蟹引发关注 南京大学:已对现有菜式进行调整

极目新闻
2025-11-04 12:12:13
日本26年恐怖悬案告破!妻子在家被残忍杀害,丈夫砸千万租凶宅保护现场终于捉到凶手!

日本26年恐怖悬案告破!妻子在家被残忍杀害,丈夫砸千万租凶宅保护现场终于捉到凶手!

英国报姐
2025-11-03 21:37:38
易中天:绝不原谅中国教育,它最不拿人当人!

易中天:绝不原谅中国教育,它最不拿人当人!

新浪财经
2025-11-03 16:51:38
银行暂停实物黄金提取!黄金市场变天了!

银行暂停实物黄金提取!黄金市场变天了!

贩财局
2025-11-03 20:53:39
太吓人了!房贷断供率这么高,部分三四线城市断供率甚至超过了5%

太吓人了!房贷断供率这么高,部分三四线城市断供率甚至超过了5%

星河也灿烂
2025-11-04 09:56:50
勒沃库森CEO爆猛料:维尔茨本想加盟皇马,因阿隆索才转投利物浦

勒沃库森CEO爆猛料:维尔茨本想加盟皇马,因阿隆索才转投利物浦

夜白侃球
2025-11-04 10:34:39
日本人全球最长寿,这5种食物,他们顿顿都要吃,你吃过几种

日本人全球最长寿,这5种食物,他们顿顿都要吃,你吃过几种

削桐作琴
2025-11-03 19:29:12
从确诊到去世仅15天,“央视最帅主持人”的遭遇为人们敲响警钟

从确诊到去世仅15天,“央视最帅主持人”的遭遇为人们敲响警钟

银河史记
2025-11-03 19:31:33
为什么“苏超”的作业不好抄?

为什么“苏超”的作业不好抄?

钛媒体APP
2025-11-04 09:23:10
小球员比赛时推搡,引发众家长冲进场内发生冲突,辽宁盘锦回应:警方已处理

小球员比赛时推搡,引发众家长冲进场内发生冲突,辽宁盘锦回应:警方已处理

潇湘晨报
2025-11-04 11:23:30
突传噩耗!王国斌离世,公司官网已变黑白

突传噩耗!王国斌离世,公司官网已变黑白

中国基金报
2025-11-03 15:30:07
全红婵正式复出,击败陈芋汐,夺得本届全运会首金,或重返国家队

全红婵正式复出,击败陈芋汐,夺得本届全运会首金,或重返国家队

懂球社
2025-11-03 10:56:03
全红婵夺金,新搭档身份不简单,赛后发文信息量大,郭晶晶没说错

全红婵夺金,新搭档身份不简单,赛后发文信息量大,郭晶晶没说错

白面书誏
2025-11-03 16:36:30
杨毅:杨瀚森在美国突然有钱有大量时间,没有出去胡闹已经很不错

杨毅:杨瀚森在美国突然有钱有大量时间,没有出去胡闹已经很不错

狼叔评论
2025-11-04 10:06:04
陈志根本不是重点,别再盯着他的下落了

陈志根本不是重点,别再盯着他的下落了

麦大人
2025-11-03 15:37:57
胡锡进:美国4200万人失去食物援助!网友冷笑,先关心下同胞吧!

胡锡进:美国4200万人失去食物援助!网友冷笑,先关心下同胞吧!

你食不食油饼
2025-11-04 05:05:12
赖清德对大陆摊牌,和平统一绝无可能,解放军开始为收台做准备了

赖清德对大陆摊牌,和平统一绝无可能,解放军开始为收台做准备了

成视Talk
2025-11-04 10:33:55
2025-11-04 13:23:00
量子位 incentive-icons
量子位
追踪人工智能动态
11623文章数 176324关注度
往期回顾 全部

科技要闻

硅谷甄嬛传:奥特曼优雅挑衅马斯克狠狠回击

头条要闻

白所成等5人被判死刑:赌诈资金290亿 致6名中国人死亡

头条要闻

白所成等5人被判死刑:赌诈资金290亿 致6名中国人死亡

体育要闻

27岁热刺门将,夺冠后退役当导演

娱乐要闻

《繁花》录音事件完整版长达43分钟

财经要闻

作价40亿美元!星巴克中国易主

汽车要闻

上汽旗舰智己LS9首发评测 可能是最好开的9系SUV

态度原创

艺术
教育
旅游
数码
亲子

艺术要闻

翁帆受聘,任清华大学建筑学院讲师

教育要闻

在南京,上四星级高中有多难?考多少分才能上四星高中?

旅游要闻

美旅游协会警告:若“停摆”至感恩节假期旅行季,将对全美各州社区造成灾难性经济后果

数码要闻

曾被嫌弃「非刚需」的洗碗机,成了小米家电的又一拳头品类?

亲子要闻

亿缕阳光|少年身披光芒

无障碍浏览 进入关怀版