网易首页 > 网易号 > 正文 申请入驻

图灵奖得主LeCun 推崇的 JEPA 是什么?

0
分享至

来源: 图灵人工智能

LeCun 发推再推 JEPA:

JEPA(Joint Embedding Predictive Architecture,联合嵌入预测架构)是我最喜欢的自监督学习元架构,适用于处理连续数据,如图像、视频和音频。

此外LeCun 称需要澄清的是,JEPA不是Transformer的替代品。事实上,许多JEPA系统都使用了Transformer模块。JEPA是自回归生成架构(如大语言模型,无论是否使用Transformer)的替代方案。

如在V-JEPA中,网络不是自回归的。它使用了两个Transformer架构,一个用于两个编码器,另一个用于预测器。

下面,我们就来介绍下什么是 JEPA

在本文中,我们将讨论:

世界模型

LeCun愿景的基础部分是“世界模型”概念,即内部表示世界如何运作。他认为,给模型提供世界的上下文可以改善其结果。

“人类、动物和智能系统使用世界模型的想法可以追溯到心理学以及工程领域如控制和机器人学的几十年前。”

自监督学习

LeCun提出了一种模块化、可配置的架构,用于自主智能,强调开发自监督学习方法,使AI无需大量标注数据就能学习这些世界模型。

下面是自主智能系统架构的详细组件视图:

联合嵌入预测架构 (JEPA) 如何工作?

JEPA 是开发能像人类一样理解和互动的AI的核心元素。它包含了上述关键元素,使系统能够处理不确定性并忽略无关细节,同时保持预测所需的关键信息。

它基于以下元素:

有趣的是,多个JEPA可以组合成多步/循环JEPA,或堆叠成层次化JEPA,以在多个抽象层次和时间尺度上进行预测。

JEPA 可以用来做什么?

根据JEPA架构,Meta AI研究人员与Yann LeCun共同发布了几个专门的模型。它们是什么?

图像联合嵌入预测架构 (I-JEPA) – 图像的JEPA

I-JEPA 于2023年6月提出,是基于JEPA的第一个模型。

I-JEPA是一个非生成性的自监督学习框架,设计用于处理图像。它通过屏蔽图像的一部分并尝试预测这些屏蔽部分来工作:

MC-JEPA (运动-内容联合嵌入预测架构) – 多任务JEPA

MC-JEPA 是另一个JEPA变体,设计用于同时解释视频数据:动态元素(运动)和静态细节(内容),使用共享编码器。它于2023年7月提出。

MC-JEPA 是一个更全面、更强大的视觉表示模型,可用于现实世界中的计算机视觉应用,如自动驾驶、视频监控和活动识别。

视频联合嵌入预测架构 (V-JEPA) – 视频的JEPA

V-JEPA 旨在增强AI对视频内容的理解,这在I-JEPA发布后被标记为一个重要的未来方向。

V-JEPA由两个主要组件组成:

  • 编码器:将输入视频帧转换为高维空间,其中相似特征更靠近。编码器捕捉视频中的重要视觉线索。

  • 预测器:利用编码特征的一个部分来预测另一部分的特征。这种预测基于学习视频中的时间和空间变换,有助于理解运动和随时间的变化。

V-JEPA的设计使其能够以类似于人类学习的方式从视频中学习——观察和预测视觉世界,而不需要显式标注。模型从无监督视频数据到各种视觉任务的泛化能力,使其成为推进机器理解和互动动态视觉环境的强大工具。

JEPA的广泛应用

2024年3月发表的最新论文“学习和利用视觉表示学习中的世界模型[6]”引入了图像世界模型 (IWM) 的概念,并探讨了如何将JEPA架构推广到更广泛的扰动(如颜色抖动、模糊)中,而不仅仅是屏蔽。

Image 8

研究探讨了两种类型的世界模型:

  • 不变模型:识别和保持不同场景中的稳定、不变特征

  • 等变模型:适应输入数据的变化,保持发生的关系和变换

研究发现,通过利用这些世界模型,机器可以更准确地预测和调整视觉变化。这导致了更具弹性和适应性的系统开发。该方法挑战了传统的AI方法,提供了一种在不需要直接监督的情况下提高机器学习模型有效性的新途径。

附加资源原始模型

1.JEPA首次提议:Yann LeCun关于让AI系统像人类和动物一样学习和推理的愿景[7]

2.I-JEPA: 从图像中进行自监督学习的联合嵌入预测架构[8]

3.MC-JEPA: 用于自监督学习运动和内容特征的联合嵌入预测架构[9]

4.V-JEPA: 迈向高级机器智能的下一步[10]

5.推广JEPA: 视觉表示学习中的学习和利用世界模型[11]

Yann LeCun的演讲

  • 慕尼黑演讲(2023年9月29日)[12]

  • 哈佛演讲(2024年3月28日)[13]

受JEPA启发的模型

我们还为你整理了一份基于JEPA架构的相关模型清单。它们根据应用领域进行分组:

音频和语音应用

  1. A-JEPA[14]:专注于音频数据,使用掩模建模原则以提高音频和语音分类任务中的上下文语义理解。

  2. 探索用于通用音频表示学习的联合嵌入预测架构中的设计选择[15]:分析自监督音频表示学习中的掩模策略和样本时长。

视觉和空间数据应用
  1. S-JEA[16]:通过堆叠联合嵌入架构中的层次语义表示,增强视觉表示学习。

  2. DMT-JEPA[17]:聚焦于局部语义理解的图像建模,适用于分类、目标检测和分割。

  3. JEP-KD[18]:将视觉语音识别模型与音频特征对齐,提高视觉语音识别的性能。

  4. Point-JEPA[19]:应用于点云数据,增强空间数据集的效率和表示学习。

  5. Signal-JEPA[20]:专注于EEG信号处理,提高跨数据集的迁移和分类能力。

图表和动态数据应用
  1. Graph-JEPA[21]:第一个用于图表的联合嵌入架构,使用双曲坐标预测子图表示。

  2. ST-JEMA[22]:增强从fMRI数据中学习动态功能连接,专注于高层次语义表示。

时间序列和遥感应用
  1. LaT-PFN[23]:结合时间序列预测和联合嵌入架构,利用相关系列进行稳健的上下文学习。

  2. 时间序列JEPA[24]:通过传感器数据中的时空相关性优化有限容量网络的远程控制。

  3. 预测梯度更优[25]:利用自监督学习进行SAR自动目标识别,利用梯度特征进行自动目标识别。

评估和方法学研究
  1. LiDAR: 在联合嵌入自监督学习架构中的线性探测性能[26]:引入一种评价联合嵌入自监督学习架构中表示的方法,专注于线性探测性能。

合作能力: https://www.pnas.org/doi/abs/10.1073/pnas.1101765108?utm_source=www.turingpost.com&utm_medium=referral&utm_campaign=topic-4-what-is-jepa

演讲1: https://x.com/TheTuringPost/status/1781835268196307296?utm_source=www.turingpost.com&utm_medium=referral&utm_campaign=topic-4-what-is-jepa

演讲2: https://x.com/TheTuringPost/status/1709190072715886892?utm_source=www.turingpost.com&utm_medium=referral&utm_campaign=topic-4-what-is-jepa

看不见的猩猩研究: https://journals.sagepub.com/doi/10.1068/p281059?utm_source=www.turingpost.com&utm_medium=referral&utm_campaign=topic-4-what-is-jepa

[5]

无意识盲视: http://www.scholarpedia.org/article/Inattentional_blindness?utm_source=www.turingpost.com&utm_medium=referral&utm_campaign=topic-4-what-is-jepa

[6]

学习和利用视觉表示学习中的世界模型: https://arxiv.org/abs/2403.00504?utm_source=www.turingpost.com&utm_medium=referral&utm_campaign=topic-4-what-is-jepa

[7]

JEPA首次提议:Yann LeCun关于让AI系统像人类和动物一样学习和推理的愿景: https://ai.meta.com/blog/yann-lecun-advances-in-ai-research/?utm_source=www.turingpost.com&utm_medium=referral&utm_campaign=topic-4-what-is-jepa

[8]

I-JEPA: 从图像中进行自监督学习的联合嵌入预测架构: https://arxiv.org/abs/2301.08243?utm_source=www.turingpost.com&utm_medium=referral&utm_campaign=topic-4-what-is-jepa

[9]

MC-JEPA: 用于自监督学习运动和内容特征的联合嵌入预测架构: https://arxiv.org/abs/2307.12698?utm_source=www.turingpost.com&utm_medium=referral&utm_campaign=topic-4-what-is-jepa

[10]

V-JEPA: 迈向高级机器智能的下一步: https://ai.meta.com/blog/v-jepa-yann-lecun-ai-model-video-joint-embedding-predictive-architecture/?utm_source=www.turingpost.com&utm_medium=referral&utm_campaign=topic-4-what-is-jepa

[11]

推广JEPA: 视觉表示学习中的学习和利用世界模型: https://arxiv.org/abs/2403.00504?utm_source=www.turingpost.com&utm_medium=referral&utm_campaign=topic-4-what-is-jepa

[12]

慕尼黑演讲(2023年9月29日): https://x.com/TheTuringPost/status/1709190072715886892?utm_source=www.turingpost.com&utm_medium=referral&utm_campaign=topic-4-what-is-jepa

[13]

哈佛演讲(2024年3月28日): https://x.com/TheTuringPost/status/1781835268196307296?utm_source=www.turingpost.com&utm_medium=referral&utm_campaign=topic-4-what-is-jepa

[14]

A-JEPA: https://arxiv.org/abs/2311.15830v3?utm_source=www.turingpost.com&utm_medium=referral&utm_campaign=topic-4-what-is-jepa

[15]

探索用于通用音频表示学习的联合嵌入预测架构中的设计选择: https://arxiv.org/abs/2405.08679?utm_source=www.turingpost.com&utm_medium=referral&utm_campaign=topic-4-what-is-jepa

[16]

S-JEA: https://arxiv.org/abs/2305.11701?utm_source=www.turingpost.com&utm_medium=referral&utm_campaign=topic-4-what-is-jepa

[17]

DMT-JEPA: https://arxiv.org/abs/2405.17995?utm_source=www.turingpost.com&utm_medium=referral&utm_campaign=topic-4-what-is-jepa

JEP-KD: https://arxiv.org/abs/2403.18843?utm_source=www.turingpost.com&utm_medium=referral&utm_campaign=topic-4-what-is-jepa

Point-JEPA: https://arxiv.org/abs/2404.16432?utm_source=www.turingpost.com&utm_medium=referral&utm_campaign=topic-4-what-is-jepa

Signal-JEPA: https://arxiv.org/abs/2403.11772?utm_source=www.turingpost.com&utm_medium=referral&utm_campaign=topic-4-what-is-jepa

[21]

Graph-JEPA: https://arxiv.org/abs/2309.16014?utm_source=www.turingpost.com&utm_medium=referral&utm_campaign=topic-4-what-is-jepa

[22]

ST-JEMA: https://arxiv.org/abs/2403.06432?utm_source=www.turingpost.com&utm_medium=referral&utm_campaign=topic-4-what-is-jepa

[23]

LaT-PFN: https://arxiv.org/abs/2405.10093?utm_source=www.turingpost.com&utm_medium=referral&utm_campaign=topic-4-what-is-jepa

[24]

时间序列JEPA: https://arxiv.org/abs/2406.04853?utm_source=www.turingpost.com&utm_medium=referral&utm_campaign=topic-4-what-is-jepa

[25]

预测梯度更优: https://arxiv.org/abs/2311.15153?utm_source=www.turingpost.com&utm_medium=referral&utm_campaign=topic-4-what-is-jepa

[26]

LiDAR: 在联合嵌入自监督学习架构中的线性探测性能: https://arxiv.org/abs/2312.04000?utm_source=www.turingpost.com&utm_medium=referral&utm_campaign=topic-4-what-is-jepa

阅读最新前沿科技研究报告,欢迎访问欧米伽研究所的“未来知识库”

未来知识库是“ 欧米伽 未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。


截止到10月25日 ”未来知识库”精选的100部前沿科技趋势报告

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
快讯!关于韩国瑜的消息!

快讯!关于韩国瑜的消息!

故事终将光明磊落
2026-06-29 10:49:26
韩国股市,直线拉升

韩国股市,直线拉升

第一财经资讯
2026-06-29 14:18:08
每体:皇马并未决定今夏要出售楚阿梅尼,但他很可能成为牺牲筹码

每体:皇马并未决定今夏要出售楚阿梅尼,但他很可能成为牺牲筹码

云隐南山
2026-06-29 14:43:03
电动车或将要被取代?多地开始大批投放!新型代步车已经正式登场

电动车或将要被取代?多地开始大批投放!新型代步车已经正式登场

阿纂看事
2026-06-26 16:26:55
不再嘴软!波兰外长当众宣判战局:俄军主动权彻底没了

不再嘴软!波兰外长当众宣判战局:俄军主动权彻底没了

老马拉车莫少装
2026-06-27 22:58:00
梅西再入选世界杯最佳阵容!他3场2个MVP、15射9正6进球!

梅西再入选世界杯最佳阵容!他3场2个MVP、15射9正6进球!

历史第一人梅西
2026-06-28 23:17:33
两名阿根廷网红持过期证件混入世界杯赛场,本想直播吸粉,被美国警方抓获,面临指控

两名阿根廷网红持过期证件混入世界杯赛场,本想直播吸粉,被美国警方抓获,面临指控

红星新闻
2026-06-29 14:20:42
输球又输人!世界杯恶意犯规毁天才!西班牙新星含泪控诉乌拉圭

输球又输人!世界杯恶意犯规毁天才!西班牙新星含泪控诉乌拉圭

澜归序
2026-06-29 08:49:09
为什么人类会想到要遮挡生殖器?

为什么人类会想到要遮挡生殖器?

宇宙时空
2026-05-29 17:30:16
中纪委再标红线!公职人员下班后的饭局,这5种情况将严肃处理!

中纪委再标红线!公职人员下班后的饭局,这5种情况将严肃处理!

细说职场
2026-06-27 14:11:59
中国避暑神器美的 PortaSplit 空调有什么特别?为何在欧洲卖爆?

中国避暑神器美的 PortaSplit 空调有什么特别?为何在欧洲卖爆?

贵重物品爱美食
2026-06-29 11:50:17
孟铎带娇妻度假,定居深圳,转型当老板,妻子1米83,儿女双全

孟铎带娇妻度假,定居深圳,转型当老板,妻子1米83,儿女双全

大西体育
2026-06-28 15:48:22
洪明甫宣布辞职,他带出了本世纪最差的两届韩国队

洪明甫宣布辞职,他带出了本世纪最差的两届韩国队

体坛周报
2026-06-29 01:25:10
周鸿祎套现离场,利润腰斩至8.8亿,留下5.8万投诉

周鸿祎套现离场,利润腰斩至8.8亿,留下5.8万投诉

嘴角上翘
2026-06-10 03:20:40
微胖的女孩,越看越好看,白白嫩嫩,珠圆玉润白到发光,一站封冠

微胖的女孩,越看越好看,白白嫩嫩,珠圆玉润白到发光,一站封冠

小椰的奶奶
2026-06-29 12:35:00
有性生活和没性生活,身体会出卖你!第三个区别,很多人没想到

有性生活和没性生活,身体会出卖你!第三个区别,很多人没想到

健康科普365
2026-05-30 16:30:29
新款 iPad mini,史诗级升级来了!

新款 iPad mini,史诗级升级来了!

花果科技
2026-06-28 21:02:05
确立“三个代表”重要思想为党的指导思想(伟大征程)

确立“三个代表”重要思想为党的指导思想(伟大征程)

金台资讯
2026-06-29 06:20:59
四渡赤水打的是国民党,电影《四渡》居然要和日本IP作战……

四渡赤水打的是国民党,电影《四渡》居然要和日本IP作战……

影视口碑榜
2026-06-29 13:38:35
很多人可能不知道:某种意义上来说,是比亚迪“救了国产新能源”

很多人可能不知道:某种意义上来说,是比亚迪“救了国产新能源”

周哥一影视
2026-06-29 13:44:19
2026-06-29 15:27:00
人工智能学家 incentive-icons
人工智能学家
人工智能领域权威媒体
4851文章数 37482关注度
往期回顾 全部

科技要闻

OpenAI推迟上市,那“Kimi们”呢?

头条要闻

于北辰"210%拦截率"成大陆学校考题 台网红笑称恭喜

头条要闻

于北辰"210%拦截率"成大陆学校考题 台网红笑称恭喜

体育要闻

两周飞5万公里!因凡蒂诺遭环保人士猛批

娱乐要闻

萧蔷宣布捐出参加“浪姐”所有收入

财经要闻

35岁职场人,又好找工作了?

汽车要闻

全新宝马iX3长轴版将于成都车展预售 四季度交付

态度原创

时尚
亲子
家居
本地
健康

夏天裤子别总穿紧身的,试试这几款阔腿裤,百搭舒适又显瘦

亲子要闻

4岁女儿让爸爸看她跳舞,爸爸看完后直说钱没白花,看看跳的咋样

家居要闻

绿意盎然 自然之境

本地新闻

贵州小城的新目标:举办“村超”世界杯!

“无糖汤圆”是否隐藏着健康陷阱?

无障碍浏览 进入关怀版