网易首页 > 网易号 > 正文 申请入驻

AI视觉系统全面升级!VC-1人工视觉皮层的最新突破

0
分享至

最近,Meta AI 公司宣布推出了人工智能技术的最新突破,旨在实现能够执行具有挑战性的感官运动技能的通用目的体现 AI 代理:人工视觉皮层(称为 VC-1)。这是首次支持多种感官运动技能、环境和体现形式的单一感知模型。它是第一款模拟人类视觉皮层的人工智能模型。VC-1 的出现对于人工智能发展极具意义,代表着人工智能向模拟人类智能又迈进了一大步。

为了训练 VC-1,Meta AI 构建了一个开创性的数据集 Ego4D。该数据集包含了 2100 小时的第一人称视角视频,记录了人类做饭、打扫、运动等日常活动。这些沉浸式的视觉数据使 VC-1 学会感知复杂环境,理解物体运动,判断人体姿态。

VC-1 的独特之处在于它模拟了人脑视觉皮层的结构和计算原理。人脑视觉皮层包含上百亿个神经元,负责处理和分析视觉输入。VC-1 参考视觉皮层的结构,使用数十亿个参数,可以对各种视觉环境做出灵活的感知和理解。

此外,VC-1 通过预训练超过 4000 小时的视频数据,获得了强大的视觉理解能力。不同于仅针对单一任务进行训练的模型,它作为一个统一的系统,支持多种视觉能力,包括物体识别、场景分割、姿态估计等。在 Meta AI 的测试中,VC-1 在这些任务上的表现达到或超过了专门训练的模型。

VC-1 的出现带来的影响深远。它不仅推进了对人类视觉系统的理解,也为研发更通用智能的人工智能系统提供了宝贵经验。VC-1 展示了通过模拟人脑结构实现通用智能的可能性。

名称诠释

Ego4D 数据集:是一个规模巨大、多样性前所未有的以自我为中心的数据集。它由 923 名来自 9 个不同国家 74 个世界各地的独特参与者收集的 3670 小时视频组成。该项目汇集了 88 名研究人员,组成了一个国际联盟,将公开可用的以自我为中心的数据的规模大大提高了一个数量级,使其比任何其他数据集在视频小时数方面多出 20 倍以上。Ego4D 旨在催生第一人称视觉感知研究的下一个时代。部分视频伴随着音频、环境的 3D 网格、眼球注视、立体声和/或来自同一事件的多个以自我为中心的摄像头的同步视频。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2024-05-29 13:38:44
悲欢阅尽
悲欢阅尽
待历经沧海 待阅尽悲欢 心方倦知返
111文章数 5关注度
往期回顾 全部

科技要闻

王传福再放狠话,燃油车要成“非主流”

头条要闻

外国女孩被中国父母收养走红网络 能说一口流利河南话

头条要闻

外国女孩被中国父母收养走红网络 能说一口流利河南话

体育要闻

阿根廷一代神锋,击碎了沙特的金元足球梦

娱乐要闻

张若昀怎么剧外比剧内更惨兮兮…

财经要闻

东方通收购藏雷 花6亿买来"业绩变脸"

汽车要闻

新哈弗H6苦练内功 向燃油车绝缘智能SAY NO

态度原创

游戏
艺术
本地
亲子
军事航空

Faker名人堂皮肤卖3500,外国网友整了个大活:我们决定永Ban狐狸

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

本地新闻

食味印象|歙县限定!枇杷味儿的清甜初夏

亲子要闻

家有萌娃,萌娃看电视模仿跳水!

军事要闻

以军装甲部队进入加沙地带南部城市拉法市中心

无障碍浏览 进入关怀版