10月10日消息,它石智航发布全球首个大规模真实世界具身VLTA多模态数据集World In Your Hands(WIYH),并计划于今年12月面向行业开放共享。据介绍,这一技术路线比特斯拉Optimus还要领先大约六个月。
据了解,目前,主流大模型训练普遍面临互联网数据质量不均、缺乏动作信息,以及仿真数据真实性不足、难以迁移至现实等问题。高质量、规模化、可泛化的训练数据成为制约人形机器人发展的关键瓶颈。
它石智航WIYH数据集基于真实世界场景构建,覆盖视觉、语言、触觉与动作多模态信息,具备以下核心特点:真实:采集源于真实具身任务,贴合模型实际应用场景;丰富:横跨多个行业与操作技能,让模型具备迁移与泛化能力,打破数据复用壁垒;全面:囊括视觉、语言、触觉、动作多模态全真值,方便预训练模态对齐;海量:量级上限堪比大语言模型,保证具身智能的未来想象力。基于这四点核心特征,该数据集形成了三项独特优势:多模态数据精准对齐、依托云端大模型实现高精度标注、在真实非封闭环境中采集,显著提升数据真实性与多样性,同时大幅降低采集成本。
据悉,它石智航WIYH数据集有望实现“一模千任”,成为通用具身基座模型训练的关键语料和基础设施,推动行业应用从单一任务迈向通用操作能力的新阶段,为具身机器人真正走进千企万家打下坚实基础。(朴灿灿)
本文来自网易科技报道,更多资讯和深度内容,关注我们。