![]()
工业和信息化部近日批准发布《YD/T 6770—2026 人工智能 关键基础技术 具身智能基准测试方法》,为具身智能领域首份行业标准,将于6月1日正式实施,标志着具身智能评测迈入“有标可依”的新阶段。
该标准为具身智能领域构建了统一基准测试框架,规范了在仿真环境和真实环境下,开展具身智能基准测试的环境设置、任务库构建、测试过程和指标计算方法。目前该标准已同步推进国际标准立项。
中国信通院有关专家表示,可信的评测体系是连接技术研究与大规模产业应用的桥梁和标尺,该标准将为行业提供统一的技术规范框架、建立互信基础。在技术研发层面,为具身智能的能力评估提供统一的度量依据,指引技术迭代方向,帮助行业及早识别并收敛于高价值技术路线,减少研发资源的无效投入;在应用落地层面,为行业用户开展产品选型与应用验证提供标准规范支撑,避免市场出现“劣币驱逐良币”现象;在产业发展层面,将加速具身智能从实验室走向真实场景,促进具身智能技术成果的工程化落地和产业化应用。
![]()
图1 《YD/T 6770-2026 人工智能 关键基础技术 具身智能基准测试方法》
《YD/T 6770-2026 人工智能 关键基础技术 具身智能基准测试方法》概述如图1,描述了在仿真环境和真实环境下面向具身智能系统的基准测试框架、指标和方法,包括基准测试的环境设置、任务库构建、测试过程和指标计算方法,适用于单个具身智能系统“感知-决策-执行”全链路能力的基准测试。
该标准构建了统一的具身智能基准测试框架(如图2所示),包括环境设置、测试任务库、测试过程和指标计算四部分。测试环境方面,规定了仿真测试环境和真实测试环境的构建要求,确保环境设置能反映现实环境的复杂性。测试任务方面,提出了测试任务库构建方法和泛化评估基准,支撑评估被测对象在不同任务复杂性、不同能力维度上的性能表现和泛化性。测试过程方面,主要面向模型和部署模型的整机系统两类测试对象开展测试,测试方法包括静态仿真测试、动态仿真测试、真实环境测试和组合式测试等。测试指标方面,主要包括任务执行效率、任务成功率、人工干预率、场景扰动衰减率和平均任务能耗等五个指标。
![]()
图 2 具身智能基准测试框架图
该份行业标准的制定,对具身智能产业各方推动技术进步、产业应用和标准化建设具有重要意义。对研发侧,为具身智能的能力评估提供了统一的度量依据,指引技术迭代方向,帮助行业及早识别并收敛于高价值技术路线,减少研发资源的无效投入。对应用侧,为行业用户开展产品选型与应用验证提供标准规范支撑,避免市场出现“劣币驱逐良币”的现象。对产业侧,加速具身智能从实验室走向真实场景,促进具身智能技术成果的工程化落地和产业化应用。
财报直击 | 中国电信2025年营收5296亿元,利润332亿元
财报直击 | 中国移动2025年营收10502亿元
重构财报直击 | 2025年中国联通营收3922亿元,净利润连续6年攀升
责编/版式:孙天
审校:梅雅鑫
监制:刘启诚
【媒体矩阵】
今日头条 | 微博 | 微软MSN | 百家号
网易号 | 人民号 | 腾讯新闻 | 搜狐
新浪看点 | 雪球号 | 知乎
【运营团队】
编辑|梅雅鑫 孙天 朱文凤
审校 | 梅雅鑫
监制|刘启诚
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.