11月12日,盖世汽车获悉,中国电子技术标准化研究院发布“求索”具身智能测评基准EIBench并开展首次测评(基于在编国标)。

据悉,“求索”具身智能测评基准EIBench,是针对具身智能数据难复用、模型泛化性差、安全难保障等产业痛点推出的首个具身智能领域评测基准,聚焦数据格式、具身智能大模型、安全及可信赖度等,形成基于国家标准的测评指标体系。该标准在模型侧主要面向VLA和VLM两类具身智能大模型,这也代表着我国具身智能行业发展在规范化和标准化的方向上迈出了关键一步。

本次测评中,北京人形机器人创新中心的XR-1模型成为唯一通过测试的VLA(视觉-语言-动作)模型,获颁CESI-CTC-20251103具身智能测试证书。此次成果标志着我国具身智能技术迈向标准化验证新阶段。

图片来源: 北京人形机器人创新中心

在测试中,XR-1共在天工2.0、UR、Franka等三款机器人上,针对取放、推拉、旋转、插入等双臂技能进行基础测试,以及物体颜色、位置、姿态,环境亮度、色温,背景、干扰物等七大维度的泛化测试,一致通过。每项测试定量采集40-50条少量数据,在每个任务每项测试维度进行10次以上的真机测试,测试全程由中国电子技术标准化研究院专家参与,在流程设计和实际执行层面均做到了标准化公平可复现。