T/SAIAS 上海市人工智能行业协会团体标准
T/SA1AS018-2025代替:T/SA1AS018-2024
Construction Guidelines for Corpus of Embodied Intelligence
上海市人工智能行业协会 发布
目次
前 言. IV引 言.1范围.2规范性引用文件3术语和定义,4缩略语...5具身智能数据 5.1一般原则.5.2数据集,5.2.1数据片段5.2.2时间切片5.3数据资源... 5.3.1数据资源类型5.3.2数据信息存储格式6具身智能数据采集.6.1真实数据采集6.1.1采集方式, 6.1.2采集本体,6.2合成数据采集.6.2.1采集方式,6.2.3合成数据生成方式 6.2.2合成数据有效性考虑因素6.2.4合成数据用途6.3采集数据提交... 66.3.1数据文件标识 6.3.2数据提交方式 66.4数据采集场景与任务体系.6.4.1场景... 6.4.2任务,6.4.3原子技能.6.5数据采集操作规范6.5.1采集环境要求6.5.3采集人员培训 6.5.2采集设备选型7具身智能语料生产7.1采集数据完整性检查 N7.2数据资源清洗过程
7.2.1主要流程 87.2.2数据规范管理 87.2.3数据整理分类 87.2.5数据去噪... 7.2.4数据脱密脱敏 87.2.6数据去重. 6 67.2.7数据存储与备份 67.3数据资源标注过程. 7.3.1基本要求.. 6 67.3.2标注任务制定, 67.3.3数据标注检查流程 67.3.4定义坐标系, 7.3.5标注方法 6 97.4数据质量评估, 107.4.1基本要求,7.4.2数据准确性 7.4.3数据一致性 10 107.4.4数据适用性 107.5数据有效性评估 117.5.1数据集选型 7.5.2模型选型 11 117.5.3测试本体选型 117.5.4测试任务设计 117.5.5测试指标设计 7.5.6模型测试执行 118数据安全.... 11 118.1安全性评价, 118.2安全管理流程 118.4人员管理. 8.3安全技术 12附录A (资料性) 具身智能语料库数据资源类型 13A.1视频数据 13A.2雷达数据. 14A.3音频数据. A.4本体数据. 15 15A.5轨迹导航数据 16附录B(资料性)具身智能遥操作模式数据采集本体参考性能参数 17B.1性能参数. 17(资料性) “生产伴随”式数据采集设备参考性能参数 81C.1性能参数.. C.2可靠性与稳定性 81 81C.3适配性. 81附录D(资料性)具身智能语料库数据有效性评估数据集要求, 61
D.1数据集准备 19D.2数据质量要求 6[参考文献. 07
前言
起草. 本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定
本文件代替T/SAIAS018-2024《具身智能语料库建设导则》,与T/SAIAS018-2024相比,除结构调整和编辑性改动外,主要技术变化如下:
a)更改了“范围”部分,添加了和语料质量评估、有效性评估相关的表述(见第1章,2024年版的第1章):b)增加了“合成数据”术语(见3.7):d)更改了数据集中的“时间切片”定义,及其内容类型分类(见5.3.2,2024年版的5.3.2):e)更改了“数据资源类型”中各类数据的推荐指标、语义分类、语义特征等内容(见5.4.1、附 录A,2024年版的5.4.1):f)增加了“视频数据分类表”中的数据来源(见附录A.1):h)增加了“本体数据”中对于采集设备本体的描述(见附录A4),“数据信息存储格式”的“基5.4.2.2),“元数据格式”中本体数据的末端工具信息(见5.4.2.3),“真实数据采集”的采集路径(见6.1.1):j)更改了“采集本体”的参考性能参数(见6.1.2、附录B、附录C):功能要求(见6.1.2),“合成数据采集”的采集路径(见6.2.1):m)增加了“合成数据的生成方式”中,仿真合成这一步骤(见6.2.3),“数据采集场景与任务 的6.3.2):体系”(见6.4),“数据采集操作规范”(见6.5):7.2.5),“数据标注”的基本要求(见7.3.1)以及“标注任务制定”中的“任务标注”和“子p)更改了“定义坐标系”的类型(见7.3.4,2024年版的7.3.3): 任务标注”类别(见7.3.2):,(),(),(
料库数据有效性评估数据集要求”作为资料性参考(见附录D).
请注意本文件的某些内容可能涉及专利.本文件的发布机构不承担识别这些专利的责任.
本文件由上海市人工智能行业协会提出并归口.
人形机器人(上海)有限公司、上海机器人产业技术研究院有限公司、上海智元新创技术有限公司、上 本文件起草单位:上海库帕思科技有限公司、上海市人工智能行业协会、上海人工智能创新中心、海宫彻智能科技有限公司、上海傅利叶智能科技有限公司、上海开普勒机器人有限公司、中国电子科技集团公司第二十一研究所、星海图(苏州)人工智能科技有限公司、工业互联网创新中心(上海)有限公司、上海国评智检机器人有限公司、复旦大学、上海交通大学、同济大学、上海钛米机器人股份有限 公司、松应科技有限公司、上海华为技术有限公司、上海擎朗智能科技有限公司、四川天链机器人股份有限公司、上海市先导产业促进中心、上海中创产业创新研究院、国创智造科技(上海)有限公司.
郑忠斌、高平、施佳標、卢恒、张裕珍、邓思文、曹宇、李晨歌、赵春昊、饶雪、汪汗青、江磊、刘字 本文件主要起草人:山栋明、钟俊浩、黄海清、庞江淼、姜育刚、卢策吾、何斌、陈春玉、王洪武、飞、李泳耀、许凯、朱玉琛、林雪琴、黄媚、王煜、沈荣港、邢琳、姚卵青、闫维新、沈咏剑、周航、