全网唯一标准王
T/SHV2X 11—2025 ICS 43.020 CCS R85 团体标准 汽车驾驶自动化系统通用语料库 第4部分:语料数据清洗 General corpus for automotive driving automation system— Part 4: Data cleaning 2025 - 07 - 25发布 2025 - 07 - 25实施 上海市车联网协会 发布 全国团体标准信息平台 T/SHV2X 11—2025 I 全国团体标准信息平台 T/SHV2X 11—2025 I 目次 前言 ............................................................................ II 引言 ........................................................................... III 1 范围 ................................................................................. 1 2 规范性引用文件 ....................................................................... 1 3 术语和定义 ........................................................................... 1 4 符号和缩略语 ......................................................................... 1 5 数据预处理 ........................................................................... 1 数据格式统一 ..................................................................... 1 完整性校验 ....................................................................... 1 数据抽帧 ......................................................................... 1 6 数据清洗 ............................................................................. 2 7 质量要求 ............................................................................. 2 8 数据存储 ............................................................................. 2 附录A (资料性) 文件结构样例 .................................................... 3 A.1 结构化数据包样例文件结构 ......................................................... 3 参考文献 ......................................................................... 4 全国团体标准信息平台 T/SHV2X 11—2025 II 前言 《汽车驾驶自动化系统通用语料库》系列标准拟分为六个部分: ——第1部分:总体要求; ——第2部分:术语和定义; ——第3部分:语料数据采集; ——第4部分:语料数据清洗; ——第5部分:语料数据标注; ——第6部分:语料数据测试。 本文件为第4部分。 本文件按照GB/T 1.1—2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。 本文件由上海市车联网协会提出并归口。 本文件起草单位:上海库帕思科技有限公司、智能汽车创新发展平台(上海)有限公司、智己汽车科技有限公司、地平线征程(上海)科技有限公司、上海临港绝影智能科技有限公司、上海机动车检测认证技术研究中心有限公司、上海金桥智能网联汽车发展有限公司、北京一辅智行科技有限公司、上海优咔网络科技有限公司、亿咖通(上海)技术有限公司、滴水智行科技有限公司、上海航盛实业有限公司、上海阶跃星辰智能科技有限公司、东华大学、上海交通大学、上研智联智能出行科技(上海)有限公司、北京赛目科技股份有限公司、苏州柏川数据科技有限公司、华为技术有限公司。 本文件主要起草人:山栋明、黄海清、施佳樑、郭辉、赵九花、贺锦鹏、蒋达夫、周剑鸣、黄剑其、邵亚萌、徐春雷、解瀚光、朱雷、谭龙欢、于峰、滕添益、张帆、林瑜、周轶、袁月明、李学根、张裕珍、曹宇、邓思文、贺仁驹、李晨歌、马昊、陈紫娟、杨闻博、丁楚晨、李想、蔡雨辰、黄鹏飞、刘建业、李勋宏、马骏、李轶刚、刘壹青、田浩、郭晓宾、董连飞、范昌琪、李璟、孙雯、陈巧慧、王娜、沈滨、孔令和、鲁江东、汪大明、徐鹏、何丰、谭哲、薛晓卿、刘兴、马东升、刘鹏宇、邓子涵。 本文件首批承诺执行单位:上海库帕思科技有限公司、智能汽车创新发展平台(上海)有限公司、智己汽车科技有限公司、地平线征程(上海)科技有限公司、上海临港绝影智能科技有限公司、上海机动车检测认证技术研究中心有限公司、上海金桥智能网联汽车发展有限公司、北京一辅智行科技有限公司、上海优咔网络科技有限公司、亿咖通(上海)技术有限公司、滴水智行科技有限公司、上海航盛实业有限公司、上海阶跃星辰智能科技有限公司、东华大学、上海交通大学、上研智联智能出行科技(上海)有限公司、北京赛目科技股份有限公司、苏州柏川数据科技有限公司、华为技术有限公司。 全国团体标准信息平台 T/SHV2X 11—2025 III 引言 为了实现可靠的汽车驾驶自动化, 大量准确的语料数据至关重要。 语料数据是自动驾驶系统的基础,它能够帮助系统理解复杂的交通环境、做出明智的决策,并不断优化性能。随着端到端模型整合度越来越高,对训练语料的规模和质量要求也成倍增加。大规模、高质量的数据标注(特别是端到端感知数据和推理数据)是构建安全、可靠、高性能自动驾驶系统的基石。围绕“采、洗、标、测”一体化流程,制定《汽车驾驶自动化系统通用语料库》系列标准,包括: —— 第1部分:总体要求,明确系列标准建设的总体要求,为后续各部分标准的制定提供指导和基础; —— 第2部分:术语和定义,统一系列标准建设过程中涉及的关键术语和定义; —— 第3部分:语料数据采集,对语料数据资源格式提出规范要求; —— 第4部分:语料数据清洗,针对采集好的数据,对语料数据清洗的流程与质量要求提出规范要求; —— 第5部分:语料数据标注,针对清洗好的数据,对语料数据标注的适用场景、标注内容、标注方式、数据存储提出规范要求; —— 第6部分:语料数据测试,针对标注好的数据,对语料数据测试的流程和质量要求提出规范要求。 本文件为第4部分语料数据清洗。通过本文件的制定,对自动驾驶数据清洗流程与质量进行统一规范,保障感知系统训练过程中的可靠性,最终可生成高价值的语料数据集用于模型训练与决策,为自动驾驶技术的发展提供有力支持。通过构建可复用的标准化自动驾驶训练数据集,促进汽车驾驶自动化系统语料资源高效流通利用,降低业内企业在重复数据采集、清洗、标注等方面的巨额成本,提升汽车企业竞争力且推进汽车产业健康发展。 全国团体标准信息平台 T/SHV2X 11—2025 1 汽车驾驶自动化系统通用语料库 第4部分:语料数据清洗 1 范围 本文件规定了汽车驾驶自动化系统通用语料库语料数据清洗的流程,包括数据预处理、数据清洗和质量等方面的要求。 本文件适用于企业、研究机构对汽车驾驶自动化系统通用语料库的研究、开发、维护、应用、评估等工作。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。 其中, 注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB/T 41871—2022 信息安全技术 汽车数据处理安全要求 CH/T 8023—2011 机械激光雷达数据处理技术规范 3 术语和定义 T/SHV2X 10—2025文件界定的术语和定义适用于本文件。 4 符号和缩略语 下列缩略语适用于本文件。 IMU 惯性测量单元(Inertial Measurement Unit) 5 数据预处理 数据格式统一 数据格式统一,指在自动驾驶语料数据处理过程中,待清洗的所有原始采集数据须转换为统一、可解析、可追溯的结构化格式数据集,相关数据资源的要求应满足T/SHV2X 1—2025的规定。 完整性校验 在完成数据格式统一后,数据资源应按表1中的要求和规则进行数据包完整性、元数据完整性及数据融合和对齐等类型的校验和问题处理。 表1 完整性校验及问题处理规则 类型 要求 问题

.pdf文档 T-SHV2X 11-2025 汽车驾驶自动化系统通用语料库 第 4 部分 语料数据清洗

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
T-SHV2X 11-2025 汽车驾驶自动化系统通用语料库 第 4 部分 语料数据清洗 第 1 页 T-SHV2X 11-2025 汽车驾驶自动化系统通用语料库 第 4 部分 语料数据清洗 第 2 页 T-SHV2X 11-2025 汽车驾驶自动化系统通用语料库 第 4 部分 语料数据清洗 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2025-09-01 01:38:52上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。