全网唯一标准王
ICS 35.240 CCS L 67 37 山东省 地方标准 DB37/T 4646.5—2025 公共数据 数据治理规范 第5部分:数据质量 Public data—Data governance specification— Part 5:Data quality 2025 -05 - 24发布 2025 - 06 - 24实施 山东省市场监督管理局 发布 DB37/T 4646.5 —2025 I 目次 前言 ................................................................................. II 引言 ................................................................................ III 1 范围 ............................................................................... 1 2 规范性引用文件 ..................................................................... 1 3 术语和定义 ......................................................................... 1 4 缩略语 ............................................................................. 1 5 基本要求 ........................................................................... 1 6 数据质量要求 ....................................................................... 1 7 证实方法 ........................................................................... 3 参考文献 .............................................................................. 4 DB37/T 4646.5 —2025 II 前言 本文件按照GB/T 1.1—2020 《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定 起草。 本文件是DB37/T 4646 《公共数据 数据治理规范》的第 5部分。DB37/T 4646已经发布了以下部分: ——第1部分:数 据归集; ——第2部分:数据清洗比对; ——第3部分:数据返还; ——第4部分:资源服务目录; ——第5部分:数据质量。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本文件由山东省大数据局提出、归口并组织实施。 DB37/T 4646.5 —2025 III 引言 为构建完善全省一体化数据资源体系,强化数据供给,提升数据治理能力,深化数据创新应用,山 东省先后印发《山东省“十四五”数字强省建设规划》(鲁政字〔2021〕128号)等一系列政策文件, 对全省一体化数据资源体系建设和管理提出要求。 为进一步发挥标准化在全省数据治理工作规范化开展中的保障作用, 针对当前数据治理中数据归集、 数据清洗比对、数据返还、资源服务目录等工作存在的普遍问题,制定DB37/T 4646 《公共数据 数据 治理规范》系列标准。DB37/T 4646拟由以下五个部分构成。 —— 第1部分:数据归集。目的在于 规范各级公共管理和服务机构归集数据至省一体化大数据平 台的流程和要求。 —— 第2部分:数据清洗比对。目的在于规范各级公共管理和服务机构依托省一体化大数据平台 开展数据清洗比对工作的流程、方法和要求。 —— 第3部分:数据返还。目的在于规范各级公共管理和服务机构依托省一体化大数据平台开展 数据返还工作的流程和要求。 —— 第4部分:资源服务目录。目的在于规范各级公共管理和服务机构依托省一体化大数据平台 开展资源服务目录管理和应用的工作。 —— 第5部分:数据质量。目的在于规范各级公共管理和服务机构依托省一体化大数据平台开展 数据质量提升工作。 DB37/T 4646.5 —2025 1 公共数据 数据治理规范 第 5部分:数据质量 1 范围 本文件规定了公共数据质量的要求和证实方法等。 本文件适用于各级公共管理和服务机构依托省一体化大数据平台开展公共数据质量提升工作。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。 其中, 注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本 文件。 GB/T 2261.1 个人基本信息分类与代码 第1部分:人的性别代码 GB/T 19488.2 电子政务数据元 第2部分:公共数据元目录 GB/T 34960.5— 2018 信息技术服务 治理 第5部分:数据治理规范 GB/T 36344 —2018 信息技术 数据质量评价指标 DB37/T 4646.1 —2023 公共数据 数据治理规范 第1部分:数据归集 DB37/T 4646.2 公共数据 数据治理规范 第2部分:数据清洗比对 3 术语和定义 DB37/T 4646.1 —2023界定的以及下列术语和定义适用于本文件。 数据质量 data quality 在指定条件下使用时,数据的特性满足明确的和隐含的要求的程度。 [来源:GB/T 36344 —2018,2.3] 4 缩略语 下列缩略语适用于本文件。 IP:网络互联协议( Internet Protocol) 5 基本要求 公共数据在数据采集、数据汇聚、数据治理、数据共享、数据开放、数据开发利用等全生命周期 的各个阶段均应符合数据质量要求。 公共管理和服务机构、大数据工作主管部门应基于数据质量要求,制定数据质量检查规则,定期 开展数据清洗比对、问题数据修正等数据质量提升工作,数据清洗比对应符合 DB37/T 4646.2 的要求。 6 数据质量要求 DB37/T 4646.5 —2025 2 数据质量主要包括规范性、完整性、准确性、唯一性、一致性、时效性和可访问性等方面,数据质 量要求及说明应符合表1 的规定。 表1 数据质量要求 一级指标 二级指标 要求 说明 规范性 命名规范 数据库、数据表、数据字段等应按照国家 标准、行业标准、地方标准等规定的统一 规则命名 例如贫困人口信息数据中的字段统一按照拼音 缩写命名,包括姓名命名为“xm”、性别命名为 “xb”、民族命名为“mz ”等 数据类型规 范 数据实际类型应与国家标准、行业标准、 地方标准等规定的类型格式保持一致 例如人口信息中的身份证件号码按照GB/T 19488.2的要求,其数据类型为字符型 数据值域规 范 数据的取值范围应与国家标准、行业标准、 地方标准等规定的值域代码表保持一致 例如性别数据取值范围符合GB/T 2261.1中的要 求,包括0 -未知的性别、1 -男性、2-女性和9- 未说明的性别 精度规范 对于数字型数据,应按照国家标准、行业 标准、地方标准等规定的精度进行填写 例如注册资本按照GB/T 19488.2 的要求统一精 确到小数点后四位 计量单位规 范 对于存在计量单位的数据,应按照国家标 准、行业标准、地方标准等规定的计量单 位进行填写 例如注册资本按照GB/T 19488.2的要求统一以 万元为计量单位 准确性 数据合理 数据值应符合业务逻辑,不应存在逻辑或 常识性错误 幼儿园学生入学年龄数据出现不合理数据, 例如 入学年龄为 18岁 数据符合预 期 数据值应与数据集、数据字段名称保持一 致,不应出现预期外的数据 姓名数据字段中出现与姓名不符的数据, 例如年 龄数据 完整性 数据记录完 整 数据应包含完整的数据记录,不应存在缺 失、遗漏 数据记录存在缺失, 例如企业登记信息数据实际 包含数据记录数少于应包含数据记录数 数据字段完 整 数据应包含完整的数据字段,不应存在缺 失、遗漏 数据字段存在缺失, 例如企业登记信息数据实际 包含数据字段数少于应包含数据字段数 数据值完整 若数据具有主键,其主键值应完整,不应 为空或缺失;基于业务规则应被赋值的数 据值应完整 例如企业登记信息数据中,主键应完整,不应存 在空值;统一社会信用代码、法定代表人等基于 业务规则应被赋值的数据,应完整,不应存在空 值 唯一性 主键唯一 数据的主键应唯一,不应重复 主键存在重复,不唯一,例如企业登记信息数据 中存在两个或两个以上完全一样的主键值 字段唯一 数据的字段应唯一,不应重复 数据字段存在重复,不唯一,例如企业登记信息 数据中存在两个或两个以上完全一样的数据字 段 记录唯一 数据的记录

.pdf文档 DB37-T 4646.5-2025 公共数据 数据治理规范 第5部分 数据质量 山东省

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
DB37-T 4646.5-2025 公共数据 数据治理规范 第5部分 数据质量 山东省 第 1 页 DB37-T 4646.5-2025 公共数据 数据治理规范 第5部分 数据质量 山东省 第 2 页 DB37-T 4646.5-2025 公共数据 数据治理规范 第5部分 数据质量 山东省 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2025-07-26 04:08:35上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。