全网唯一标准王
ICS 65.020.30 CCS B 40 重 DB50 庆 市 地 方 标 准 DB50/T 1096.3—2021 畜牧兽医大数据应用与管理 第 3 部分:信息分类与编码 2021-03-30 发布 2021-07-01 实施 重庆市市场监督管理局 发 布 DB50/T 1096.3—2021 前  言 本文件按照GB/T 1.1—2020《标准化工作导则 第 1 部分:标准化文件的结构和起草规则》的规定 起草。 本文件是DB50/T 1096的第 3 部分。DB50/T 1096已发布了以下部分: ----第 1 部分:总则 ----第 2 部分:元数据 ----第 3 部分:信息分类与编码 ----第 4 部分:数据接口 ----第 5 部分:共享交换技术要求 ----第 6 部分:信息资源目录 ----第 7 部分:管理要求 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本文件由重庆市农业农村委员会提出并归口。 本文件起草单位:重庆市畜牧技术推广总站、重庆大学、广州中国科学院软件应用技术研究所、西 南大学、重庆市巴川中学校。 本文件主要起草人:李晓波、夏云霓、陈红跃、古平、樊莉、张科、何道领、朱燕、李引、黄文明、 尹大毅。 I DB50/T 1096.3—2021 畜牧兽医大数据应用与管理 第 3 部分:信息分类与编码 1 范围 本文件规定了畜牧兽医行业大数据信息分类与编码的术语和定义、信息分类和信息编码。 本文件适用于畜牧兽医行业大数据的信息分类与编码方案的制定。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本 文件。 GB/T 7027 信息分类和编码的基本原则与方法 GB/T 13745 学科分类与代码 3 术语和定义 下列术语和定义适用于本文件。 3.1 信息分类 information classifying 把具有某种共同属性或特征的信息归并在一起,把具有不同属性或特征的信息区别开来的过程。 3.2 信息编码 information encoding 将事物或概念(编码对象)赋予具有一定规律、易于计算机和人识别处理的符号,形成的代码元素 集合。 4 信息分类 4.1 分类基本原则 信息分类应遵循科学性、系统性、实用性、可拓展性、兼容性原则。 4.1.1 科学性原则 选择畜牧兽医行业信息最稳定的本质属性或特征作为信息分类的基础和依据。 4.1.2 系统性原则 1 DB50/T 1096.3—2021 按照畜牧兽医行业信息的内在联系,形成一个科学合理的分类体系。 4.1.3 实用性原则 按照重点突出、存储方便、检索高效的原则进行分类。 4.1.4 可扩展性原则 预留分类扩展空间,可在最低层级分类下制定分类细则。 4.1.5 兼容性原则 与国内已有的相关信息分类标准相协调。 4.2 信息分类方法 按照GB/T 7027的要求执行。以线分类法为主、面分类法为补充进行分类。具体方法见附录 A。 5 信息编码 5.1 编码基本原则 信息编码应遵循唯一性、匹配性、可扩充性、简明性、规范性原则。 5.1.1 唯一性原则 每个畜牧兽医行业信息分类仅有一个编码,每个编码具有唯一性。 5.1.2 匹配性原则 编码结构应与畜牧兽医行业信息分类体系相适应。 5.1.3 可扩充性原则 编码设计规则应有适当的可扩展容量。 5.1.4 简明性原则 编码结构应层次清晰、简洁明了。 5.1.5 规范性原则 编码的类型、结构和格式应规范、统一。 5.2 编码表现形式 5.2.1 数字格式 数字格式编码是用一个或若干个阿拉伯数字表示编码对象的代码,简称为数字码。 5.2.2 字母格式 字母格式编码是用一个或多个拉丁字母表示编码对象的代码,简称为字母码。 5.2.3 混合格式 2 DB50/T 1096.3—2021 混合格式编码是由数字、字母组成的编码,或由数字、字母、特殊字符组成的代码。可以简称为字 母数字码或数字字母码。 5.2.4 特殊字符 特殊字符(如:&,@,……)可以用于数字与字母混合格式编码中以补充字母系统的字符。用这种 方法,容量得到增加,并且可以为特殊处理保留语种字符的有效字符。 5.2.5 编码设计规则 编码的设计应遵循以下三个规则: a) 采用层次码为主体,每层中采用顺序码。 b) 层次码依据编码对象的分类层级,从左至右依次编码,分为第一层代码、第二层代码、第三层 代码等,可根据发展需要增加,编码的左端为最高层级代码,右端为最低层级代码。 c) 顺序码包括递增顺序码、系列顺序码、约定顺序码。 5.3 信息编码方法 按照GB/T 7027的要求执行。具体方法见附录 B。 3 DB50/T 1096.3—2021 附 录 A (资料性) 信息分类的基本方法 A.1 概述 信息分类的基本方法有三种:线分类法、面分类法、混合分类法。 A.2 线分类法 A.2.1 方法 线分类法是将分类对象(即被划分的事物或概念)按所选定的若干个属性或特征逐次地分成相应的 若干个层级的类目,并排成一个有层次的,逐渐展开的分类体系。在这个分类体系中,被划分的类目称 为上位类,划分出的类目称为下位类,由一个类目直接划分出来的下一级各类目,彼此称为同位类。同 位类类目之间存在着并列关系,下位类与上位类类目之间存在着隶属关系。 A.2.2 要求 线分类法的要求包括以下四点: a) 由某一上位类划分出的下位类类目的总范围应与该上位类类目范围相等; b) 当某一个上位类类目划分成若干个下位类类目时,应选择同一种划分基准; c) 同位类类目之间不交叉、不重复,并只对应于一个上位类; d) 分类要依次进行,不应有空层或加层。 A.2.3 示例 GB/T 13745 学科分类与代码是采用线分类法。该标准将畜牧兽医相关学科类型分成三个层级,第 一层级用三位数字表示一级学科,第二层级用两位数字码表示二级学科,第三层级再用两位数字表示三 级学科。部分代码表见表A.1。 表 A.1 线分类法示例表 代码 230 230.20 名称 畜牧、兽医科学 畜牧学 230.2010 家畜育种学 230.2015 家畜繁殖学 230.2020 动物营养学 …… 230.30 …… 兽医学 230.3010 家畜解剖学 230.3015 家畜组织胚胎学 4 DB50/T 1096.3—2021 230.3020 兽医免疫学 …… …… 在表A.1 中,畜牧、兽医科学相对于畜牧学、兽医学为上位类类目,畜牧学、兽医学相对于畜牧、 兽医科学为下位类类目,畜牧学、兽医学是同位类类目。 A.3 面分类法 A.3.1 方法 面分类法是将所选定的分类对象的若干个属性或特征视为若干个“面”,每个“面”中又可分成彼 此独立的若干个类目。使用时,可根据需要将这些“面”中的类目组合在一起,形成一个复合类目。 A.3.2 要求 面分类法的要求包括以下四点: a) 根据需求选择分类对象本质的属性或特征作为分类对象的各个“面”; b) 不同“面”内的类目不应相互交叉,也不能重复出现; c) 每个“面”有严格的固定位置; d) “面”的选择以及位置的确定,根据实际需要而定。 A.3.3 示例 牛的分类可采用面分类法,牛的品种、用途、产地作为三个“面”,每个“面”又可分为若干个类 目,见表A.2。 表 A.2 面分类法示例表 品种 用途 产地 牦牛 奶牛 奉节县 黄牛 肉牛 云阳县 …… 使用时,将有关类目组配起来。如:奉节产奶牦牛、云阳肉用黄牛等。 A.4 混合分类法 混合分类法是将线分类法和面分类法组合使用,以其中一种分类方法为主,另一种做补充的信息分 类方法。 5 DB50/T 1096.3—2021 附 录 B (资料性) 信息编码的基本方法 B.1 通则 编码方法应以预定的应用需求和编码对象的性质为基础,选择适当的编码结构。在决定编码结构的 过程中,既要考虑各种代码的编码规则,又要考虑各种代码的优缺点,还有分析代码的一般性特征,选 取适合的代码表现形式,研究代码设计所涉及的各种因素,避免潜在的不良后果。 B.2 B.2.1 层次码 规则 层次码以编码对象集合中的层级分类为基础,将编码对象编码成为连续且递增的组(类)。 位于较高层级上的每一个组(类)都包含并且只能包含它下面较低层级全部的组(类)。这种代码 类型以每个层级上编码对象特性之间的差异为编码基础。每个层级上特性必须互不相容。 细分至较低层级的层次码实际上是较高层级代码段和较低层级代码段的复合代码。层次码的一般结 构见图B.1: 图 B.1 层次码一般结构 B.2.2 应用 层次码通常用于分类的目的。层级数目的建立依赖于信息管理的需求。层次码较少用于标识和参照 的目的。 层次码非常适合于诸如统计目的、报告货物运转、基于科学的出版分类等情况。 如表B.1所示,GB/T 13745学科分类与代码中学科代码格式由 7 个数字位组成,下一级学科相对于 上一级学科按固定的 2 位代码段递增。 表 B.1 固定递增格式示例表 代码 230 230.20 230.2010 B.3 名称 畜牧、兽医科学 畜牧学 家畜育种学 顺序码 6 DB50/T 1096.3—2021 B.3.1 规则 从一个有序的字符集和中顺序地取出字符分配给各个编码对象。这些字符通常是自然数的整数,如: 以“1”打头;也可以是字母字符,如:AAA、AAB、AAC、……。 B.3.2 应用 顺序码一般作为标识或参照为目的的独立代码来使用,或者作为复合代码的一部分来使用,后一种 情况经常附加分类代码。 在码位固定的数字字段中,应使用零填满字段的位数直到满足码位的要求。示例:在 3 位数字字 段中,数字 1 编码为 001,而数字 15 编码为 015。 B.3.3 类型 顺序码有三种类型:递增顺序码、系列顺序码、约定顺序码。 B.3.3.1 递增顺序码 编码对象被赋予的代码值,可由预定数字递增决定。例如,预定数字可以是 1(纯递增型),或者 是 10(只有 10 的倍数可以赋值),或者是其他数字(如:偶数情况下的 2 ),等等。 用这种方法,代码值不带有任何含义。相类似的编码对象的代码值不作分组。 为了以后原始代码集的修改,可能需要使用中间的代码值,这些中间代码值的赋值不必按1递增。 GB/T 13745 学科分

pdf文档 DB50-T 1096.3-2021 畜牧兽医大数据应用与管理 第3部分:信息分类与编码 重庆市

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
DB50-T 1096.3-2021 畜牧兽医大数据应用与管理 第3部分:信息分类与编码 重庆市 第 1 页 DB50-T 1096.3-2021 畜牧兽医大数据应用与管理 第3部分:信息分类与编码 重庆市 第 2 页 DB50-T 1096.3-2021 畜牧兽医大数据应用与管理 第3部分:信息分类与编码 重庆市 第 3 页
下载文档到电脑,方便使用
本文档由 思安 于 2022-10-11 13:03:57上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。