全网唯一标准王
ICS 01.140.20 A 14 DB13 河 北 省 地 方 标 准 DB 13/T 2351.3—2016 标准文献结构化数据规范 第 3 部分:元数据著录规则 Structured data specifications of standard documents Part 3:Descriptive rules of metadata 2016 - 05 - 23 发布 河北省质量技术监督局 2016 - 07 - 01 实施 发 布 DB13/T 2351.3—2016 前 言 本部分按照GB/T 1.1-2009给出的规则起草。 DB13/T DB13/T 2351《标准文献结构化数据规范》包括了3部分: ——第1部分:全文元数据; ——第2部分:指标元数据; ——第3部分:元数据著录规则。 本部分是第3部分,本部分与第1、2部分配套使用。 本部分由河北省服务业标准化技术委员会提出并归口。 本部分起草单位:河北省标准化研究院。 本部分主要起草人:卢艳芳、施健、马星晓、谢燕、闫志强、张园园、陈南、李建勋、赵倩、安姣、 郭天强、李朴。 I DB13/T 2351.3—2016 引 言 标准文献电子文档格式有DOCX、数字版PDF、扫描版PDF。在生产、科研和管理过程中,往往需要 定位到标准内容、指标信息上,如:检索标准指标、指标比对及标准水平分析等。但是,现有的标准文 献电子文档为非结构化文档,这一特性决定它的内容检索指向性笼统模糊,故而,以非结构化文档为单 元存储无法实现小颗粒度的指标数据的检索、比对分析。只有通过数据处理将非结构化文档转换为结构 化或半结构化文档方能解决上述问题。 为寻求上述瓶颈的突破,河北省标准化研究院在2012年将标准文献结构化列为重点科研项目,在 此基础上,2013年又承担了国家标准化委员会标准化信息中心的《“双打”重点产品标准文献结构化内 容数据库》项目,而实现标准文献结构化必须首要解决2个问题:1)结构化标准的数据结构问题,换而 言之,标准结构化加工抽取出的数据是哪些数据?2)抽取出来的数据进行加工应符合什么样的数据规 范要求,方能满足与原始标准文本内容的一致性的需求。 解决第一个问题,需要建立标准结构化数据模型,并通过元数据规范来实现; 解决第二个问题,需要建立数据的著录规则,实现数据的规范性。 项目组在确定文献结构化抽取技术的基础上,对4000余项强制性国家标准的内容要素逐一进行了 分析研究、归纳总结后,按UML思想确定了标准结构化数据模型,并在工程上对4000余项强制性国家标 准进行了结构化数据的抽取验证,确定了结构化元数据。通过验证测试,逐步完善了加工抽取结构化数 据的规范要求,形成了《标准文献结构化数据规范》。 目前,在行业内广泛使用的GB/T 22373-2008《标准文献元数据》是针对标准文献题录的元数据标 准,侧重的是标准文献形式特征,而此次制定的《标准文献结构化数据规范》是关于标准内容结构化的 全文元数据和指标元数据规范,希望此两个标准的结合使用,实现标准文献信息资源的统一描述,促进 标准文献信息资源的开发利用。 II DB13/T 2351.3—2016 标准文献结构化数据规范 第 3 部分:元数据著录规则 1 范围 本部分规定了标准文献结构化全文(全文、术语、图像、表格、公式)、指标元数据加工的术语和定 义、著录项目、著录总则和著录细则等内容。 本部分适用于标准文献结构化数据的处理。 2 规范性引用文件 下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。 凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB/T 1.1 标准化工作导则 第1部分:标准的结构和编写 GB/T 7408 数 据 元 和 交 换 格 式 信 息 交 换 日 期 和 时 间 表 示 法 ( GB/T 7408-2005,ISO 8601:2000,IDT) GB 18030 信息技术 中文编码字符集 GB/T 22373-2008 标准文献元数据 DB13/T 2351.1-2016 标准文献结构化数据规范 第1部分:全文元数据 DB13/T 2351.2-2016 标准文献结构化数据规范 第2部分:指标元数据 汉语分类主题词表 中国科学技术信息研究所与北京图书馆主编(1980年) 3 术语和定义 下列术语和定义适用于本文件。 3.1 著录description 对文献的内容和形式特征进行分析、选择和记录的过程。 [GB/T 22373-2008,定义 第3.10] 3.2 著录项目 elements 用以揭示标准文献形式特征和内容特征的记录事项。 3.3 核心元数据 core metadata 描述信息资源基本属性的元数据元素和元数据实体。 [GB/T 26816-2011,定义3.5] 1 DB13/T 2351.3—2016 4 著录项目和核心元数据 4.1 全文元数据著录项目和核心元数据 全文元数据著录项目和核心元数据见表1。 表1 全文元数据著录项目、定义和核心元数据 序号 著录项目 定义 0 标识符 1 标准号 2 标准名称 3 篇章条编号 4 篇章条名称 标准中篇章条的标题名称。 * 5 篇章条内容 标准中篇章条的段落内容。 * 6 篇章条类型 描述篇章条类别。 7 篇章条所在页码 同一标准篇章条首次出现所在的页码。 8 篇章条父章节 当前篇章条的上一级章节的编号。 9 篇章条顺序号 篇章条顺序号。 10 文字 以文字形式描述的标准内容。 * 11 表号 标准内容中表格按特定规则的顺序编号。 (表号定义说明见 DB13/T * 12 表名 描述表格主题的名称。 * 13 表格图像路径 表格图像文件存储的路径。 * 14 表注 标准内容中表格的注释。 * 15 表格所在页码 标准内容中同一表格首次出现所在页码。 16 同一表格顺序号 跨页表格图像文件的顺序号。 17 表格 HTML 格式 用 HTML 描述的表格信息。 18 图号 19 图名 描述图的主题的名称。 * 20 图像路径 图像文件存储的路径。 * 21 图注 标准内容中图像的注释。 * 22 图像所在页码 标准内容中同一图像首次出现的页码。 23 同一图像顺序号 同一图号的图像在不同页赋予的顺序编号。 24 术语中文名称 术语的中文标题名。 * 25 术语英文名称 术语的英文标题名。 * 26 术语内容 术语的定义内容。 * 2 名称空间中对象的唯一标识符。 核心元数据 由有关标准化机构给定的用于唯一识别某一标准的注册号或登记号, 标准号由标准代号、顺序号、发布年份及有关标识符组成。 标准的中文名称 标准内容中篇章条按一定规则的顺序编号(篇章条编号定义说明见 DB13/T 2351.1-2015 中的附录 B.1.1) 。 * * * * 2351.1-2015 中的附录 B.2.1) 。 标 准 内 容中 图 像按 特 定规 则的 顺 序 编号 。( 图号 定 义说明 见 附 录 B.3.1) 。 * DB13/T 2351.3—2016 表 1(续) 序号 著录项目 定义 核心元数据 为了使用方便,使术语称谓中的成分进行有规律的节缩或者省略形成 27 术语缩略语 28 术语同义词 表达意义相同或相近,但是表达形式不同的词汇。 29 术语禁用词 禁止使用的术语。 30 术语注 术语条款的注释。 31 术语所在页码 标准内容中该术语首次出现所在页码。 32 公式名称 描述公式的主题的名称。 * 33 公式图像路径 公式图像文件存储的路径。 * 34 公式注 公式的注释。 * 35 公式所在页码 标准内容中同一公式首次出现所在页码。 36 更新时间 描述全文数据修改更新的时间。 37 记录状态 38 版本 描述全文数据更新的版本编号。 39 加工单位 描述全文数据加工单位的信息。 的词。 * 关于标准文献全文元数据库中记录所处的状态(修改、删除、新增) 的说明。 * * 注:标星号“*”的数据项为核心元数据。 4.2 技术指标元数据著录项目和核心元数据 技术指标元数据著录项目和核心元数据见表2。 表2 技术指标元数据著录项目和核心元数据 序号 0 著录项目 标识符 定义 名称空间中对象的唯一标识符。 核心元数据 * 由有关标准化机构给定的用于唯一识别某一标准的注册号或登 1 标准号 记号,标准号由标准代号、顺序号、发布年份及有关标识符组 * 成。 2 标准名称 标准的中文名称。 * 3 标准对象 描述一个实体的标准化活动的作用对象。 * 4 指标对象 描述一个实体的质量特征的作用对象。 * 5 指标对象属性名称 6 指标对象属性值 描述指标对象属性的内容。 7 指标对象属性类型 描述指标对象的类别。 8 指标影响因素名称 9 指标影响因素值 描述指标对象的特性、特征的名称。如:形状、颜色、气味、 优劣、用途等都是指标对象的性质。 对指标数据产生有一定约束关系的因素名称。如:环境因素、 测试方法、工具、工艺、作用对象等。 指标影响因素的具体内容描述。 * * * * 3 DB13/T 2351.3—2016 表 2(续) 序号 著录项目 定义 核心元数据 10 指标影响因素类型 描述指标影响因素的类别。 11 指标名称 描述实体质量特征属性的技术要求名称。 * 12 指标内容 某项技术要求的具体内容描述。 * 13 计量单位 技术要求的量值单位。 14 指标注 指标的注释。 15 表注 标准内容中表格的注释。 16 试验方法 验证指标的试验方法的一组信息。 17 指标组 ID 一组指标数据的唯一识别符。 18 篇章条编号 19 表号 20 表名 描述表格主题的名称。 21 更新时间 描述指标数据修改更新的时间。 22 记录状态 23 版本 描述指标数据更新的版本编号。 24 加工单位 描述指标数据加工单位的信息。 25 指标状态 26 是否强制 描述指标所在篇章条是否为强制性条款。 27 指标类型 指标的分类编码(体系) 。 28 指标性质 描述指标内容的类型是定性亦或定量。 * * 标准内容中篇章条按一定

pdf文档 DB13-T 2351.3-2016 标准文献结构化数据规范 第3部分:元数据著录规则 河北省

文档预览
中文文档 31 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共31页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
DB13-T 2351.3-2016 标准文献结构化数据规范 第3部分:元数据著录规则 河北省 第 1 页 DB13-T 2351.3-2016 标准文献结构化数据规范 第3部分:元数据著录规则 河北省 第 2 页 DB13-T 2351.3-2016 标准文献结构化数据规范 第3部分:元数据著录规则 河北省 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2022-10-24 17:32:26上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。