全网唯一标准王
书 书 书犐犆犛 01 . 140 犃 14 中华人民共和国文化行业标准 犠犎 / 犜 90 — 2020 汉文古籍文字认同描述规范 犝狀犻狋狔犱犲狊犮狉犻狆狋犻狅狀犳狅狉犆犺犻狀犲狊犲犮犺犪狉犪犮狋犲狉犻犱犲狀狋犻犳犻犮犪狋犻狅狀 2020  09  01 发布 2021  01  01 实施 中华人民共和国文化和旅游部 发布书 书 书目    次 前言 Ⅲ ………………………………………………………………………………………………………… 1   范围 1 ……………………………………………………………………………………………………… 2   术语和定义 1 ……………………………………………………………………………………………… 3   文字认同描述的基本原则 2 ……………………………………………………………………………… 4   文字认同描述数据 2 ……………………………………………………………………………………… 参考文献 6 ……………………………………………………………………………………………………… Ⅰ 犠犎 / 犜 90 — 2020前    言    本标准按照 GB / T1.1 — 2009 给出的规则起草 。 请注意本文件的某些内容可能涉及专利 。 本文件的发布机构不承担识别这些专利的责任 。 本标准由中华人民共和国文化和旅游部提出 。 本标准由全国图书馆标准化技术委员会 ( SAC / TC389 ) 归口 。 本标准起草单位 : 国家图书馆 、 天津图书馆 、 汉王科技股份有限公司 。 本标准主要起草人 : 王昭 、 陈红彦 、 谢冬荣 、 萨仁高娃 、 李国庆 、 潘慧敏 、 肖禹 、 张毅 、 白帆 、 杜立功 、 赵依澍 、 江世盛 、 孟晓静 、 王战波 。 Ⅲ 犠犎 / 犜 90 — 2020汉文古籍文字认同描述规范 1   范围 本标准规定了汉文古籍文字认同描述的元数据 、 文字认同规则描述以及文字认同实例描述的内容 、 结构及各要素的描述规则 。 本标准适用于图书馆及相关机构开展汉文古籍数字化工作中对文字认同过程和结果进行描述 。 民国时期文献的文字认同可参考执行 。 2   术语和定义 下列术语和定义适用于本文件 。 2 . 1 古籍   犪狀犮犻犲狀狋犆犺犻狀犲狊犲犫狅狅犽狊 主要指 1911 年以前 ( 含 1911 年 ) 在中国书写或印刷的书籍 。 [ GB / T3792.7 — 2008 , 定义 3.1 ] 2 . 2 汉字   犆犺犻狀犲狊犲犮犺犪狉犪犮狋犲狉 记录汉语的书写符号系统 。 汉字也被其他一些国家或民族用作为书写符号 。 [ GB / T12200.1 — 90 , 定义 4.1.3.6 ] 2 . 3 字体   犮犺犪狉犪犮狋犲狉狊狋狔犾犲 同一 汉字 ( 2 . 2 ) 由于各种原因 ( 历史演变 、 书写 、 印刷等 ) 而形成的各种不同体式 。 例 : 印刷体 ( 宋体 、 仿宋体 、 黑体 、 楷体等 )、 手写体 、 古体 、 繁体 、 简体 、 正体 、 异体 、 俗体 、 讹体等 。 [ GB / T12200.2 — 94 , 定义 4.1.2.2 ] 2 . 4 文字   狊犮狉犻狆狋 人类记录和传达语言的书写符号系统 。 [ GB / T12200.1 — 90 , 定义 4.1.2.7 ] 2 . 5 字音   犮犺犪狉犪犮狋犲狉狆狉狅狀狌狀犮犻犪狋犻狅狀 字的读音 。 汉字 ( 2 . 2 ) 中有的一字一音 , 有的一字多音 。 [ GB / T12200.2 — 94 , 定义 4.1.2.31 ] 2 . 6 语义   狊犲犿犪狀狋犻犮狊 词或词组与它们的含义之间的关系 。 [ GB / T12200.1 — 90 , 定义 4.1.2.12 ] 2 . 7 文字认同   犆犺犻狀犲狊犲犮犺犪狉犪犮狋犲狉犻犱犲狀狋犻犳犻犮犪狋犻狅狀 同一文字的不同字体转换为同一字体的过程 。 1 犠犎 / 犜 90 — 20203   文字认同描述的基本原则 3 . 1   客观性原则 文字认同描述应符合文字的客观属性 。 3 . 2   一致性原则 指定范围内 ( 如同一项目等 ) 文字认同描述方式应一致 。 3 . 3   适用性原则 应根据项目实际需要 , 选取必要的 、 实用的要素进行文字认同描述 。 3 . 4   灵活性原则 可依据需求选取本标准中部分内容进行文字认同描述 。 3 . 5   可扩展性原则 文字认同描述可依据需求进行扩展 。 4   文字认同描述数据 4 . 1   概述 文字认同描述数据用于汉文古籍数字化中文字认同的描述 , 由文字认同描述元数据 、 文字认同规则 描述数据 ( 包括文字认同规则数据和文字认同规则适用范围描述数据 ) 和文字认同实例描述数据 3 部分 组成 。 4 . 2   文字认同描述元数据 4 . 2 . 1   文字认同描述元数据概述 文字认同描述元数据是定义和描述汉文古籍数字化中文字认同描述数据的数据 , 是对文字认同描 述的总体性说明 。 4 . 2 . 2   文字认同描述元数据元素 文字认同描述元数据元素包括 : 文字认同描述说明 、 文字认同描述范围 、 文字字符集 、 文字描述方 式 、 文字位置描述 、 文字认同依据 、 文字认同规则说明 、 文字认同描述数据说明 。 可根据需要扩展元素 。 文字认同描述数据元数据的元素组成及其定义见表 1 。 2 犠犎 / 犜 90 — 2020表 1   文字认同描述元数据元素描述 元素名 英文对应词 定义 注释 文字认同描述说明 Descriptionof identification 说明古籍数字化过程中文 字认同描述情况说明文字认同描述的目的 、 处理等情 况 , 可用于数据交换与共享 文字认同描述范围 Rangeof identification 说明文字认同描述适用的 范围在指定范围内文字认同描述方式相同 , 如项目 、 册 、 卷 、 叶等 文字字符集 Characterset 定义文字的字符集范围自行确定字符集的范围 , 如 Unicode 字 符基础集 、 通用规范汉字表等 文字描述方式 Character description 说明认同前和认同后文字 的描述方式通过文字描述可以识别 、 检索或匹配文 字 , 如 Unicode 编码 、 集外字使用 IDS 描 述等 文字位置描述 Locationdescription 说明文字在文献中位置的 描述方式通过该描述可以定位到文字 , 自行确定 描述方式 , 如项目_书号_册_叶_行_列 、 项目_书号_册_叶_坐标等 文字认同依据 Basisof identification 说明文字认同依据的规范 或工具书可自行确定 , 但规则间不能相互冲突 文字认同规则说明 Identificationrules 文字认同规则相关的说明文字认同规则的总体性说明 , 可用于文 字认同数据交换与共享 文字认同描述数据说明 Identificationdata 文字认同描述数据相关的 说明文字认同描述数据中结构 、 内容等相关 说明 4 . 3   文字认同规则描述数据 4 . 3 . 1   文字认同规则描述数据概述 文字认同规则描述数据是文字认同描述数据的组成部分 , 是对汉文古籍数字化中文字认同规则及适用范围的描述 , 由文字认同规则数据和文字认同规则适用范围描述数据两部分组成 , 可依据实际需求进行扩展 。 4 . 3 . 2   文字认同规则数据 4 . 3 . 2 . 1   文字认同规则数据概述 文字认同规则数据是对汉文古籍数字化中文字认同所依据的认同规则进行描述 , 认同规则之间不能相互冲突 。 4 . 3 . 2 . 2   文字认同规则数据字段 文字认同规则数据字段包括 : 规则 ID 、 认同前的文字 、 认同前的文字描述 、 认同后的文字 、 认同后的文字描述 、 认同条件 、 认同依据 、 操作方式 、 文字认同规则数据版本号 、 备注 。 可根据需要扩展著录内容 。 描述文字认同规则所需数据字段组成及其说明见表 2 。 3 犠犎 / 犜 90 — 2020表 2   文字认同规则数据字段描述 字段名 字段说明 注释 规则 ID 文字认同规则数据的序号 指定范围内 , 编码方式一致且唯一 认同前的文字 著录认同前的文字 超出 4.2.2 中 “ 文字字符集 ” 范围的文字 认同前的文字描述 描述认同前的文字依据 4.2.2 中 “ 文字描述方式 ” 著录 , 如存储文字的图 、 Unicode 编码 、 IDS 描述等 认同后的文字 著录认同后的文字依据 4.2.2 中 “ 文字认同依据 ” 生成的文字 , 同一文字的不同字体认同结果唯一 认同后的文字描述 描述认同后的文字 依据 4.2.2 中 “ 文字描述方式 ” 著录 , 如 Unicode 编码等 认同条件 描述文字认同成立的限定性条件自行确定著录格式 , 如无 、 字音 、 语义 、 词汇等 认同依据著录文字认同依据的规范或相关工具书名称依据 4.2.2 中 “ 文字认同依据 ” 确定 , 如通用规范汉字表 ( 2013 版 )、 汉语大字典 ( 第二版 )、 第一批异体字整理表等 操作方式 描述文字认同的处理方式 自行确定著录格式 , 如批处理 、 人工处理等 文字认同规则数据版本号著录文字认同规则数据版本号根据修改情况更新版本号 备注 其他相关说明 与文字认同规则数据有关的说明 、 备注 4 . 3 . 3

.pdf文档 WH-T 90-2020 汉文古籍文字认同描述规范

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
WH-T 90-2020 汉文古籍文字认同描述规范 第 1 页 WH-T 90-2020 汉文古籍文字认同描述规范 第 2 页 WH-T 90-2020 汉文古籍文字认同描述规范 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2025-08-04 15:12:22上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。