全网唯一标准王
ICS 10.140.20 A 14 备案号: 江 DB32 苏 省 地 方 标 准 DB32/T 3484—2018 地方志数字化处理规范 Specification for digitization of the local chronicles 2018- 11 - 9 发布 2018 - 11 - 30 实施 江苏省质量技术监督局 发 布 DB32/T 3484—2018 目  次 前  言............................................................................................................................................................. II 1 范围................................................................................................................................................................. 1 2 规范性引用文件............................................................................................................................................. 1 3 术语和定义..................................................................................................................................................... 1 4 基本流程及要求............................................................................................................................................. 2 5 原始文献资源管理......................................................................................................................................... 3 6 纸质文献扫描................................................................................................................................................. 4 7 扫描文件文本化............................................................................................................................................. 4 8 内容数据制作与挂接..................................................................................................................................... 4 9 数据管理与保存............................................................................................................................................. 6 10 编码方法....................................................................................................................................................... 7 附录 A(规范性附录) 中国图书馆图书分类及大类号............................................................................. 11 附录 B(规范性附录) 文件命名规则..........................................................................................................12 I DB32/T 3484—2018 前  言 本标准按照GB/T 1.1-2009给出的规则编制。 本标准由江苏省地方志编纂委员会办公室提出并归口。 本标准起草单位:江苏省地方志编纂委员会办公室、江苏北斗卫星应用产业研究院有限公司、江苏 省质量和标准化研究院。 本标准主要起草人:牟国义、王曙、杜咪、刘珏、许萌君。 II DB32/T 3484—2018 地方志数字化处理规范 1 范围 本标准规定了地方志数字化处理的术语和定义、基本流程及要求、原始文献资源管理、纸质文件扫 描、扫描文件文本化、内容数据制作与挂接、数据管理与保存。 本标准适用于对地方志纸质文献的数字化加工处理。 2 规范性引用文件 下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅所注日期的版本适用于本文 件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB/T 2260 中华人民共和国行政区划代码 GB/T 5271.23-2000 信息技术 词汇 第23部分:文本处理 GB/T 13000 信息技术. 通用多八位编码字符集(UCS) GB/T 13923 基础地理信息要素分类与代码 GB/T 18521 地名分类与类别代码编制规则 DA/T 31-2017 纸质档案数字化规范 3 术语和定义 GB/T 5271.23-2000界定的以及下列术语和定义适用于本文件。 3.1 地方志 local chronicles 记载一定地区(或行政区划)自然和社会各方面历史和现状的综合性著述和资料性文献,主要包括 地方志书和地方年鉴。 注 1:地方志书包括综合志书、专门志书。地方综合志书是全面系统地记述某一地域自然、政治、经济、文化、社 会和生态建设的历史与现状的资料性文献;地方专门志书是全面系统地记述某一专门领域历史与现状的资料 性文献。 注 2:地方年鉴包括综合年鉴、专门年鉴。地方综合年鉴是全面系统地记述某一地域自然、政治、经济、文化、社 会和生态建设年度现状的资料性文献;地方专门年鉴是全面系统地记述某一专门领域年度现状的资料性文献。 3.2 数字化 digitization 用计算机技术将模拟信号转换为数字信号的处理过程。 [DA/T 31-2017,定义3.1] 3.3 1 DB32/T 3484—2018 数字图片 digital image 表示实物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。 在矩阵(或其他)网络上采样——连续函数,并在采样点上将值最小化后的阵列。 [DA/T 31-2017,定义3.2] 3.4 地方志数字化 digitization of paper-based local chronicles 采用扫描仪等设备对地方志纸质文献进行数字化加工,使其转化为存储在磁带、磁盘、光盘等载 体上的数字图像、文本数据、图片数据、表格数据,并按照在纸质文献的内在联系,建立起目录数据、 内容数据、数字图像间的相互关联关系的处理过程。 3.5 准确率 precision 文本文件中正确识别的字符数与总字符数之比。 3.6 光学字符识别 optical character recognition (OCR) 电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状, 用字符识别方法将形状翻译成计算机文字的过程。 3.7 文本结构化 text structured 对文本内容进行分级分层标记,形成与地方志书目对应的结构化文本数据的过程。 4 基本流程及要求 4.1 基本流程 地方志数字化基本流程见图1,包括但不限于: a) 原始文献资源管理; b) 纸质文献图像化; c) 图像文件文本化; d) 结构化数据制作与挂接; e) 数据质量管理与保存。 2 DB32/T 3484—2018 图1 4.2 地方志数字化流程图 文本数据格式选择 应符合GB/T 13000的要求,对于纯西文字符采用ASCII码。 4.3 图片数据格式选择 4.3.1 长期保存的文件 编码格式选用TXT、XML、PDF、DOCX(DOC)格式中的一种,其中XML文件符合标准的XML语言规范, 并遵守对应的Schema。 4.3.2 复制加工级的文件 编码格式选用RTF、DOCX(DOC)格式中一种。 4.3.3 发布服务级的文件 编码格式选用格式HTML、PDF、DOCX(DOC)、TXT格式中一种。 4.4 数据编码要求 地方志书目及内容编码见第10部分编码方法 5 原始文献资源管理 5.1 扫描前处理 扫描前处理应按照DA/T 31-2017中第7部分的要求。 5.2 建立目录数据库 5.2.1 目录数据库数据规则的制定应符合《地方志著录元数据规范》的要求,地方志书目编码应符合 本标准 10.2 的要求。应按照项目需求制定目录数据库数据规则,包括数据字段长度、字段类型、字段 内容要求等。 5.2.2 数据库选择应考虑可转换为通用数据格式。 5.2.3 数据库结构的设计应保持文件的内在联系,有利于纸质文献数字化成果的管理和利用。 3 DB32/T 3484—2018 5.2.4 将扫描前处理工作中对地方志目录进行修改、补充的结果录入数据库,形成准确、完整的目录 数据。 5.2.5 可采用计算机自动校对与人工校对相结合的方式,对目录数据的质量进行检查,包括著录项目 的完整性、著录内容的规范性

pdf文档 DB32-T 3484-2018 地方志数字化处理规范 江苏省

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
DB32-T 3484-2018 地方志数字化处理规范 江苏省 第 1 页 DB32-T 3484-2018 地方志数字化处理规范 江苏省 第 2 页 DB32-T 3484-2018 地方志数字化处理规范 江苏省 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2022-10-24 04:23:23上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。