全网唯一标准王
ICS35.080 L 77 SJ 备案号: 中华人民共和国电子行业标准 SJ/T11445.4—2017 信息技术服务 外包 第4部分:非结构化数据管理与服务规范 IT ServiceOutsourcing-Part4:Unstructured data management and service specification 2017-04-12发布 2017-07-01实施 发布 中华人民共和国工业和信息化部 SJ SJ/T11445.42017 目 次 前言 ..II 范围 1 2 规范性引用文件 3 术语和定义 4 数据类型. 外包服务概述, 5 AND 6 数据采集服务 7 过程管理服务 8 归档管理服务 9 数据输出服 附录A (资料 10 参考文献. .14 ..... SJ/T11445.42017 前言 《信息技术服务外包》当前分为如下5个部分: 第1部分:服务提供方通用要求;(已以GB/T337701一2017发布) 第2部分:数据(信息)保护规范: 第3部分:交付中心规范; 第4部分:非结构化数据管理与服务规范; 第5部分:发包方项目管理规范。 本部分为SJ/T11445的第4部分。 本部分按照GB/T1.1一2009给出的规则起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。 本部分由工业和信息化部信息化和软件服务业司提出。 本部分由中国电子技术标准化研究院归口。 本部分起草单位:北京立思辰科技股份有限公司、清华大学、中国电子技术标准化研究院、东软集 团股份有限公司、软通动力信息技术(集团)有限公司、大连软件行业协会、北京赛迪时代信息产业股 份有限公司、国家档案局、国家图书馆、福建福昕软件开发股份有限公司、汉王科技股份有限公司。 本部分主要起草人:李超、王明华、李卫平、邢春晓、张勇、马淑桂、龙伟、薛四新、徐永士、尹 奠桑、职亮亮、王琪、祝江、郭中林、周博、丁建英、常少英、胡镇峰、张释元、曾春、张桂刚、赵振 文、杨宁、孙鹏、尹宏、张翔宇、侯磊、许杰、吕天娥、楼永植。 II SJ/T11445.42017 信息技术服务外包第4部分:非结构化数据管理与服务规范 1范围 SJ/T11445的本部分规定了非结构化数据管理的四个阶段,规定各阶段的服务需要遵从的技术要 求。 本部分适用于: 采集、过程管理、归档管理、数据输出 RM 服务; RY 发包方选择 TION 2规范性引用文 DUST 下列文供对于本文件的用是必不可少的 是注日期的引文件,仅注日期的版本适用于本文件。 期的引用文件, 凡是不注日 新版本(包括所有的修改单)均用于本文件 GB/T20916 007 办公软件文档格式规范 中 GB/T 23286.1 2009 安献管理长期保存的电子文档文代格式 PDET 第1部分 .4(PDF/A-1)的使 用(neqvIso 19005- 1:2005) R 3术语和定义 下列术语和定 适用于本义件 3.1 数据 data 事物、概念或指令的 一种形式化的表示形式,以适合于人工或自动 化方式进行通信、解释或处理。 [GB/T5271.1-2000, 送义01.01.021 3.2 RD 非结构化数据 号unstructured data/unstructured information 相对于存储在关系型数据库里的行教据和标注过的文档,具有不规则性和模糊性,既没有预定义数 据模型的信息,又难以用结构化方式表示。 注:非结构化数据可包含文本信息,也可包含日期、数字等其他实体数据。其中,Web上的一些数据(内嵌于HTML 或XML标记中),由于具有一定的逻辑结构和物理结构,又被细分为半结构化数据。 3.3 数据采集datacollection 根据相应的业务逻辑,按照一定的格式收集非结构化数据及元数据信息,并存储在特定的信息管理 系统中。 1 SJ/T11445.42017 3.4 过程管理 processmanagement 按照相关的规范、制度或其他限制性条款,对非结构化数据及相应的管理行为进行约束。涉及安全 控制、版本控制、文档流转、发布等技术,及其他使用非结构化数据的行为。 3.5 数据输出 dataoutput 将非结构化数据按照一定的格式展示在特定的媒体上。 注:可选择纸、屏幕等作为展示媒体。 3.6 存档archive 将备用文档及其相关的日志存储一段给定的时间。 [GB/T5271.8—2001,定义08.07.08] 3.7 元数据 metadata 描述文件背景、内容、结构及其整个管理过程的数据。 [ISO15489-1:2001,定义3.12] 3.8 签入checkin 将文档或者工作目录作为新版本从用户工作空间复制回版本控制服务器。 3.9 签出 checkout 将文档或者工作目录从版本控制服务器复制到用户工作空间。 3. 10 关系数据库 relationaldatabase 建立在关系模型基础上的数据库,借助于集合代数等数学概念和方法来处理数据库中 的数据。 3.11 非关系数据库NotOnlySQL 提供不使用在关系型数据库中表格型关系的一种存储与索引机制。 4 数据类型 4.1文档 文档包括: 各种办公自动化系统产生的电子文件。办公软件产生的格式文件,主要包括Word文档、Excel a: 表单、电子邮件、演讲幻灯片等,其他的文件格式有PDF(PortableDocumentFormat,便携 文件格式)、传真等办公设备相应格式的文件等: b) 计算机辅助设计软件产生的格式化文件; c) 软件工程领域的文档; d) 电子商务及电子政务系统广泛使用的电子凭证和单据; 来源于各类业务系统统计报表。 e) 2 SJ/T11445.42017 4.2电子文件 以二进制编码的方式记录、处理、传播的信息媒体,这些媒体包括数字化的文字、图形、图像、声 音、视频影像和动画等媒体,及其编码等。 4.3Web内容 Web内容可以分为静态网页和动态网页两大类。Web内容的主体是动态网页。 5外包服务概述 外包服务的实施需清晰划分在不同非结构化数 理阶段中发包方和接包方的责任(可涉及其中的 单个阶段、也可涉及多个阶度 描述各阶段的服务要求,并对应服务 包的交接。 5.1 管理阶段划分 USTRY 据管理的阶 针对信息技术将 手结构数据的管理为四个阶段:数据采集 过程管理 归档管理、数据输 出,如图1所 不同的行业和业 不同的划分标准, 可的情参考本分 过程管理 档管理 数据 图非结构化数据管理的阶段划分 5.2服务包交 5.2.1 服务包 服务的发包方可以发送 一个或多个服务包到一个或多个接包方。 管理阶段。 5.2.2 交付内容 RD 接包方应交付以下:项或多项内容(主要指合同,合同又有很多详细内容): 与服务相关的管理非结构化数据内容的系统及相应的设计文档等: a) 与管理非结构化数据内容的系统相兼容的数据; c) 相关数据的媒体(如纸质)输出。 6 数据采集服务 6.1非数字化对象的采集服务 采集的对象包括纸质材料,也可包括实物对象,如奖牌、奖杯、锦旗等,还可包括非数字化形式的 视频、音频对象。依据分类角度不同,数据按内容分为文本、图片、视频、音频等,或者按媒体分为纸 张、胶片、磁性媒体等。 3 SJ/T11445.42017 6.1.1整理分类 采集对象应进行整理分类,分类的标准可采用档案管理领域的规定,也可根据具体的业务制定。 a) 实物档案及非数字化形式的音频、视频复制档案,宜专门分类。 b) 可依据文档类别进行分类,文档采用通用分类,分为文书档案、科学技术档案、专门档案三大 类别;每个大类下的具体分类,宜参照《中国档案分类法》执行,其中文书档案,可采用年度 分类法、组织机构分类法、主题分类法。 注:[3】《中国档案分类法》编委会档案出版社1997-12-1 可依据保管时间进行分类,将非结构化数据档案分为永久、定期(30年、10年)。 d) 服务还可涉及被采集对象的保管服务等方面,如保管库房的建设、管理软件的定购、代管服务 等。 6.1.2采集 6.1.2.1纸质对象 采集纸质对象,可使用扫描仪。 a) 大规模采集时,宜采用扫描速度大于或等于60PPM/120IPM的扫描仪。 b) 应保护被采集纸质对象。特殊被采集纸质对象,如古籍善本,宜采用非接触式扫描仪或者拍摄 仪。 6.1.2.2实物对象 实物对象包括奖状、奖杯等纪念品,也包括实物档案。 应保护被采集实物对象; 采集实物对象可采用拍摄仪; c) 采集可生成电子图片、三维影像等,也可生成全息影像。 6.1.2.3 非数字化音视频对象 非数字化的音视频对象包括老唱片、磁带录音、照片、录像带等。 a) 采集非数字化的音视频对象,应采用转换设备转换生成数字化副本: b) 应保护被采集非数字化音视频对象。 6.1.2.4采集质量 采集操作应符合以下要求: 采用黑白二值、灰度、彩色几种模式对实物对象进行扫描时,其分辨率宜选择大于或等于 200dpi,色彩深度不低于24位,扫描区域不小于A4幅面; 需要进行OCR汉字识别的实物对象,扫描分辨率宜选择大于或等于300dpi; 扫描的质量要求为不失真,扫描后的图像,应检查图像偏斜度、清晰度、失真度等,倾斜度宜 在5°以内; d) 扫描结果以有效试读为准,压缩后每张图片的大小宜在适宜范围以内: 转换非数字化音视频对象,应保持原始质量,尽量去除噪声。影像资料转换后应不失帧,采集 精度根据用户需求确定。 6.1.3数据质检 采集得到的数据,应进行审核校对以保证质量。 4

.pdf文档 SJ-T 11445.4-2017 信息技术服务 外包 第4部分 非结构化数据管理与服务规范

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
SJ-T 11445.4-2017 信息技术服务 外包 第4部分 非结构化数据管理与服务规范 第 1 页 SJ-T 11445.4-2017 信息技术服务 外包 第4部分 非结构化数据管理与服务规范 第 2 页 SJ-T 11445.4-2017 信息技术服务 外包 第4部分 非结构化数据管理与服务规范 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2025-08-16 16:12:07上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。