全网唯一标准王
ICS 35.240.01 CCS L 70 12 天津市 地方标准 DB12/T 1449—2025 电子公文数据智能化管理规范 Intelligent management specification for electronic official document data 2025 - 06 - 04发布 2025 - 07 - 05实施 天津市市场监督管理委 员会 发布 DB12/T 1449 —2025 1 前言 本文件按照 GB/T 1.1 —2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定 起草。 本文件由天津市人民政府办公厅提出并归口。 本文件起草单位:天津市人民政府办公厅。 本文件主要起草人:曹迎黎、贾文博、高丽慧、李磊、刘洋、王琪、张文婷。 DB12/T 1449 —2025 2 电子公文数据智能化管理规范 1 范围 本文件规定了电子公文数据智能化管理的基本功能规范,包括资源管理要求、应用管理要求、安全 要求等。 本文件适用于机关、企事业单位、社会团体对于电子公文资源管理的规划、设计、开发、部署和应 用,建设单位可依据本规范对开发商提出建设要求。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。 其中, 注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本 文件。 GB/T 33190 电子文件存储与交换格式 版式文档 GB/T 41867 信息技术 人工智能 术语 3 术语和定义 GB/T 41867 界定的以及 下列术语和定义适用于本文件。 3.1 电子公文 electronic official document 以数字形式存储于磁盘、光盘等媒体,依赖计算机系统阅读、处理并可在通信网络上传输的公文。 3.2 版式 fixed layout 将文字、图形、图像等多种数字内容对象按照一定规则进行版面固化呈现的一种格式。 3.3 人工智能 artificial intelligence ;AI 人工智能系统相关机制和应用的研究和开发。 4 缩略语 下列缩略语适用于本文件。 OFD:开放版式文档 (Open Fixed layout Document) AI:人工智能( Artificial Intelligence ) OCR:光学字符识别( Optical Character Recognition ) NLP:自然语言处理( Natural Language Processing ) 5 技术架构 标准技术框架 5.1 DB12/T 1449 —2025 3 电子公文数据智能化管理规范基础资源依托于国产化软硬件,核心分为资源管理、应用服务和安全 要求,并且可以通过接口方式为各类业务系统提供文件搜索、智能写作、智能问答、智能对比、智能纠 错等方面赋能。详见图 1标准技术框架图。 用户 使用 数据 应用 数据 管理 数据 采集 基础资源检索服务 目录服务 标签服务推送服务 校对服务 …… 数据接入数据采集 离线上传 OCR 国产操作系统 国产存储资源 国产网络资源 国产安全设备数据 存储非结构化数据 结构化数据基础信息库 目录信息库 元数据库 共享资源库 业务过程库 模板库 基础样本库......API接口 WEB端 客户端终端用户 业务系统调用 安全 体系标准 规范 范文管理 元数据管理 标签管理 模板管理 敏感词管理 素材管理 归档 规范 元数 据规 范标识 规范 …安全 存储 安全 传输 安全 外发安全 阅读 …目录管理格式 规范支撑 体系 大语 言模 型 自然 语言 处理 知识 图谱 版式 处理 …标准化处理 标准格式转换 公文元数据提取 公文合规性检测 智能文字识别 …… …… 国产计算资源定时同步 实时同步电子文件采集 纸质件采集 第三方数据接入 数据质量检测 …… ……协同办公系统 (OA) …… 智能搜索 多维度检索 以文搜文 ……智能阅读 智能阅读 关联阅读 公文借阅 ……智能写作 模板引用 范文样例引用 智能成文智能校对 素材引用 ……其他智能应用 智能查重 智能问答 智能对比 ……领导 办公人员 社会公众 版式软件 流式软件 图1 标准技术框架图 标准功能结构 5.2 电子公文数据智能化管理规范功能结构主要分为资源 管理要求、应用管理要求和安全要求,详见图 2标准功能结构图。 图2 标准功能结构图 电子公文数据智能化管理 资源管理要求 数据采集 数据存储 数据管理 应用管理要求 智能搜索 智能查重 智能问答 智能阅读 智能写作 智能对比 终端联动 安全要求 存储安全 文档使用安全 文档传输安全 系统安全 DB12/T 1449 —2025 4 6 资源管理要求 数据采集 6.1 6.1.1 电子文件采集 6.1.1.1 电子文件采集通过实时传输、定时同步两种方式获取业务系统增量数据,离线上传采用手动 上传方式获取历史数据与个人终端数据。 6.1.1.2 电子文件数据采集过程中检测电子文件格式是否满足 GB/T 33190 格式要求,对不符合格式要 求的电子文件统一格式转换。 6.1.1.3 应包含表 1中列出的功能。 表1 电子文件采集功能 序号 功能指标 功能要求 约束 1 文档上传 采用手动上传方式,选择目标文件(单个文件 /含有目录结构的文 件夹)上 传 必选 2 自动采集 非可视化界面操作,通过系统配置,对接第三方系统,进行实时 同步或定时采集数据 必选 3 文档列表 通过页签筛选不同入库状态,并可根据各个文档详细处理状态进 行相应操作 必选 4 格式转换 对非OFD格式的文件进行格式转化,包括 pdf、doc、docx、wps、 jpg、jpeg、png、bmp、tif、tiff、xls、xlsx等 必选 6.1.2 纸质件采集 6.1.2.1 纸质件采集,纸质件扫描为图片后利用 OCR技术完成文字识别,采用标准化处理技术获取文 件中元数据、关键词、标签等信息。 6.1.2.2 纸质件材料在数字化 过程中,应根据 GB/T 33190 格式要求统一格式转换。 6.1.2.3 应包含表 2中列出的功能。 表2 纸质件采集功能 序号 功能指标 功能要求 约束 1 OCR 自动识别文件格式( JPG/JPEG/PNG/BMP/ 单层OFD/单层PDF),并 调用智能文字识别引擎进行文字识别,保存为三层 OFD文件进行 入库 必选 2 标准化处理 扫描后的纸质件标准化处理,并自动获取文件关键词及元数据等 信息 必选 3 格式转换 扫描后图片格式文件统一转换为 OFD版式格式 必选 6.1.3 第三方数据接入 6.1.3.1 第三方数据采用线下数据包导入方式,利用标准化处 理技术提取元数据、关键词、标签等信 息,并按照 GB/T 33190 格式要求统一格式转换。 6.1.3.2 应包含表 3中列出的功能。 DB12/T 1449 —2025 5 表3 第三方数据接入功能 序号 功能指标 功能要求 约束 1 文档上传 手动上传方式, 选择目标文件 (单个文件 /含有目录结构的文件夹) 上传 必选 2 标准化处理 自动获取文件关键词及元数据等信息, 并转换识别为双层 OFD格式 必选 6.1.4 数据质量检测 6.1.4.1 对采集的电子文件进行质量检测,预先排查并提供检测报告。检测包括: 1)合规性检测:检 测电子公文是否为 OFD格式,是否为合规的 OFD文件;2)真实性检测:检测 签名、签章是否完整,是 否有效; 3)完整性检测:检测核心元数据是否完整,元数据是否具有连续编号; 4)可用性检测:元数 据是否可以正常访问,内容是否可正常打开。 6.1.4.2 应包含表 4中列出的功能。 表4 数据质量检测功能 序号 功能指标 功能要求 约束 1 质量检测 对采集的电子文件进行检测,检测通过后方可入库 必选 2 人工处理 针对检测异常的电子文件,进行人工处理,如添加元数据、标签 等 必选 数据存储 6.2 6.2.1 结构化数据存储 6.2.1.1 自动提取电子文件的元数据、标签、关键词等信息,针对内容分词、分段、分句,以多维结 构化方式进行结构化存储 。 6.2.1.2 应包含表 5中列出的功能。 表5 结构化数据存储功能 序号 功能指标 功能要求 约束 1 结构化数据存储 非可视化界面操作,由研发通过代码配置 必选 6.2.2 非结构数据存储 6.2.2.1 通过数据采集的电子文件以及扫描件格式文件,采用标准化处理后以 OFD格式进行存储。 6.2.2.2 应包含表 6中列出的功能。 表6 非结构化数据存储功能 序号 功能指标 功能要求 约束 1 非结构化数据存储 非可视化界面操作,文件上传后会根据设置规则分级分类存储 必选 6.2.3 分库存储 6.2.3.1 分库存储,一个原文库 +N

.pdf文档 DB12-T 1449-2025 电子公文数据智能化管理规范 天津市

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
DB12-T 1449-2025 电子公文数据智能化管理规范 天津市 第 1 页 DB12-T 1449-2025 电子公文数据智能化管理规范 天津市 第 2 页 DB12-T 1449-2025 电子公文数据智能化管理规范 天津市 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2025-07-25 23:13:50上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。