全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211120291.9 (22)申请日 2022.09.15 (71)申请人 中国平安财产保险股份有限公司 地址 518000 广东省深圳市福田区益田路 5033号平安金融中心12、 13、 38、 39、 40 层 (72)发明人 陈泓钧  (74)专利代理 机构 深圳国新 南方知识产权代理 有限公司 4 4374 专利代理师 康雅文 (51)Int.Cl. G06F 21/62(2013.01) G06K 9/62(2022.01) (54)发明名称 针对非结构化数据 的染色方法、 系统、 设备 及存储介质 (57)摘要 本发明提出一种针对非结构化数据的染色 方法、 系统、 设备及存储介质, 该方法包括: 根据 非结构化的目标文档的属性信息, 对目标文档进 行分类, 获取目标文档的实际类别; 根据目标文 档的实际类别, 确定是否需要对目标文档进行处 理, 若需要, 则根据目标文档的实际类别, 获取对 目标文档对应的目标策略; 根据目标文档的格 式, 获取目标文档在目标结构化数据中对应的染 色位置, 目标结构化数据为所述目标文档对应的 结构化数据; 根据目标文档的目标策略, 对目标 结构化数据中染色位置处的数据进行修改, 得到 染色后的目标文件。 本发明对比较重要的文档进 行标记, 便于文档泄露后追责, 可 以对泄露者起 到警示作用, 有效降低数据泄 露的概率。 权利要求书2页 说明书10页 附图2页 CN 115438380 A 2022.12.06 CN 115438380 A 1.一种针对非结构化数据的染色方法, 其特 征在于, 包括: 根据非结构化的目标文档的属性信息, 对所述目标文档进行分类, 获取所述目标文档 的实际类别; 根据所述目标文档的实际类别, 确定是否 需要对所述目标文档进行处理, 若需要, 则根 据所述目标文档的实际类别, 获取对所述目标文档对应的目标 策略; 根据所述目标文档的格式, 获取所述目标文档在目标结构化数据中对应的染色位置, 所述目标 结构化数据为所述目标文档对应的结构化数据; 根据所述目标文档的目标策略, 对所述目标结构化数据中所述染色位置处 的数据进行 修改, 得到染色后的目标文件。 2.根据权利要求1所述的针对非结构化数据的染色方法, 其特征在于, 所述属性信 息包 括所述目标文档对应的部门、 所述目标文档对应的相关项目、 所述目标文档对应的内容、 所 述目标文档对应的员工等级, 所述根据所述 目标文档的属 性信息, 对所述 目标文档进行分 类, 包括: 根据所述目标文档对应的部门、 所述目标文档对应的相关项目、 所述目标文档对应的 内容、 所述目标文档对应的员工等级, 参照预设分类规则, 将所述目标文档划分为核心文 件、 重要文件、 普通文件和垃圾文件中的一种。 3.根据权利要求2所述的针对非结构化数据的染色方法, 其特征在于, 所述根据 所述目 标文档的实际类别, 确定是否需要对所述目标文档进行处 理, 包括: 若所述目标文档的实 际类别为所述垃圾文件, 则不需要对所述目标文档进行处理, 否 则, 需要对所述目标文档进行处 理。 4.根据权利要求2所述的针对非结构化数据的染色方法, 其特 征在于, 还 包括: 若所述目标文档为所述重要文档或所述核心文档, 则对染色后的目标文档进行加密处 理。 5.根据权利要求4所述的针对非结构化数据的染色方法, 其特征在于, 所述若所述目标 文档为所述重要 文档或所述核心文档, 则对染色后的目标文档进行加密处 理, 包括: 根据染色后的目标文档对应的摘要信息、 文档 信息和染色内容, 计算加密秘钥。 6.根据权利要求1所述的针对非结构化数据的染色方法, 其特征在于, 所述目标策略包 括头部标记和染色内容, 所述根据所述 目标文档的实际类别, 获取对所述 目标文档对应的 目标策略, 包括: 根据所述目标文档对应的实际类别, 获取与所述实际类别对应的目标头 部标记; 根据所述目标文档对应的经手员工, 获取与所述格式对应的目标染色内容; 根据所述目标头 部标记和所述目标染色内容, 获取 所述目标 策略。 7.根据权利要求6所述的针对非结构化数据的染色方法, 其特征在于, 所述根据 所述目 标文档的目标策略, 对所述 目标结构化数据中所述染色位置处的数据进行修改, 得到染色 后的目标文件, 包括: 利用所述目标策略, 替换所述目标结构化数据中所述染色位置处的数据, 得到染色后 的目标文件。 8.一种针对非结构化数据的染色系统, 其特 征在于, 包括: 分类模块, 用于根据非结构化的目标文档的属性信息, 对所述目标文档进行分类, 获取权 利 要 求 书 1/2 页 2 CN 115438380 A 2所述目标文档的实际类别; 判断模块, 用于根据所述目标文档的实 际类别, 确定是否需要对所述目标文档进行处 理, 若需要, 则根据所述目标文档的实际类别, 获取对所述目标文档对应的目标 策略; 位置模块, 用于根据所述目标文档的格式, 获取所述目标文档在目标结构化数据中对 应的染色位置, 所述目标 结构化数据为所述目标文档对应的结构化数据; 染色模块, 用于根据所述目标文档的目标策略, 对所述目标结构化数据中所述染色位 置处的数据进行修改, 得到染色后的目标文件。 9.一种计算机设备, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器 上运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求 1至 7中任一项所述针对非结构化数据的染色方法的步骤。 10.一种计算机存储介质, 所述计算机存储介质存储有计算机程序, 其特征在于, 所述 计算机程序被处理器执行时实现如权利要求1至7中任一项所述针对非结构化数据的染色 方法的步骤。权 利 要 求 书 2/2 页 3 CN 115438380 A 3

PDF文档 专利 针对非结构化数据的染色方法、系统、设备及存储介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 针对非结构化数据的染色方法、系统、设备及存储介质 第 1 页 专利 针对非结构化数据的染色方法、系统、设备及存储介质 第 2 页 专利 针对非结构化数据的染色方法、系统、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:34:18上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。