全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210820816.3 (22)申请日 2022.07.12 (71)申请人 阿里云计算有限公司 地址 310000 浙江省杭州市西湖区转塘科 技经济区块12号 (72)发明人 宋海宾  (74)专利代理 机构 北京思格 颂知识产权代理有 限公司 1 1635 专利代理师 杨超 (51)Int.Cl. G06F 21/62(2013.01) (54)发明名称 一种数据脱敏 方法、 装置和系统 (57)摘要 本发明公开了一种数据脱 敏方法、 装置和系 统。 所述方法包括: 根据获取的源数据表结构信 息和配置的数据脱敏策略, 确定需脱敏处理的字 段对应的源数据报文中的源码字段和脱敏处理 方式, 生成包括需脱 敏的源码 字段和对应的脱 敏 处理方式的快速脱敏列表; 从源 数据库中获取源 数据, 根据源数据的数据库协议格式、 所述快速 脱敏列表中包括的需脱敏的源码字段和对应的 脱敏处理方式, 对源数据中需脱敏处理的源码字 段按所述对应的脱敏处理方式进行脱敏处理。 对 于大批量数据的脱敏处理, 无需进行SQL解析, 减 少了数据解析的过程, 减少了脱敏处理过程中的 数据处理量和数据处理时间, 大大提高了系统性 能。 权利要求书2页 说明书13页 附图3页 CN 115391813 A 2022.11.25 CN 115391813 A 1.一种数据脱敏 方法, 其特 征在于, 包括: 根据获取的源数据表结构信 息和配置的数据脱敏策略, 确定 需脱敏处理 的字段对应的 源数据报文中的源码字段和脱敏 处理方式, 生成包括需脱敏的源码字段和对应的脱敏 处理 方式的快速脱敏列表; 从源数据库中获取源数据, 根据源数据的数据库协议格式、 所述快速脱敏列表中包括 的需脱敏的源码字段和对应的脱敏处理方式, 对源数据中需脱敏 处理的源码字段按所述对 应的脱敏处 理方式进行脱敏处 理。 2.如权利要求1所述的方法, 其特 征在于, 所述从源数据库中获取源数据, 包括: 与源数据库建立访 问链接, 按照预设的获取数量, 循环执行数据查询语句从源数据库 中获取源数据, 判断是否获取完所有的源数据; 若否, 返回继续执 行从源数据库中获取源数据的步骤; 若是, 结束获取 数据的流 程。 3.如权利要求1所述的方法, 其特征在于, 根据获取的源数据表结构信 息和配置的数据 脱敏策略, 确定需脱敏处理的字段对应的源数据报文中的源码字段和脱敏处理方式, 建立 包括需脱敏的源码字段和对应的脱敏处 理方式的快速脱敏列表, 包括: 从源数据库中获取源数据记录, 对获取的源数据记录进行解析, 以获取源数据表结构 信息; 或读取源数据酷中关于表结构的说明信息以获取源数据表结构信息; 将所述源数据表结构信 息与配置的脱敏策略进行匹配, 确定 需脱敏处理 的字段及对应 的脱敏处 理方式; 查找需脱敏处理 的字段在源数据报文中对应的源码字段, 建立包括需脱敏的源码字段 和对应的脱敏处 理方式的快速脱敏列表。 4.如权利要求1所述的方法, 其特征在于, 所述根据源数据的数据库协议格式、 所述快 速脱敏列 表中包括的需脱敏的源码字段和对应的脱敏 处理方式, 对源数据中需脱敏 处理的 源码字段按所述对应的脱敏处 理方式进行脱敏处 理, 包括: 根据快速脱敏列表中包括的需脱敏处理的源码字段和源数据的数据库协议格式, 在源 数据的数据报文源码包括的数据 记录中定位出需脱敏 处理的源码字段的位置, 对定位出的 源码字段按对应的脱敏处 理方式进行脱敏处 理。 5.如权利要求1 ‑4任一所述的方法, 其特 征在于, 还 包括: 根据所述源数据表结构信 息创建脱敏数据存储表, 以及根据所述源数据表结构信 息和 配置的脱敏策略, 创建将脱敏 处理后的源数据映射到的所述脱敏数据存储表的可执行的存 储过程函数。 6.如权利要求5所述的方法, 其特 征在于, 所述进行脱敏处 理之后, 还 包括: 调用所述存 储过程函数, 将脱敏处 理后的源数据存 储到脱敏 数据存储表。 7.如权利要求6所述的方法, 其特征在于, 调用所述存储过程函数, 将脱敏处理后的源 数据存储到存储表, 包括: 调用所述存储过程函数, 将脱敏处理后的源数据作为入参, 将所述源数据中包括的数 据记录的各源码字段映射到所述存 储表中相应的位置进行存 储。 8.如权利要求7所述的方法, 其特征在于, 从源数据库中获取的源数据的第 一个数据报 文中包括对源数据库协议中各字段的说明, 后续数据报文中为多条纯数据, 每条数据中包 括报文长度、 报文中行的序号和各字段的内容;权 利 要 求 书 1/2 页 2 CN 115391813 A 2作为入参的脱敏处理后的源数据包括多行数据, 每行数据之间设有指定数量的隔离字 符串, 所述隔离 字符串表示所述报文长度和所述报文中行的序号。 9.一种数据脱敏装置, 其特 征在于, 包括: 脱敏通道建立模块, 用于根据获取的源数据表结构信息和配置的数据脱敏策略, 确定 需脱敏处理的字段对应的源数据报文中的源码字段和脱敏 处理方式, 生成包括需脱敏的源 码字段和对应的脱敏处 理方式的快速脱敏列表; 脱敏处理模块, 用于从源数据库中获取源数据, 根据源数据的数据库协议格 式、 所述快 速脱敏列 表中包括的需脱敏的源码字段和对应的脱敏 处理方式, 对源数据中需脱敏 处理的 源码字段按所述对应的脱敏处 理方式进行脱敏处 理。 10.如权利要求9所述的装置, 其特 征在于, 还 包括: 存储通道建立模块, 用于根据所述源数据表结构信息创建脱敏数据存储表, 以及根据 所述源数据表结构信息和配置的脱敏策略, 创建将脱敏 处理后的源数据映射到的所述脱敏 数据存储表的可 执行的存储过程函数; 存储模块, 用于调用所述存储过程函数, 将脱敏处理后的源数据存储到脱敏数据存储 表。 11.一种数据脱敏系统, 其特征在于, 包括: 源数据库、 至少一个数据脱敏设备和脱敏数 据库; 所述数据脱敏设备中设置权利要求9 ‑10任一所述的数据脱敏装置, 用于从源数据库获 取源数据, 并将脱敏处 理后的源数据存 储到脱敏 数据库。 12.一种计算机存储介质, 其特征在于, 所述计算机存储介质中存储有计算机可执行指 令, 所述计算机可 执行指令被处 理器执行时实现权利要求1 ‑8任一所述的数据脱敏 方法。 13.一种数据脱敏设备, 其特征在于, 包括: 存储器、 处理器及存储于存储器上并可在处 理器上运行的计算机程序, 所述处理器执行所述程序时实现权利要求1 ‑8任一所述的数据 脱敏方法。权 利 要 求 书 2/2 页 3 CN 115391813 A 3

PDF文档 专利 一种数据脱敏方法、装置和系统

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种数据脱敏方法、装置和系统 第 1 页 专利 一种数据脱敏方法、装置和系统 第 2 页 专利 一种数据脱敏方法、装置和系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:34:59上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。