全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210429481.2 (22)申请日 2022.04.22 (71)申请人 绿盟科技 集团股份有限公司 地址 100089 北京市海淀区北洼路4 号益泰 大厦5层 申请人 北京神州绿盟科技有限公司   神州绿盟成 都科技有限公司 (72)发明人 张正欣 牟黎明 王豪 肖春亮  张宏 何坤  (74)专利代理 机构 北京同达信恒知识产权代理 有限公司 1 1291 专利代理师 冯艳莲 (51)Int.Cl. G06F 21/62(2013.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 一种数据脱敏方法、 装置、 电子设备及存储 介质 (57)摘要 本发明公开了一种数据脱敏方法、 装置、 电 子设备及存储介质, 预先训练完成有数据脱 敏对 抗网络模型, 数据脱 敏对抗网络模 型包括生成模 型和判别模 型, 所述生成模型和判别模型是通过 对抗学习进行训练得到。 基于数据脱敏对抗网络 模型得到的脱敏后的数据安全性好。 并且在生成 脱敏后的数据时获取待处理的原始数据, 对原始 数据进行分类标记, 并根据分类标记 生成条件向 量。 生成随机分布向量后, 将随机分布向量和条 件向量输入 数据脱敏对抗网络模 型, 基于数据脱 敏对抗网络模 型中的生成模型, 输出原始数据对 应的脱敏后的数据。 加入条件向量优化脱敏后的 数据, 脱敏后的数据包括数值信息和类别信息。 因此脱敏后的数据可用性 好。 权利要求书2页 说明书15页 附图5页 CN 114912142 A 2022.08.16 CN 114912142 A 1.一种数据脱敏 方法, 其特 征在于, 所述方法包括: 获取待处理的原始数据, 对所述原始数据进行分类标记, 并根据所述分类标记生成条 件向量; 生成随机分布向量, 将所述随机分布向量和所述条件向量输入预先训练 的数据脱敏对 抗网络模 型, 其中, 所述数据脱敏对抗网络模型包括生成模型和判别模型, 所述生成模型和 判别模型 是通过对抗学习进行训练; 基于所述数据脱敏对抗网络模型中的生成模型, 输出所述原始数据对应的脱敏后的数 据, 其中所述脱敏后的数据包括数值信息和类别 信息。 2.如权利要求1所述的方法, 其特征在于, 所述生成模型和判别模型通过对抗学习 进行 训练的过程包括: 针对训练集中的样本数据, 对所述样本数据进行分类标记, 并根据所述分类标记生成 样本条件向量; 生成样本随机分布向量, 将所述样本随机分布向量和所述样本条件向量输入数据脱敏 对抗网络模型中的生成模型中, 所述 生成模型输出样本脱敏 数据; 将所述样本脱敏数据和所述样本条件向量输入数据脱敏对抗网络模型中的判别模型 中, 所述判别模型输出 所述样本脱敏 数据为真样本的第一 概率; 将所述样本数据和所述样本条件向量输入所述判别模型中, 所述判别模型输出所述样 本数据为真样本的第二 概率; 根据所述第一 概率和第二 概率, 训练所述 生成模型和判别模型。 3.如权利要求2所述的方法, 其特征在于, 所述根据所述第一概率和第二概率, 训练所 述生成模型和判别模型包括: 采用WGAN方法, 计算所述第一概率和第二概率之间的Wasserstein距离, 根据所述 Wasserstein距离, 训练所述 生成模型和判别模型。 4.如权利要求2所述的方法, 其特 征在于, 所述判别模型的训练过程包括: 采用差分隐私算法, 在参数更新之前对确定的梯度进行裁剪, 并添加随机噪声; 根据裁 剪并添加随机噪声后的梯度进行参数 更新。 5.如权利要求 4所述的方法, 其特 征在于, 确定所述梯度的过程包括: 分别确定生成对抗网络和条件生成对抗网络的联合损失函数、 包括期望和方差的统计 信息损失函数和合页损失函数, 根据所述联合损失函数、 统计信息损失函数和合页损失函 数确定目标损失函数和对应的梯度。 6.如权利要求1所述的方法, 其特征在于, 所述生成模型的结构由输入侧至输出侧 依次 包括: 全连接层、 Relu层、 残差网络层、 全连接层、 Relu层、 残差网络层、 全连接层和Softmax 层。 7.如权利要求1所述的方法, 其特征在于, 所述判别模型的结构由输入侧至输出侧 依次 包括: 全连接层、 LeakyRelu层、 全连接层、 LeakyRelu层和全连接层。 8.一种数据脱敏装置, 其特 征在于, 所述装置包括: 获取模块, 用于获取待处理的原始数据, 对所述原始数据进行分类标记, 并根据 所述分 类标记生成条件向量; 输入模块, 用于生成随机分布向量, 将所述随机分布向量和所述条件向量输入预先训权 利 要 求 书 1/2 页 2 CN 114912142 A 2练的数据脱 敏对抗网络模型, 其中, 所述数据脱敏对抗网络模 型包括生成模型和判别模型, 所述生成模型和判别模型 是通过对抗学习进行训练; 输出模块, 用于基于所述数据脱敏对抗网络模型中的生成模型, 输出所述原始数据对 应的脱敏后的数据, 其中所述脱敏后的数据包括数值信息和类别 信息。 9.一种电子设备, 其特征在于, 包括处理器、 通信接口、 存储器和通信总线, 其中, 处理 器, 通信接口, 存 储器通过通信总线完成相互间的通信; 存储器, 用于存放计算机程序; 处理器, 用于执行存储器上所存放的程序时, 实现权利要求1 ‑7任一项所述的方法步 骤。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质内存储有计算机 程序, 所述计算机程序被处 理器执行时实现权利要求1 ‑7任一项所述的方法步骤。权 利 要 求 书 2/2 页 3 CN 114912142 A 3

PDF文档 专利 一种数据脱敏方法、装置、电子设备及存储介质

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种数据脱敏方法、装置、电子设备及存储介质 第 1 页 专利 一种数据脱敏方法、装置、电子设备及存储介质 第 2 页 专利 一种数据脱敏方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-07 12:39:31上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。