全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211036310.X (22)申请日 2022.08.28 (71)申请人 北方工业大 学 地址 100144 北京市石景山区晋元庄路5号 (72)发明人 王超 王硕 吴爱燕 薛晓卿  何云华 肖珂  (74)专利代理 机构 北京市广友专利事务所有限 责任公司 1 1237 专利代理师 张仲波 (51)Int.Cl. H04L 9/40(2022.01) G06F 21/62(2013.01) G06N 3/08(2006.01) (54)发明名称 一种基于分布式GA N的隐私保护数据共享方 法及系统 (57)摘要 本发明公开了一种基于分布式GAN的隐私保 护数据共享方法及系统, 涉及数据共享和隐私保 护技术领域。 包括: 中心服务器提供多个个性化 合约; 多个数据所有者中的每个数据所有者根据 自己的隐私保护需求选择一个个性化合约; 每个 数据所有者使用其私有数据集对其本地GAN模型 进行预训练; 中心服务器设计隐私保护等级选择 策略; 协助训练的数据所有者对中心服务器的中 心生成器模型进行优化, 完成隐私保护数据共 享。 本发明能够在不传输原始数据的前提下, 利 用数据所有者的本地数据集协同训练中心生成 模型实现数据共享; 在差分隐私的保障下实现模 型的训练; 为具有不同隐私偏好的数据所有者设 计不同隐私保护的合约。 权利要求书2页 说明书12页 附图2页 CN 115442099 A 2022.12.06 CN 115442099 A 1.一种基于分布式GAN的隐私保护数据共享方法, 其特征在于, 所述方法由基于分布式 GAN的隐私保护数据共享系统实现, 所述系统包括中心服 务器以及多个数据所有者; 所述方法包括: S1、 所述中心服 务器提供多个 个性化合约; S2、 所述多个数据 所有者中的每个数据 所有者从所述多个个性化合约中选择一个个性 化合约; S3、 所述每个数据 所有者利用所述数据 所有者的本地私有数据集对所述数据所有者的 本地生成对抗网络GAN模型进行 预训练, 得到预训练后的本地GAN模型; S4、 所述中心服 务器设计隐私保护等级选择 策略; S5、 所述多个数据所有者根据所述隐私保护等级选择策略、 每个数据所有者选择的个 性化合约以及预训练后的本地GA N模型, 对中心 服务器的中心 生成器模 型进行优化, 完成隐 私保护数据共享。 2.根据权利要求1所述的方法, 其特征在于, 所述S1中的多个个性化合约包括多个隐私 保护等级以及与多个隐私保护等级对应的奖励。 3.根据权利要求1所述的方法, 其特征在于, 所述S3 中的所述每个数据 所有者利用所述 数据所有者的本地私有数据集对所述数据所有者的本地生成对抗网络GAN模型进行预训 练, 得到预训练后的本地GAN模型包括: S31、 所述每 个数据所有者从所述中心服 务器获取原 始GAN模型; S32、 所述每个数据所有者利用所述数据所有者的本地私有数据集对所述原始GAN模型 进行预训练, 得到预训练后的本地GAN模型。 4.根据权利要求3所述的方法, 其特征在于, 所述本地GAN模型包括本地生成器以及本 地鉴别器; 所述S32中的得到预训练后的本地GAN模型后还 包括: 所述每个数据所有者将预训练后的本地 生成器隐藏。 5.根据权利要求1所述的方法, 其特征在于, 所述S5 中的所述多个数据 所有者根据 所述 隐私保护等级选择策略、 每个数据所有者选择的个性化合约以及预训练后的本地GA N模型, 对中心服 务器的中心生成器模型进行优化包括: S51、 所述中心服务器根据所述隐私保护等级选择策略, 确定协助本轮训练的数据 所有 者的隐私保护等级ρ; S52、 所述中心服务器根据所述隐私保护等级ρ 以及每个数据所有者选择的个性化合 约, 得到多个数据所有者中隐私保护等级为ρ 的多个数据所有者; S53、 所述中心服务器从所述隐私保护等级为ρ 的多个数据 所有者中随机选择一个数据 所有者, 作为协助训练的数据所有者; S54、 所述协助训练的数据所有者根据所述协助训练的数据所有者的预训练后的本地 GAN模型, 对中心 服务器的中心生 成器模型进行优化, 优化后转去 执行S51进行迭代训练, 直 到迭代次数达 到预设阈值停止迭代, 所述中心生成器模型训练完成。 6.根据权利要求5所述的方法, 其特征在于, 所述S51中的所述中心服务器根据所述隐 私保护等级选择 策略, 确定协助本轮训练的数据所有者的隐私保护等级ρ 包括: S511、 所述中心服务器根据中心生成器模型训练过程的迭代次数确定噪声规模的衰减权 利 要 求 书 1/2 页 2 CN 115442099 A 2函数; S512、 所述中心服 务器根据所述衰减函数确定噪声规模; S513、 所述中心服务器根据 所述噪声规模确定协助本轮训练的数据 所有者的隐私保护 等级ρ 。 7.根据权利要求5所述的方法, 其特征在于, 所述S54中的所述协助训练的数据所有者 根据所述协助训练的数据所有者的预训练后的本地GAN模型, 对中心服务器的中心生成器 模型进行优化包括: S541、 所述协助训练的数据所有者从所述中心服务器获取中心生成器模型生成的数 据; S542、 所述协助训练的数据 所有者根据所述中心生成器模型生成的数据以及协助训练 的数据所有者的私有数据集, 对预训练后的本地GAN模型中的本地 鉴别器进行 更新; S543、 所述协助训练的数据所有者 根据更新后的本地 鉴别器计算梯度; S544、 所述协助训练的数据所有者基于个性化差分隐私理论扰动所述梯度, 得到扰动 后的梯度; S545、 所述中心服务器根据 所述扰动后的梯度对中心服务器的中心生成器模型进行优 化。 8.根据权利要求7所述的方法, 其特征在于, 所述S544中的基于个性化差分隐私理论扰 动所述梯度包括: 基于高斯机制以及扰动程度对所述梯度进行扰动; 其中, 所述扰动程度由个性化合约 的隐私保护等级决定 。 9.一种基于分布式GAN的隐私保护数据共享系统, 其特征在于, 所述系统用于实现基于 分布式GAN的隐私保护数据共享方法, 所述系统包括中心服务器以及多个数据所有者, 其 中: 所述中心服 务器, 用于提供多个 个性化合约; 设计隐私保护等级选择 策略; 所述多个数据所有者, 用于从所述多个个性化合约中选择一个个性化合约; 利用所述 数据所有者的本地私有数据集对所述数据所有者的本地生成对抗网络GAN模型进行预训 练, 得到预训练后的本地GAN模型; 根据所述隐私保护等级选择策 略、 每个数据所有者选择 的个性化合约以及预训练后的本地GA N模型, 对中心 服务器的中心 生成器模型进 行优化, 完 成隐私保护数据共享。 10.根据权利要求9所述的系统, 其特 征在于, 所述多个数据所有者, 进一 步用于: S51、 所述中心服务器根据所述隐私保护等级选择策略, 确定协助本轮训练的数据 所有 者的隐私保护等级ρ; S52、 所述中心服务器根据所述隐私保护等级ρ 以及每个数据所有者选择的个性化合 约, 得到多个数据所有者中隐私保护等级为ρ 的多个数据所有者; S53、 所述中心服务器从所述隐私保护等级为ρ 的多个数据 所有者中随机选择一个数据 所有者, 作为协助训练的数据所有者; S54、 所述协助训练的数据所有者根据所述协助训练的数据所有者的预训练后的本地 GAN模型, 对中心 服务器的中心生 成器模型进行优化, 优化后转去 执行S51进行迭代训练, 直 到迭代次数达 到预设阈值停止迭代, 所述中心生成器模型训练完成。权 利 要 求 书 2/2 页 3 CN 115442099 A 3

PDF文档 专利 一种基于分布式GAN的隐私保护数据共享方法及系统

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于分布式GAN的隐私保护数据共享方法及系统 第 1 页 专利 一种基于分布式GAN的隐私保护数据共享方法及系统 第 2 页 专利 一种基于分布式GAN的隐私保护数据共享方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:27:06上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。