全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210593602.7 (22)申请日 2022.05.27 (71)申请人 蓝象智联 (杭州) 科技有限公司 地址 311121 浙江省杭州市余杭区仓前街 道鼎创财富中心 2幢3012室 (72)发明人 伍清华 刘登涛 毛仁歆 马煜翔  裴阳  (74)专利代理 机构 北京知果之信知识产权代理 有限公司 1 1541 专利代理师 高科 (51)Int.Cl. G06F 21/60(2013.01) G06F 21/62(2013.01) G06Q 40/02(2012.01) G06N 3/04(2006.01) (54)发明名称 全流程加密的数据价值评估方法、 系统及电 子设备 (57)摘要 本公开提供一种全流程加密的数据价值评 估方法, 包括基于秘密分享协议确定数据提供方 对应的第一隐私数据和数据使用方对应的第二 隐私数据的联邦数据集; 通过数据提供方对应的 第一密钥和数据使用方对应的第二密钥, 对 联邦 数据集进行特征分箱, 确定联邦数据集的正样本 和负样本; 根据联邦数据集的正样本和负样本, 在同时确定第一密钥和第二密钥的情况下, 确定 正样本和负样本的样本浓度; 综合正样本和负样 本的样本浓度, 第一隐私数据与第二隐私数据, 通过预先构建的数据价值评估模 型, 确定第一隐 私数据对第二隐私数据的数据价值。 本公开的方 法能够在少量样本的情况下即可完成数据价值 评估, 可以同时保证在恶意环 境下的安全性和计 算速度。 权利要求书3页 说明书11页 附图1页 CN 114861210 A 2022.08.05 CN 114861210 A 1.一种全流程加密的数据价值评估方法, 其特征在于, 所述方法用于数据提供方和数 据使用方, 包括: 基于秘密分享协议确定数据提供方对应的第一隐私数据和数据使用方对应的第二隐 私数据的联邦数据集; 通过所述数据提供方对应的第 一密钥和所述数据使用方对应的第 二密钥, 对所述联邦 数据集进行 特征分箱, 确定所述联邦数据集的正样本和负 样本; 根据所述联邦数据集的正样本和负样本, 在同时确定所述第 一密钥和所述第 二密钥的 情况下, 确定所述 正样本和所述负 样本的样本浓度; 综合所述正样本和所述负样本的样本浓度, 所述第一 隐私数据与所述第二 隐私数据, 通过预先构建的数据价值评估模型, 确定所述第一隐私数据对所述第二隐私数据的数据价 值, 其中, 所述数据价值评估模 型基于神经网络构建, 用于确定隐私数据与数据使用场景的 匹配度。 2.根据权利要求1所述的全流程加密的数据价值评估方法, 其特征在于, 所述基于秘密 分享协议确定数据提供方对应的第一隐私数据和数据使用方对应的第二隐私数据的联邦 数据集的方法包括: 所述数据提供 方利用预 先确定的第一密钥对第一隐私数据进行 数据加密; 所述数据使用方利用预 先确定的第二密钥对第二隐私数据进行 数据加密; 根据第一密钥、 第二密钥以及秘密分享乘法协议, 确定所述第一 隐私数据与所述第二 隐私数据的联邦数据集。 3.根据权利要求2所述的全流程加密的数据价值评估方法, 其特征在于, 在确定所述第 一隐私数据与所述第二隐私数据的联邦数据集之后, 所述方法还 包括: 基于所述第 一隐私数据、 所述第 二隐私数据, 以及所述联邦数据集, 确定所述第 一隐私 数据和/或所述第二隐私数据的样本覆盖度, 其中, 所述样本覆盖度用于指示所述第 一隐私数据和/或所述第 二隐私数据与所述联邦数据 集的数据关联度; 将所述样本覆盖度通过不经意传输方式传输 至所述数据提供 方和所述数据使用方。 4.根据权利要求1所述的全流程加密的数据价值评估方法, 其特征在于, 所述通过所述 数据提供方对应的第一密钥和所述数据使用方对应的第二密钥, 对所述联邦数据集进 行特 征分箱的方法包括: 通过所述数据提供方对应的第一密钥确定所述第一密钥与所述联邦数据集的样本的 第一关联度; 通过所述数据使用方对应的第二密钥确定所述第二密钥与所述联邦数据集的样本的 第二关联度; 分别按照所述第一关联度和所述第二关联度的关联紧密程度对所述联邦数据集进行 特征分箱。 5.根据权利要求1所述的全流程加密的数据价值评估方法, 其特征在于, 在确定所述正 样本和所述负 样本的样本浓度之前, 所述方法还 包括: 结合预先获取的历史数据, 针对第一 隐私数据对应的第一过滤策略, 确定第一过滤结 果;权 利 要 求 书 1/3 页 2 CN 114861210 A 2结合预先获取的历史数据, 针对第二 隐私数据对应的第二过滤策略, 确定第二过滤结 果; 基于所述第 一过滤结果和所述第 二过滤结果, 筛选所述联邦数据集不符合预设过滤条 件的样本 。 6.根据权利要求1所述的全流程加密的数据价值评估方法, 其特征在于, 通过预先构建 的数据价值评估模型, 确定所述第一隐私数据对所述第二隐私数据的数据价值的方法包 括: 通过预先构建的数据价 值评估模型, 确定所述第一隐私数据对应的第一逻辑 值; 通过预先构建的数据价 值评估模型, 确定所述第二隐私数据对应的第二逻辑 值; 基于所述正样本和所述负样本的样本浓度, 分别为所述第一逻辑值分配第一权重值, 为所述第二逻辑 值分配第二权 重值; 基于所述第 一逻辑值、 所述第 一权重值, 以及所述第 一隐私数据, 确定第 一信息价值指 标; 基于所述第 二逻辑值、 所述第 二权重值, 以及所述第 二隐私数据, 确定第 二信息价值指 标; 根据所述第 一信息价值指标和所述第 二信息价值指标的匹配度, 确定所述第 一隐私数 据对所述第二隐私数据的数据价 值, 其中, 所述数据价 值用于指示所述第一隐私数据在所述第二隐私数据适用场景的匹配度。 7.一种全流程加密的数据价值评估方法, 其特征在于, 所述方法用于所述数据提供方, 包括: 基于秘密分享协议确定数据提供方对应的第一隐私数据和数据使用方对应的第二隐 私数据的联邦数据集; 通过所述数据提供方对应的第一密钥, 对所述联邦数据集进行特征分箱, 确定所述联 邦数据集的正样本和负 样本; 根据所述联邦数据集的正样本和负样本, 接收到数据使用方提供的第二密钥的情况 下, 确定所述 正样本和所述负 样本的样本浓度; 综合所述正样本和所述负样本的样本浓度, 所述第一 隐私数据与所述第二 隐私数据, 通过预先构建的数据价值评估模型, 确定所述第一隐私数据对所述第二隐私数据的数据价 值, 其中, 所述数据价值评估模 型基于神经网络构建, 用于确定隐私数据与数据使用场景的 匹配度。 8.一种全流程加密的数据价值评估方法, 其特征在于, 所述方法用于所述数据使用方, 包括: 基于秘密分享协议确定数据提供方对应的第一隐私数据和数据使用方对应的第二隐 私数据的联邦数据集; 通过所述数据使用方对应的第二密钥, 对所述联邦数据集进行特征分箱, 确定所述联 邦数据集的正样本和负 样本; 根据所述联邦数据集的正样本和负样本, 接收到所述数据提供方提供的第 一密钥的情 况下, 确定所述 正样本和所述负 样本的样本浓度; 综合所述正样本和所述负样本的样本浓度, 所述第一 隐私数据与所述第二 隐私数据,权 利 要 求 书 2/3 页 3 CN 114861210 A 3

PDF文档 专利 全流程加密的数据价值评估方法、系统及电子设备

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 全流程加密的数据价值评估方法、系统及电子设备 第 1 页 专利 全流程加密的数据价值评估方法、系统及电子设备 第 2 页 专利 全流程加密的数据价值评估方法、系统及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-07 12:38:59上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。