全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210388972.7 (22)申请日 2022.04.13 (71)申请人 武汉大学 地址 430072 湖北省武汉市武昌区珞珈山 (72)发明人 宋伟 张正 彭智勇  (74)专利代理 机构 武汉智权专利代理事务所 (特殊普通 合伙) 42225 专利代理师 罗成 (51)Int.Cl. G06Q 30/02(2012.01) G06Q 30/06(2012.01) G06F 21/62(2013.01) (54)发明名称 一种隐私数据定价方法、 装置、 设备及可读 存储介质 (57)摘要 本申请涉及一种隐私数据定价方法、 装置、 设备及可读存储介质, 涉及数据交易技术领域, 包括根据买家发布的数据对象分析函数从原始 数据库中筛选出第一原始数据集并基于与可接 受数据精度对应的噪声尺度对第一原始数据集 进行处理得到隐私数据集; 基于隐私数据集的数 据含量、 均方根误差分别计算信息熵和精度损 失, 根据信息熵和精度损失计算数据价值; 根据 隐私数据集的属性极限值、 数据对象分析函数的 敏感度和可接受数据精度计算隐私含量并基于 隐私含量计算隐私成本; 基于数据价值、 隐私成 本和数据市场系数计算数据利润; 根据数据价 值、 隐私成本和数据利润确定出隐私数据集的价 格。 本申请可实现对数据集的精确定价, 满足用 户对不同精度的定制化需求。 权利要求书2页 说明书11页 附图2页 CN 114782085 A 2022.07.22 CN 114782085 A 1.一种隐私数据定价方法, 其特 征在于, 包括以下步骤: 获取买家发布的购买请求信 息, 所述购买请求信 息包括数据对象分析函数和可接受数 据精度; 根据所述数据对象分析函数从原始数据库中筛选出第 一原始数据集, 并基于与所述可 接受数据精度对应的噪声尺度对所述第一原 始数据集进行处 理, 得到隐私数据集; 基于隐私数据集的数据含量计算所述隐私数据集的信 息熵, 并基于隐私数据集的均方 根误差计算所述隐私数据集的精度损失, 且根据所述信息熵和所述精度损失计算所述隐私 数据集的数据价 值; 根据隐私数据集的属性极限值、 所述数据对象分析函数的敏感度和所述可接受数据精 度计算所述隐私数据集的隐私含量, 并基于所述隐私含量计算所述隐私数据集的隐私成 本; 基于所述数据价 值、 所述隐私成本和数据市场系数计算所述隐私数据集的数据利 润; 根据所述数据价 值、 所述隐私成本和所述数据利 润确定出 所述隐私数据集的价格。 2.如权利要求1所述的隐私数据定价方法, 其特征在于, 在所述根据隐私数据集的属性 极限值、 所述数据对象分析函数的敏感度和所述可接受数据 精度计算所述隐私数据集的 隐 私含量的步骤之后, 还 包括: 检测买家是否拥有 背景数据集; 若买家拥有背景数据集, 则将所述背景数据集和所述 隐私数据集进行连接操作处理, 得到处理后的数据集; 根据所述处理后的数据集的属性极限值、 所述数据对象分析函数的敏感度和所述可接 受数据精度计算所述处 理后的数据集的第一隐私含量; 基于所述第 一隐私含量对所述隐私数据集的隐私含量进行更新, 得到所述隐私数据集 的新的隐私含量。 3.如权利要求2所述的隐私数据定价方法, 其特征在于, 所述 隐私数据集的隐私含量θ (Vp)的计算公式为: 式中, Vp表示隐私数据集, Δ(f)表示数据对象分析函数的敏感度, ε表示可接受数据精 度, γ表示隐私数据集的属性极限值, 其中, γ=supx∈X|X|, X表示隐私数据集Vp中的某一属 性。 4.如权利要求3所述的隐私数据定价方法, 其特征在于, 所述隐私数据集的隐私成本Pp 的计算公式为: Δθ =θ(Vp)+θ(U′) 式中, Δθ表示所述隐私数据集的新的隐私含量, θ(U ′)表示所述处理后的数据集的第 一隐私含量。 5.如权利要 求1所述的隐私数据定价方法, 其特征在于, 所述隐私数据集的信息熵 H(Vp)权 利 要 求 书 1/2 页 2 CN 114782085 A 2的计算公式为: 式中, Vp表示隐私数据 集, m表示隐私数据 集Vp中所记录的数据的条数, pi表示隐私数据 集Vp中第i条记录数据出现的概 率。 6.如权利要求4所述的隐私数据定价方法, 其特征在于, 所述 隐私数据集的精度损 失δ 的计算公式为: δ =fnormal(RMSE) 式中, fnormal表示归一化函数, RMSE表示隐私数据集的均方根误差, x ′ij表示基于噪声尺 度处理后的数据, xij表示基于噪声尺度处理前的数据, m表 示隐私数据集Vp中所记录的数据 的条数, n表示隐私数据集Vp中每一条记录数据包 含的列数。 7.如权利要求6所述的隐私数据定价方法, 其特 征在于, 所述数据价 值Pd的计算公式为: Pd=100·(1‑δ )·log2(H(Vp)+1)。 8.一种隐私数据定价装置, 其特 征在于, 包括: 数据获取单元, 其用于获取买家发布的购买请求信息, 所述购买请求信息包括数据对 象分析函数和可接受数据精度; 筛选处理单元, 其用于根据 所述数据对象分析函数从原始数据库中筛选出第 一原始数 据集, 并基于与所述可接受数据精度对应的噪声尺度对所述第一原始数据集进行处理, 得 到隐私数据集; 第一计算单元, 其用于基于隐私数据集的数据含量计算所述 隐私数据集的信息熵, 并 基于隐私数据集的均方根误差计算所述隐私数据集的精度损失, 且根据所述信息熵和所述 精度损失计算所述隐私数据集的数据价 值; 第二计算单元, 其用于根据隐私数据集的属性极限值、 所述数据对象分析函数的敏感 度和所述可接受数据 精度计算所述隐私数据集的 隐私含量, 并基于所述隐私含量计算所述 隐私数据集的隐私成本; 第三计算单元, 其用于基于所述数据价值、 所述 隐私成本和数据市场系数计算所述 隐 私数据集的数据利 润; 价格确定单元, 其用于根据所述数据价值、 所述 隐私成本和所述数据利润确定出所述 隐私数据集的价格。 9.一种隐私数据定价设备, 其特征在于, 包括: 存储器和 处理器, 所述存储器中存储有 至少一条指令, 所述至少一条指令由所述处理器加载并执行, 以实现权利要求1至7中任一 项所述的隐私数据定价方法。 10.一种计算机可读存储介质, 其特征在于: 所述计算机存储介质存储有计算机程序, 当所述计算机程序被处理器执行时, 以实现权利要求 1至7中任一项 所述的隐私数据定价方 法。权 利 要 求 书 2/2 页 3 CN 114782085 A 3

PDF文档 专利 一种隐私数据定价方法、装置、设备及可读存储介质

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种隐私数据定价方法、装置、设备及可读存储介质 第 1 页 专利 一种隐私数据定价方法、装置、设备及可读存储介质 第 2 页 专利 一种隐私数据定价方法、装置、设备及可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-07 12:39:40上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。