全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211065110.7 (22)申请日 2022.08.31 (71)申请人 北京华宜信科技有限公司 地址 101127 北京市通州区经济开发区 聚 富苑产业园区 聚和六街1号-219 申请人 华教联创 (厦门) 科技有限公司 (72)发明人 李志男 龚  孔博源 张微  王志轩 马莺  (74)专利代理 机构 北京丰浩知识产权代理事务 所(普通合伙) 11781 专利代理师 王忠泽 (51)Int.Cl. G06F 21/60(2013.01) G06F 21/62(2013.01) G06F 21/64(2013.01) (54)发明名称 一种多用户匿名提交数据方法 (57)摘要 本发明公开了一种多用户匿名提交数据方 法。 该方法包括: 对预设的多用户匿名历史数据 集进行数据挖掘处理, 得到用户隐私与特征基因 集; 根据所述用户隐私与特征基因集, 将所述多 用户匿名提交历史数据与所述用户隐私与特征 基因集相关联, 根据所述关联结果, 对所述用户 隐私与特征基因集进行处理, 得到数据特征模型 集; 根据所述数据特征模型集, 判断拟提交数据 类型; 根据拟提交数据类型, 将所述拟提交数据 进行提交。 可见, 本发明能够实现在数据提交前 首先通过判断数据隐私数据的可挖掘性, 确定数 据上传方法, 提高了数据发布效率和可用性, 降 低了用户隐私可挖掘性。 权利要求书4页 说明书11页 附图3页 CN 115374460 A 2022.11.22 CN 115374460 A 1.一种多用户匿名提交数据方法, 其特 征在于, 包括: S1、 利用数据挖掘技术, 对预设的多用户匿名历史数据集进行处理, 得到用户隐私与特 征信息集; S2、 对所述用户隐私与特 征信息集进行信息提取、 编码, 得到用户隐私与特 征基因集; S3、 根据所述用户隐私与特征基因集, 将所述多用户匿名提交历史数据与所述用户隐 私与特征基因集相关联, 得到关联 结果集; S4、 根据所述关联结果集, 对所述用户隐私与特征基因集进行处理, 得到数据 特征模型 集; S5、 根据所述数据特征模型集, 判断拟提交数据的数据类型, 得到拟提交数据类型信 息; 所述数据类型信息包括直接隐私数据、 间接隐私数据、 间接隐私数据集合、 非隐私数据 集合; S6、 所述拟提交数据类型信息是非隐私数据集合 时, 将所述拟提交数据直接匿名提交; 否则, 将所述拟提交数据采用多用户匿名分区方法提交数据方法提交。 2.根据权利要求1所述的多用户匿名提交数据方法, 其特 征在于, 所述 步骤S1包括: S11、 采用数据挖掘技术, 对预设的多用户匿名提交的历史数据集合进行直接隐私数据 挖掘, 得到直接隐私数据集和潜在 间接隐私数据集; 所述潜在 间接隐私数据集为所述预设 的多用户匿名提交的历史数据集 合中除所述 直接隐私数据集之外的数据集 合; S12、 对所述直接隐私数据集中直接隐私数据进行挖掘, 得到第一用户隐私与特征数据 集; S13、 识别直接隐私数据与所述第一用户隐私与特征数据集中用户隐私与特征的对应 关系, 得到直接隐私数据与用户隐私与特 征的对应关系集; S14、 采用数据挖掘与分析技术, 对所述潜在间接隐私数据 特性集中潜在间接隐私数据 的知识性、 背景场景、 价 值性、 特异性、 使用性进行挖掘, 得到第二用户隐私与特 征数据集; S15、 识别潜在间接隐私数据与所述第二用户隐私与特征数据集中用户隐私与特征的 对应关系, 得到潜在间接隐私数据与用户隐私与特 征的对应关系集; S16、 采用数据挖掘与分析方法, 对所述潜在间接隐私数据集中潜在间接隐私数据之间 的关联性、 协同性、 价值性、 特异性、 使用性、 导向性进行挖掘与提取, 得到第三用户隐私与 特征数据集; S17、 识别潜在间接隐私数据集中的任意子集与所述第三用户隐私与特征数据集中用 户隐私与特征的对应关系, 得到潜在间接隐私数据集中任意子集与用户隐私与特征的对应 关系集; S18、 将所述第一用户隐私与特征数据集、 所述第二用户隐私与特征数据集、 所述第三 用户隐私与特 征数据集进行合并处 理, 得到用户隐私与特 征数据集。 3.根据权利要求2所述的多用户匿名提交数据方法, 其特 征在于, 所述 步骤S2, 包括: S21、 将所述用户隐私与特征数据集进行查重、 去冗余, 得到第四用户隐私与特征数据 集; S22、 将所述第四用户隐私与特征数据集划分为最小用户隐私与特征单元, 得到用户隐 私与特征基因集; 所述用户隐私与特征基因表示为{最小用户隐私与 特征单元, 相关类型, 与用户隐私与权 利 要 求 书 1/4 页 2 CN 115374460 A 2特征相关的直接隐私数据编号, 与用户隐私与特征相关的间接隐私数据编号, 与用户隐私 与特征相关的间接隐私数据集合编号, 最小用户隐私与特征单元排序编码}; 所述相关类型 表征与直接隐私数据或间接隐私数据。 4.根据权利要求3所述的多用户匿名提交数据方法, 其特 征在于, 所述 步骤S4, 包括: S41、 根据所述关联 结果集, 对所述多用户中任一用户构建数据特 征模型, 包括: S411、 从所述用户隐私与特征基因集中, 找出所述任一用户隐私与特征基因, 以及所述 任一用户隐私与特征基因对应的直接隐私数据、 间接隐私数据或间接隐私数据集合, 将所 述任一用户隐私与特征基因和对应的直接隐私数据、 间接隐私数据、 间接隐私数据集合组 合为数据族, 得到所述任一用户的数据族; S412、 将所述任一用户数据族中包括的所有直接隐私数据进行聚类分析, 提取相同数 据特征, 得到第一数据特 征模型; 所述第一数据特征模型包括: {所述任一用户隐私与特征基因, 直接隐私数据, 聚类的 直接隐私数据, 聚类的直接隐私数据集 合, 聚类的直接隐私数据的相同数据特 征}; S413、 将所述任一用户数据族中包括的所有间接隐私数据进行聚类分析, 提取相同数 据特征, 得到第二数据特 征模型; 所述第二数据特征模型包括: {所述任一用户隐私与特征基因, 间接隐私数据, 聚类的 间接隐私数据, 聚类的间接隐私数据集 合, 聚类的间接隐私数据的相同数据特 征}; S414、 提取所述任一用户数据族中各个间接隐私数据集合的内部关联特征, 将提取的 所有所述间接隐私数据集合的内部关联特征进行聚类分析, 提取相同的内部关联特征, 得 到第三数据特 征模型; 所述第三数据特征模型包括: {所述任一用户隐私与特征基因, 间接隐私数据集合, 内 部关联特征聚类的间接隐私数据集合, 内部关联特征聚类的间接隐私数据集合的集合, 间 接隐私数据集 合的内部关联 特征的相同数据特 征}; S415、 将所述任一用户的所述第一数据特征模型、 所述第二数据特征模型、 所述第三数 据特征模型进行整合处 理, 得到所述任一用户的数据特 征模型; S42、 判断所述多用户中是否 完成所有用户的数据特 征模型构建, 得到判断结果; 如果判断结果是没未完成所有用户的数据特 征模型构建, 则执 行步骤S41; 如果判断结果是完成了所有用户的数据特征模型构建, 将所有用户的数据特征模型进 行组合, 得到数据特 征模型集。 5.根据权利要求 4所述的多用户匿名提交数据方法, 其特 征在于, 所述 步骤S5, 包括: S51、 对拟提交数据进行归集处理, 如果所述拟提交数据中的数据可归集于所述数据特 征模型集中聚类的直接隐私数据集合, 并具有相同数据特征, 则拟提交数据类型为直接隐 私数据, 将所述拟提交数据采用多用户匿名分区方法提交数据方法提交; 否则, 执行步骤 S52; S52、 如果所述拟提交数据中的数据可归集于所述数据特征模型集中聚类的间接隐私 数据集合, 并具有相同数据特征, 则拟提交数据类型为间接隐私数据, 将所述拟提交数据采 用多用户匿名分区方法提交数据方法提交; 否则, 执 行步骤S5 3; S53、 如果所述拟提交数据中的数据可归集于所述数据特征模型集中聚类的间接隐私 数据集合的集合, 并具有相同数据特征, 则拟提交数据类型为间接隐私数据集合, 将所述拟权 利 要 求 书 2/4 页 3 CN 115374460 A 3

PDF文档 专利 一种多用户匿名提交数据方法

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种多用户匿名提交数据方法 第 1 页 专利 一种多用户匿名提交数据方法 第 2 页 专利 一种多用户匿名提交数据方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:34:26上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。