全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210997587.2 (22)申请日 2022.08.19 (71)申请人 湖南华菱电子商务有限公司 地址 410000 湖南省长 沙市高新 开发区岳 麓西大道58 8号芯城科技园2栋 503室 (72)发明人 吴景文 张昆 叶祖焕 刘洋  黄睿  (74)专利代理 机构 长沙知行亦创知识产权代理 事务所(普通 合伙) 43240 专利代理师 李杰 (51)Int.Cl. G06F 21/62(2013.01) G06F 16/28(2019.01) G06F 16/35(2019.01) G06K 9/62(2022.01) (54)发明名称 基于数字中台的敏感数据管 理方法、 装置及 电子设备 (57)摘要 本发明涉及人工智能技术, 公开了一种基于 数字中台的敏感数据管理方法、 装置及 电子设 备。 所述方法包括: 从数字中台中提取包括结构 化数据集合及非结构化数据集合的业务周期数 据集合, 基于结构化数据集合中各数据属性的敏 感度进行敏感聚类及敏 感数据分级, 得到结构数 据敏感分级结果, 提取非结构化数据集合中的数 据特征, 利用预设的分级 标签对数据特征进行梯 度聚类并进行分级标注, 得到非结构数据敏感分 级结果, 将结构数据敏 感分级结果及非结构数据 敏感分级结果存储至数字中台, 对用户实时敏 感 数据访问行为进行异常识别, 根据异常识别结果 从数字中台中获取敏感数据。 本发 明可以对数字 中台中的敏感数据进行有效管理。 权利要求书3页 说明书18页 附图2页 CN 115081025 A 2022.09.20 CN 115081025 A 1.一种基于数字中 台的敏感数据管理方法, 其特 征在于, 所述方法包括: 获取预构建的数字 中台中的用户信 息, 基于所述用户信 息从所述数字中台中提取业务 周期数据集 合, 其中, 所述 业务周期数据集 合包括结构化数据集 合及非结构化数据集 合; 计算所述结构化数据集合中各数据属性的敏感度, 基于所述敏感度对所述结构化数据 集合进行敏感聚类, 并对聚类结果进行 敏感数据分级, 得到结构数据敏感分级结果; 利用预构建的多元业务周期模型提取所述非结构化数据集合中的数据 特征, 基于平方 和梯度下降法对所述数据特征进 行梯度聚类, 并利用预设的分级标签对梯度聚类结果进 行 分级标注, 得到非结构数据敏感分级结果; 将所述结构数据敏感分级结果及所述非结构数据敏感分级结果存 储至所述数字中 台; 接收用户实时敏感数据访问行为, 利用预构建的异常访问识别模型对所述用户实时敏 感数据访问行为进行异常识别, 根据异常识别结果从所述数字中 台中获取敏感数据。 2.如权利要求1中所述的基于数字 中台的敏感数据 管理方法, 其特征在于, 所述计算所 述结构化数据集合中各数据属性的敏感度, 基于所述敏感度对所述结构化数据集合进 行敏 感聚类, 并对聚类结果进行 敏感数据分级, 得到结构数据敏感分级结果, 包括: 利用预设的熵值敏感度计算公式计算所述结构化数据集 合中各数据属性的敏感度; 利用k‑means聚类算法对所述敏感度进行敏感聚类, 得到所有数据属性的原始聚类结 果; 基于Aprior  算法构建所述原始聚类结果中数据属性的关联规则, 并基于构建成功的 关联规则对所述原 始聚类结果重新进行划分, 得到标准聚类结果; 计算所述标准 聚类结果中数据属性的互信 息值, 并基于所述互信 息值的大小排序对所 述结构化数据集 合中的敏感数据进行分级, 得到所述结构数据敏感分级结果。 3.如权利要求2所述的基于数字 中台的敏感数据管理方法, 其特征在于, 所述原始聚类 结果包括敏感聚类簇及疑似敏感聚类簇, 以及所述基于Aprior  算法构建所述原始聚类结 果中数据属性的关联规则, 并基于构建成功的关联规则对所述原始聚类结果重新进行划 分, 得到标准聚类结果, 包括: 基于所述Aprior  算法, 建立所述疑似敏感聚类簇中数据属性至所述敏感聚类簇中数 据属性的关联规则; 重新对关联规则建立成功的数据属性进行敏感度计算, 并根据敏感度 大小调整敏感聚 类簇及疑似敏感聚类簇中的数据属性, 将调整后的敏感属性集及非敏感属性集作为所述标 准聚类结果。 4.如权利要求3所述的基于数字 中台的敏感数据管理方法, 其特征在于, 所述重新对关 联规则建立成功的数据属性进行 敏感度计算, 包括: 利用下述公式计算敏感度: 其中, 表示成功 建立关联规则的第i个数据属性的敏感度, xi表示第i个成功建立关 联规则的数据属性, 表示第i个成功建立关联规则的数据属性的最大离散熵,权 利 要 求 书 1/3 页 2 CN 115081025 A 2表示第i个成功建立关联规则的数据属性的条件变化熵, 表示数据属性xi及 数据属性xj建立关联规则后的条件熵。 5.如权利要求2所述的基于数字 中台的敏感数据管理方法, 其特征在于, 所述计算所述 标准聚类结果中数据属性的互信息值, 包括: 通过下述公式计算互信息值: 其中, A,B表示敏感属性集中的两个数据属性, n表示数据属性的属性值个数, ai表示数 据属性A中第i个属 性值, bi表示数据属 性B中第i个属 性值, 表示ai的先验概率, 表示在bi条件时的后验概 率。 6.如权利要求1所述的基于数字 中台的敏感数据管理方法, 其特征在于, 所述基于平方 和梯度下降法对所述数据特征进 行梯度聚类, 并利用预设的分级标签对梯度聚类结果进 行 分级标注, 得到非结构数据敏感分级结果, 包括: 对所述数据特 征进行特征对齐及特 征降维处 理, 得到标准数据特 征; 选取预设个数的标准数据特征作为初始聚类中心, 将所有标准数据特征划分至距离最 近的初始聚类中心, 得到所述预设个数的初始聚类簇; 计算所述预设个数的初始聚类簇的平方和; 依次增加所述初始聚类中心的个数, 并返回所述将所有标准数据 特征划分至距离最近 的初始聚类中心的步骤, 直到相 邻两次初始聚类簇的平方和的梯度差值大于或等于预设的 梯度阈值, 并选取所述大于或等于预设的梯度阈值的梯度差值对应的初始聚类簇的初始聚 类中心作为标准聚类中心; 基于所述标准聚类中心, 利用k ‑means聚类算法对所有的标准数据特征进行聚类, 得到 包含多个收敛聚类簇的梯度聚类结果; 利用所述分级标签对所述多个收敛聚类簇进行分级标注, 得到所述非结构数据敏感分 级结果。 7.如权利要求6所述的基于数字中台的敏感数据管理方法, 其特征在于, 该方法还包 括: 通过下述公式计算相邻两次初始聚类簇的平方和的梯度差值: 其中, g为所述梯度差值, Dk表示K个初始聚类簇的平方和, Dk‑1表示 (K‑1) 个初始聚类簇 的平方和, Ci表示第i个初始聚类簇, P表示第i个初始聚类簇内的某一个标准数据特征向 量, Mi表示第i个初始聚类中心。 8.如权利要求1 ‑6中任一项所述的基于数字中台的敏感数据 管理方法, 其特征在于, 所 述利用预构建的异常访问识别模型对所述用户实时敏感数据访问行为进 行异常识别之前, 所述方法还 包括:权 利 要 求 书 2/3 页 3 CN 115081025 A 3

PDF文档 专利 基于数字中台的敏感数据管理方法、装置及电子设备

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于数字中台的敏感数据管理方法、装置及电子设备 第 1 页 专利 基于数字中台的敏感数据管理方法、装置及电子设备 第 2 页 专利 基于数字中台的敏感数据管理方法、装置及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:34:17上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。