全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211017274.2 (22)申请日 2022.08.23 (71)申请人 北京安天网络安全技 术有限公司 地址 100195 北京市海淀区玉泉山闵庄路3 号清华科技园玉泉慧谷1号楼 (72)发明人 张俊涛 孙淑玉 宫成龙 张健  肖新光  (74)专利代理 机构 北京科衡知识产权代理有限 公司 11928 专利代理师 王淑静 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/31(2019.01) G06F 16/28(2019.01) G06F 16/25(2019.01)G06F 16/22(2019.01) (54)发明名称 用户数据图谱化构建方法、 系统、 电子设备 及存储介质 (57)摘要 本发明实施例公开的用户数据图谱化构建 方法、 系统、 电子设备及存储介质, 涉及数据分析 技术领域。 所述方法包括: 对用户数据进行分析, 建立与所述用户数据对应的索引和字段属性结 构, 并针对每一个索引创建主键; 其中, 所述用户 数据包含实体、 以及实体与实体之间关系的数 据; 按照建立的所述索引和字段属性结构, 导入 所述用户数据; 将所述索引及字段属性与图数据 库中的预设索引及字段属性进行映射, 得到用户 数据图谱。 本发 明便于提高用户数据图谱构建效 率, 适用于网络资产安全、 企业关系、 单位内部组 织架构等各种数据分析场景中。 权利要求书2页 说明书10页 附图3页 CN 115422367 A 2022.12.02 CN 115422367 A 1.一种用户数据图谱化构建方法, 其特 征在于, 所述方法包括 步骤: 对用户数据进行分析, 建立与所述用户数据对应的索引和字段属性结构, 并针对每一 个索引创建主键; 其中, 所述用户数据包 含实体以及实体与实体之间关系的数据; 按照建立的所述索引和字段属性结构, 导入所述用户数据; 将所述索引及字段属性与图数据库中的预设索引及字段属性进行映射, 得到用户数据 图谱。 2.根据权利要求1所述的用户数据图谱化构建方法, 其特征在于, 在对用户数据进行分 析之前, 所述方法还 包括: 获取用户数据; 所述用户数据包 含: 非结构化数据; 在所述对用户数据进行分析时, 还 包括: 判断所述非结构化数据中是否存在增量字段; 若不存在, 则添加自增的长整型字段作为增量字段; 根据所述增量字段, 确定增量 导入的用户数据。 3.根据权利要求1所述的用户数据图谱化构建方法, 其特征在于, 所述用户数据还包 含: 存储于标准数据库中的结构化数据; 所述方法还包括: 从所述标准数据库中获取所述结构化数据; 所述结构化数据以表的 形式存储, 每张表具有字段, 每 个字段携带有字段属性; 根据所述表及字段属性与图数据库中的预设索引及字段属性进行映射, 得到所述结构 化数据的图谱; 所述预设索引以表的形式维护。 4.根据权利要求1所述的用户数据图谱化构建方法, 其特征在于, 在将所述索引及字段 属性与图数据库中的预设索引及字段属 性进行映射之前, 所述方法还包括: 配置所述图数 据库中的映射关系; 所述映射关系包含: 索引及字段属 性, 所述索引用于表征实体, 所述字 段属性包 含用于表征实体与实体之间关系的外 键。 5.根据权利要求4所述的用户数据图谱化构建方法, 其特征在于, 在配置所述图数据库 中的映射关系之后, 所述方法还 包括: 定期向所述图数据库中增量 导入用户数据: 在增量导入用户数据时, 根据 所述映射关系, 调用图数据库创建实体接口, 给所述实体 添加字段属性; 以及, 调用图数据库创建实体关系接口, 将表征实体与实体之间关系的字段属性添加 到图数据库中。 6.根据权利要求5所述的用户数据图谱化构建方法, 其特征在于, 在得到用户数据图谱 之后, 所述方法还包括: 根据所述用户数据图谱展示或发现实体、 实体与实体之 间关系的拓 扑结构。 7.一种用户数据图谱化构建系统, 其特 征在于, 包括: 数据处理程序模块, 用于对用户数据进行分析, 建立与所述用户数据对应的索引和字 段属性结构, 并针对每一个索引创建主键; 其中, 所述用户数据包含实体以及实体与实体之 间关系的数据; 导入程序模块, 用于按照建立的所述索引和字段属性结构, 导入所述用户数据; 映射程序模块, 用于将所述索引及字段属性与图数据库中的预设索引及字段属性进行 映射, 得到用户数据图谱。 8.一种电子设备, 其特征在于, 包括: 一个或者多个处理器; 存储器; 所述存储器中存储 有一个或者多个可执行程序, 所述一个 或者多个处理器读取存储器中存储的可执行程序 代权 利 要 求 书 1/2 页 2 CN 115422367 A 2码, 运行与所述可执行程序代码对应的程序, 以用于执行权利要求1至6任一所述的用户数 据图谱化构建方法。 9.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有一个或者 多个程序, 所述一个或者多个程序可被一个或者多个处理器执行, 以实现前述权利要求 1至 6任一所述的用户数据图谱化构建方法。权 利 要 求 书 2/2 页 3 CN 115422367 A 3

PDF文档 专利 用户数据图谱化构建方法、系统、电子设备及存储介质

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用户数据图谱化构建方法、系统、电子设备及存储介质 第 1 页 专利 用户数据图谱化构建方法、系统、电子设备及存储介质 第 2 页 专利 用户数据图谱化构建方法、系统、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 01:01:44上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。