全网唯一标准王
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210308478.5 (22)申请日 2022.03.28 (65)同一申请的已公布的文献号 申请公布号 CN 114416891 A (43)申请公布日 2022.04.29 (73)专利权人 支付宝 (杭州) 信息技 术有限公司 地址 310023 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人 阳进  (74)专利代理 机构 上海专利商标事务所有限公 司 31100 专利代理师 段登新 (51)Int.Cl. G06F 16/28(2019.01) G06F 16/2455(2019.01)G06F 16/23(2019.01) G06F 16/21(2019.01) (56)对比文件 CN 113535966 A,2021.10.2 2 CN 109145121 A,2019.01.04 CN 109923568 A,2019.0 6.21 CN 10976 6445 A,2019.0 5.17 CN 113094511 A,2021.07.09 US 20181 13982 A1,2018.04.26 CN 112328857 A,2021.02.0 5 审查员 凡保磊 (54)发明名称 在知识图谱中进行数据处理的方法、 系统、 装置和介质 (57)摘要 公开了一种在知识图谱中进行数据处理的 方法, 包括: 获取原始数据, 包括获取实体和/或 关系的时变属性值的历史明细数据; 将该时变属 性值的历史明细数据存储在在线多版本数据库 中, 该多版本数据库中该时变属性值的历史明细 数据的版本与该历史明细数据的时间相关联; 使 用该多版本数据库, 计算该时变属性值的指定统 计指标值; 生成或更新知识图谱。 还公开了分析 用户对功能或服务的行为的方法; 还公开了相应 的系统、 装置和介质。 本申请的方案能够高效、 灵 活地计算知识图谱中的属性 值的统计指标值。 权利要求书2页 说明书15页 附图12页 CN 114416891 B 2022.07.15 CN 114416891 B 1.一种在 知识图谱中进行 数据处理的方法, 包括: 获取用于知识图谱的原始数据, 所述原始数据包括涉及多个实体和/或所述多个实体 间的多个关系的属 性值, 其中一个或多个属 性值为时变属 性值, 其中获取所述原始数据包 括获取所述时变属性 值的历史明细数据; 使用数据流有状态计算引擎的批执行模式将所述时变属性值的历史明细数据存储在 多版本数据库中, 所述多版本数据库具有在线多版本能力, 其中所述多版本数据库中所述 时变属性 值的历史明细数据的版本与该历史明细数据的时间相关联; 使用所述多版本数据库, 基于所述 时变属性值的历史明细数据计算所述 时变属性值的 指定统计指标值; 生成或更新知识图谱, 其中所述多个实体为所述知识图谱中的顶点, 所述多个关系为 所述知识图谱中的边, 且所述指定统计指标值作为与所述实体相对应的顶点的属性值或与 所述关系相对应的边的属性 值; 实时或准实时地获取新原 始数据, 所述 新原始数据包括 新属性值; 以及 使用数据流有状态计算引擎的流执行模式将所述新属性值存储在所述多版本数据库 中。 2. 如权利要求1所述的方法, 进一 步包括: 至少部分地基于所述新属性值, 计算经更新的指定统计指标值作为经更新的统计属 性; 以及 将所述经 更新的统计属性更新到所述知识图谱。 3.如权利要求1所述的方法, 其中一个或多个属性值为非时变属性值, 且其中所述非时 变属性值按照无 版本或单 版本的方式保存在所述多版本数据库中。 4.如权利要求3所述的方法, 不计算所述非时变属性值的统计指标值, 和/或不在所述 知识图谱中更新所述非时变属性 值的统计指标值。 5.如权利要求1所述的方法, 其中所述数据流有状态计算引擎为Blink引擎或Flink引 擎。 6.如权利 要求1所述的方法, 其 中所述多版本数据库为Geabase数据库和/或HBase数据 库。 7.如权利要求1所述的方法, 其中所述指定统计指标值为在任意指定时间段上计算的 指定类别的统计指标的值。 8. 如权利要求7 所述的方法, 进一 步包括: 接收来自用户的输入; 以及 所述指定统计指标值基于所述 来自用户的输入。 9.如权利要求1所述的方法, 进一 步包括: 使用所述数据流有状态计算引擎的流执 行模式来对所述 新原始数据执 行检查点处理。 10.一种分析用户对功能或服 务的行为的方法, 包括: 接收用户对功能或服务的行为的历史数据, 其中所述历史数据包括涉及用户、 功能、 服 务或行为的属性 值, 其中一个或多个属性 值为时变属性 值; 使用数据流有状态计算引擎的批执行模式将所述时变属性值的历史明细数据存储在 多版本数据库中, 所述多版本数据库具有在线多版本能力, 其中所述多版本数据库中所述权 利 要 求 书 1/2 页 2 CN 114416891 B 2时变属性 值的历史明细数据的版本与该历史明细数据的时间相关联; 使用所述多版本数据库, 基于所述 时变属性值的历史明细数据计算所述 时变属性值的 指定统计指标值; 生成或更新知识图谱, 其中所述用户 和功能或服务与所述知识图谱中的顶点相对应, 所述行为与所述知识图谱中的边相对应, 且所述指 定统计指标值作为相应顶点或边的属性 值; 实时或准实时地获取新用户行为数据, 所述 新用户行为数据包括 新属性值; 以及 使用数据流有状态计算引擎的流执行模式将所述新属性值存储在所述多版本数据库 中。 11. 如权利要求10所述的方法, 进一 步包括: 至少部分地基于所述新属性值, 计算经更新的指定统计指标值作为经更新的统计属 性; 以及 将所述经 更新的统计属性更新到所述知识图谱。 12.一种在 知识图谱中进行 数据处理的系统, 包括: 数据获取模块, 用于获取用于知识图谱的原始数据, 所述原始数据包括涉及多个实体 和/或所述多个实体间的多个 关系的属性值, 其中一个或多个属性值为时变属性值, 其中获 取所述原始数据包括获取 所述时变属性 值的历史明细数据; 多版本数据库, 所述多版本数据库具有在线 多版本能力; 数据流有状态计算引擎, 用于利用批执行模式将所述 时变属性值的历史明细数据存储 在所述多版本数据库中, 其中所述多版本数据库中所述时变属性值的历史明细数据的版本 与该历史明细数据的时间相关联; 以及 知识图谱更新模块, 用于使用所述多版本数据库, 基于所述时变属性值的历史明细数 据计算所述时变属 性值的指定统计指标值; 以及生成或更新知识图谱, 其中所述多个实体 为所述知识图谱中的顶点, 所述多个关系为所述知识图谱中的边, 且所述指定统计指标值 作为与所述实体相对应的顶点的属性 值或与所述关系相对应的边的属性 值, 其中: 所述数据获取模块进一步用于实时或准实时地获取新原始数据, 所述新原始数据包括 新属性值; 以及 所述数据流有状态计算引擎进一步用于利用流执行模式将所述新属性值存储在所述 多版本数据库中。 13. 如权利要求12所述的系统, 所述知识图谱更新模块进一 步用于: 至少部分地基于所述新属性值, 计算经更新的指定统计指标值作为经更新的统计属 性; 以及 将所述经 更新的统计属性更新到所述知识图谱。 14. 一种用于在 知识图谱中进行 数据处理的装置, 包括: 存储器; 以及 处理器, 所述处 理器被配置成执 行如权利要求1 ‑11中任一项所述的方法。 15.一种存储指令的计算机可读存储介质, 所述指令当被计算机执行时, 使所述计算机 执行如权利要求1 ‑11中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114416891 B 3

PDF文档 专利 在知识图谱中进行数据处理的方法、系统、装置和介质

文档预览
中文文档 30 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共30页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 在知识图谱中进行数据处理的方法、系统、装置和介质 第 1 页 专利 在知识图谱中进行数据处理的方法、系统、装置和介质 第 2 页 专利 在知识图谱中进行数据处理的方法、系统、装置和介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:50:09上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。