全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211271802.7 (22)申请日 2022.10.18 (71)申请人 中国电信股份有限公司 地址 100033 北京市西城区金融大街31号 (72)发明人 贾炎 范潇  (74)专利代理 机构 北京润泽恒知识产权代理有 限公司 1 1319 专利代理师 任亚娟 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/33(2019.01) G06F 40/211(2020.01) G06F 40/289(2020.01) (54)发明名称 一种查询图的生成方法及装置、 电子设备、 存储介质 (57)摘要 本发明实施例提供了一种查询图的生成方 法及装置、 电子设备、 存储介质, 方法包括: 获取 第一查询问句和针对查询问句进行关系检测的 关系检测模 型; 确定第一查询问句的多个链接实 体; 通过关系检测模型对第一查询问句进行关系 检测, 对所述多个链接实体进行排序, 以从所述 多个链接实体中确定目标链接实体集合; 基于第 一查询问句生成第二查询问句; 通过关系检测模 型对第二查询问句进行关系检测, 从所述目标链 接实体集合中确定目标链接实体, 并基于所述目 标链接实体生成查询图。 通过本发明实施例, 实 现了增强信息提取能力, 不依赖知识图谱遍历计 算, 基于二次关系检测从查询问句的中心实体出 发, 聚焦于局部查询图的生成, 使生成的查询图 更加准确。 权利要求书2页 说明书19页 附图7页 CN 115544270 A 2022.12.30 CN 115544270 A 1.一种查询图的生成方法, 其特 征在于, 所述方法包括: 获取第一 查询问句和针对查询问句进行关系检测的关系检测模型; 确定所述第一 查询问句的多个链接实体; 通过所述关系检测模型对所述第 一查询问句进行关系检测, 对所述多个链接实体进行 排序, 以从所述多个链接实体中确定目标链接实体集 合; 基于所述第一查询问句生成第二查询问句, 其中, 所述第二查询问句为所述第一查询 问句对所述目标链接实体集 合中每个链接实体进行格式化 生成; 通过所述关系检测模型对所述第 二查询问句进行关系检测, 从所述目标链接实体集合 中确定目标链接实体, 并基于所述目标链接实体生成查询图。 2.根据权利要求1所述的方法, 其特征在于, 所述通过所述关系检测模型对所述第 一查 询问句进行关系检测, 对所述多个链接实体进行排序, 以从所述多个链接实体中确定目标 链接实体集 合, 包括: 确定所述多个链接实体中每 个链接实体的第一分值信息; 基于预设的知识谱图确定每 个链接实体的第一关系集和关联的第二关系集; 采用所述关系检测模块将所述第一查询问句分别与所述第一关系集和所述第二关系 集进行关系检测, 生成针对每 个链接实体的可靠关系的第二分值信息; 根据所述第一分值信息和所述第二分值信息, 确定每 个链接实体的目标分值信息; 基于所述目标分值信 息从高到低的排序信 息, 从所述多个链接实体中确定目标链接实 体集合。 3.根据权利要求2所述的方法, 其特征在于, 所述采用所述关系检测模块将所述第 一查 询问句分别与所述第一关系集和所述第二关系集进行关系检测, 生成针对每个链接实体的 可靠关系的第二分值信息, 包括: 确定所述第一 查询问句的第一问句向量信息; 确定所述第一关系集中每 个第一关系的第一关系向量信息; 确定所述第二关系集中每 个第二关系的第二关系向量信息; 根据所述第一问句向量信息、 所述第一关系向量信息以及所述第二关系向量信息, 生 成针对每 个链接实体的可靠关系的第二分值信息 。 4.根据权利要求3所述的方法, 其特征在于, 所述根据所述第一问句向量信息、 所述第 一关系向量信息以及所述第二关系向量信息, 生成针对每个链接实体的可靠关系的第二分 值信息, 包括: 确定所述第一问句向量信息和所述第一关系向量信息的第一 余弦相似度信息; 确定所述第一问句向量信息和所述第二关系向量信息的第二 余弦相似度信息; 根据所述第一余弦相似度信息从高到低的排序, 确定所述第一关系集的第一关系子 集; 根据所述第一关系子集和所述第二关系集, 得到可靠关系集; 基于所述可靠关系集、 所述第一余弦相似度信息以及所述第二余弦相似度信息, 生成 针对每个链接实体的可靠关系的第二分值信息 。 5.根据权利要求2所述的方法, 其特征在于, 所述通过所述关系检测模型对所述第 二查 询问句进行关系检测, 从所述目标链接实体集 合中确定目标链接实体, 包括:权 利 要 求 书 1/2 页 2 CN 115544270 A 2采用所述关系检测模块对所述第 二查询问句和所述第 二关系集进行关系检测, 生成针 对所述目标链接实体中每 个链接实体的关系的第三分值信息; 基于所述第 三分值信 息和所述目标分值信 息, 从所述目标链接实体集合中确定目标链 接实体。 6.根据权利要求1或2或3或4或5所述的方法, 其特征在于, 所述基于所述目标链接实体 生成查询图, 包括: 基于预设的知识谱图生成所述目标链接实体的查询子图; 在所述查询子图中未查询到所述第 一查询问句对应的查询结果 时, 基于所述预设的知 识谱图确定所述 查询子图中最外层目标实体连接的不在所述 查子图内的关联实体; 在所述关系实体与 所述第一查询问句的匹配度大于预设匹配度阈值 时, 将所述关联实 体以及所述关联实体对应的关联关系添加到所述 查询子图中, 以生成查询图。 7.根据权利要求1或2或3或4或5所述的方法, 其特征在于, 所述关系检测模型的训练步 骤, 包括: 获取用于训练关系检测模型的目标查询问句, 基于预设的关系检测模型的表征参数, 确定所述目标查询问句的目标问句向量信息; 确定所述目标查询问句的关系 级分词信 息和词语级分词信 息, 并基于预设的关系检测 模型的表征参数, 确定所述关系级分词信息的关系级分词向量信息和所述词语级分词信息 的词语级分词向量信息; 根据所述关系级分词向量信息和所述词语级分词向量信息生成所述目标查询问句的 目标关系向量信息; 确定所述目标问句向量信息和所述目标关系向量信息的目标余弦相似度信息; 根据所述目标余弦相似度信息对所述表征参数进行调整。 8.一种查询图的生成装置, 其特 征在于, 所述装置包括: 数据获取模块, 用于获取第一查询问句和针对查询问句进行关系检测的关系检测模 型; 链接实体生成模块, 用于确定所述第一 查询问句的多个链接实体; 第一关系检测模块, 用于通过所述关系检测模型对所述第一查询问句进行关系检测, 对所述多个链接实体进行排序, 以从所述多个链接实体中确定目标链接实体集 合; 查询语句格 式化模块, 用于基于所述第一查询问句生成第 二查询问句, 其中, 所述第二 查询问句为所述第一 查询问句对所述目标链接实体集 合中每个链接实体进行格式化 生成; 第二关系检测模块, 用于通过所述关系检测模型对所述第二查询问句进行关系检测, 从所述目标链接实体集 合中确定目标链接实体, 并基于所述目标链接实体生成查询图。 9.一种服务器, 其特征在于, 包括处理器、 存储器及存储在所述存储器上并能够在所述 处理器上运行的计算机程序, 所述计算机程序被所述处理器执行时实现如权利要求 1至7中 任一项所述 一种查询图的生成方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储计算机程 序, 所述计算机程序被处理器执行时实现如权利要求 1至7中任一项 所述一种查询图的生成 方法。权 利 要 求 书 2/2 页 3 CN 115544270 A 3

PDF文档 专利 一种查询图的生成方法及装置、电子设备、存储介质

文档预览
中文文档 29 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种查询图的生成方法及装置、电子设备、存储介质 第 1 页 专利 一种查询图的生成方法及装置、电子设备、存储介质 第 2 页 专利 一种查询图的生成方法及装置、电子设备、存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:49:09上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。