全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211165014.X (22)申请日 2022.09.23 (71)申请人 苏州爱语认知智能科技有限公司 地址 215000 江苏省苏州市中国(江苏)自 由贸易试验区苏州片区苏州工业园区 金鸡湖大道88号人工智能产业园G2- 306单元 (72)发明人 陈文亮 王铭涛 何正球 张民  (74)专利代理 机构 苏州市中南伟业知识产权代 理事务所(普通 合伙) 32257 专利代理师 陈华红子 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/332(2019.01) G06K 9/62(2022.01) (54)发明名称 一种路径推理模型的训练方法及路径推理 方法 (57)摘要 本发明涉及知识图谱技术领域, 尤其是指一 种路径推理模型的训练方法、 装置、 计算机存储 介质及路径推理方法。 本发明所述的路径推理模 型的训练方法, 使用对比学习的思想, 从样本自 身出发引入代理任务, 构建子 路径和对应的负样 本, 解决了训练数据中数据分布不均的问题, 同 时增强了模型在推理过程中对正确路径的打分 能力, 使得模型在训练和推理时匹配, 提高了模 型对候选路径的筛 选能力。 权利要求书2页 说明书7页 附图2页 CN 115438193 A 2022.12.06 CN 115438193 A 1.一种路径推理模型的训练方法, 其特征在于, 所述路径推理模型用于对一接收到的 路径询问的问句进行路径规划, 包括: 从知识库中搜索与问句 相关的主题实体的所有候选路径{G}; 构建正例样本集 其中, 为第i跳的正确子路径, 即 第i跳正例样本, i∈1. ..n, n为全局正确路径对应的跳数; 为所述第i跳正例样本构建对应的第i跳负例样本集 所述第 i跳负例样本集中的元 素为第i跳负例样本; 利用所述第i跳正例样本和所述第i跳负例样本集训练所述路径推理模型。 2.根据权利要求1所述的路径推理模型的训练方法, 其特征在于, 所述利用所述第i跳 正例样本和所述第i跳负例样本集训练所述路径推理模型包括: 分别将每 个样本和问句进行拼接; 将和问句拼接后的第i跳正例样本输入共享编码器中进行编码, 并计算问句和该正例 样本的第一相似度得分; 分别将每个和问句拼接后的第i跳负例样本输入共享编码器中进行编码, 并计算问句 和每个负例样本的第二相似度得分; 以第i跳正例样本和问句的第 一相似度得分, 以及第 i跳负例样本和问句的第 二相似度 得分之间的差距最大化 为优化目标, 训练所述路径推理模型。 3.根据权利要求2所述的路径推理模型的训练方法, 其特征在于, 所述分别将每个样本 和问句进行拼接包括: 使用特殊符号 “[CLS]”和“[SEP]”将问句和样本拼接, 即 “[CLS]+问句+[ SEP]+样本 ”。 4.根据权利要求2所述的路径推理模型的训练方法, 其特征在于, 所述共享编码器包括 BERT编码层、 全连接层和线性变换层。 5.根据权利要求2所述的路径推理模型的训练方法, 其特征在于, 所述相似度得分的计 算过程包括: 将拼接后的问句和样本输入共享编码器编码, 并经过全连接层和非线性变换层处理 后, 得到pair编码; 利用sigmod激活函数根据所述pair编码计算问句和样本的相似度得分。 6.根据权利要求2所述的路径推理模型的训练方法, 其特征在于, 所述以第i跳正例样 本和问句的第一相似度得分, 以及第i跳负例样本和问句的第二相似度得分之间的差距最 大化为优化目标, 训练所述路径推理模型包括: 采用margin  loss损失函数最大化第i跳正例样本和问句的第一相似度得分以及第i跳 负例样本和问句的第二相似度得分之间的差距, 损失函数为: loss=max(0,γ+score2‑ score1), 其中, γ为超参数, score2为第二相似度得分, score1为第一相似度得分。 7.一种路径推理方法, 其特 征在于, 包括: 利用权利要求1 ‑6任一项所述的路径推理模型训练方法训练路径推理模型, 得到训练 好的路径推理模型; 从知识库中搜索与问句相关的主题实体的所有候选路径, 将每个候选路径与问题拼接 后输入所述训练好的路径推理模型;权 利 要 求 书 1/2 页 2 CN 115438193 A 2计算每个第一跳候选路径和问句的相似度得分, 并进行剪枝操作, 所述剪枝操作为根 据路径和问句的相似度得分对所有路径进行降序排序, 保留前 K个路径, K表示超参数束宽; 根据剪枝后的K个上一跳路径搜索下一跳路径, 计算相似度得分, 进行剪枝操作, 重复 该步骤, 直至 搜索跳数达 到预设阈值; 从最终得到的路径集 合中, 筛选出相似度得分最高的目标路径。 8.一种路径推理模型的训练装置, 其特 征在于, 包括: 候选路径获取模块, 用于从知识库中搜索与问句 相关的主题实体的所有候选路径{G}; 正例样本集构建模块, 用于构建正例样本集 其中, 为第i跳的正确子路径, 即第i跳正例样本, i∈1. ..n, n为全局正确路径对应的跳数; 负例样本集构建模块, 用于为所述第i跳正例样本构建对应的第i跳负例样本集 所述第i跳负例样本集中的元 素为第i跳负例样本; 训练模块, 用于利用所述第 i跳正例样本和所述第 i跳负例样本集训练所述路径推理模 型。 9.根据权利要求8所述的路径推理模型的训练装置, 其特征在于, 应用于知识图谱问答 系统。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有计算机 程序, 所述计算机程序被处理器执行时实现如权利要求 1至7任一项 所述的一种路径推理模 型的训练方法的步骤。权 利 要 求 书 2/2 页 3 CN 115438193 A 3

.PDF文档 专利 一种路径推理模型的训练方法及路径推理方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种路径推理模型的训练方法及路径推理方法 第 1 页 专利 一种路径推理模型的训练方法及路径推理方法 第 2 页 专利 一种路径推理模型的训练方法及路径推理方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:41:08上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。