全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211325456.6 (22)申请日 2022.10.27 (71)申请人 之江实验室 地址 311100 浙江省杭州市余杭区中泰街 道之江实验室南湖总部 (72)发明人 李月标 谭一匡 王梁昊 张灵箭  郭坤龙 王娱  (74)专利代理 机构 杭州浙科专利事务所(普通 合伙) 33213 专利代理师 孙孟辉 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/335(2019.01) G06F 16/338(2019.01) G06F 40/279(2020.01)G06F 16/33(2019.01) (54)发明名称 一种基于多路召回的多场景智能问答方法 和系统 (57)摘要 本发明涉及人工智能领域, 尤其是涉及一种 基于多路召回的多场景智能问答方法和系统, 该 方法包括: 步骤S100: 用户提出 实时问题, 并将问 题同时输入到多路模型进行问题检索和任务识 别, 召回各路模 型检索到的带有相似度的第一候 选问题列表; 步骤S200: 将多路模型返回的第一 候选问题列表进行归并, 并按照相似度进行排 序, 生成第二候选问题列表; 步骤S300: 从第二候 选问题列表中, 根据阈值获得T op1或者T opk问题 列表, 生成回答响应用户。 本发明可以进一步提 升在多场景问答场景下的召回精度; 同时基于多 路召回的机制, 满足多路模型并发运行的要求, 提升运行效率。 权利要求书2页 说明书9页 附图6页 CN 115470338 A 2022.12.13 CN 115470338 A 1.一种基于多路召回的多场景智能问答方法, 其特 征在于, 包括以下步骤: 步骤S100: 用户提出实时问题, 并将问题同时输入到多路模型进行问题检索和任务识 别, 召回各路模型检索到的带有相似度的第一 候选问题列表; 步骤S200: 将多路模型返回的第一候选问题列表进行归并, 并按照相似度进行排序, 生 成第二候选问题列表; 步骤S300: 从第二候选问题列表中, 根据阈值获得Top1或者Topk问题列表, 生成回答响 应用户。 2.如权利要求1所述的一种基于多路召回的多场景智能问答方法, 其特征在于, 所述多 路模型进 行的问题检索和任务识别为并行计算, 多路模型具体包括: 基于 关键字检索 模型、 基于语义检索模型、 任务识别模型, 所述的基于关键字检索模型和基于语义检索模型用于 FAQ问答场景, 任务识别模型用于任务型问答场景。 3.如权利要求2所述的一种基于多路召回的多场景智能问答方法, 其特征在于, 所述基 于关键字检索 模型对输入的问题进行关键字检索, 获得基于关键字召回的带有相似度的候 选问题列表, 具体包括以下步骤: 步骤S111, 去除输入的问题中的停顿词并对问题进行分词处 理; 步骤S112, 通过Elasticsearc h搜索引擎对问题进行检索; 步骤S113, 召回Top  k 的最相关问题列表; 步骤S114, 计算用户输入 的问题与步骤S113中的召回的问题的相似度, 获得基于关键 字召回的带有相似度的候选问题列表。 4.如权利要求3所述的一种基于多路召回的多场景智能问答方法, 其特征在于, 所述步 骤S114, 具体包括以下子步骤: 步骤S1141, 将用户输入的问题通过  Sentence ‑BERT模型进行句子编码, 生成一个句向 量, 用Q1表示; 步骤S1142, 将召回列表中的k个问题, 通过  Sentence ‑BERT模型进行句子编码, 生成k 个句向量, 用Pi(i=1,2,3 …,k)表示; 步骤S1143, 采用余弦相似度计算方法, 计算Q1与Pi之间的相似度, 用SKi(i=1,2,3 …, k)表示, 获得基于关键 字召回的带有相似度的候选问题列表。 5.如权利要求3所述的一种基于多路召回的多场景智能问答方法, 其特征在于, 所述基 于语义检索模型对输入的问题进行语义检索, 获得基于语义检索的召回问题列表, 具体包 括以下步骤: 步骤S121, 将用户输入的问题, 通过  Sentence ‑BERT模型进行问题句子的语义编码, 生 成语义编码向量; 步骤S122, 利用生成的语义编码向量, 通过Milvus向量搜索引擎进行查询, 采用归一化 的向量内积法计算向量相似度, 返回相似度最高的Top  k 个相似向量 ID; 步骤S123, 利用召回的Top  k个相似向量ID, 进一步获取问题列表, 具体为: 与步骤S122 同步进行通过Sentence ‑BERT模型对问题进行句向量编码, 并将句向量存储于 Elasticsearc h搜索引擎, 检索时采用余弦相似度计算方法进行相似度计算; 将Elasticsearch搜索引擎的检索结果与Milvus向量搜索引擎的检索结果进行合并后 的问题列表作为基于语义检索的召回问题列表。权 利 要 求 书 1/2 页 2 CN 115470338 A 26.如权利要求5所述的一种基于多路召回的多场景智能问答方法, 其特征在于, 所述任 务识别模型对输入的问题进行任务识别, 获取召回的任务, 具体包括以下步骤: 步骤S131, 采用规则模板的方法对输入的问题进行意 图识别, 获取到与规则模板匹配 度最大的意图; 步骤S132, 针对带有槽位的意图, 进行槽位 填充; 步骤S133, 如果遇到当前意图仍旧缺槽位, 则通过多轮对话管理即多轮提问的方式, 获 得槽位; 步骤S134, 返回召回的意图, 即Top  1任务。 7.如权利要求6所述的一种基于多路召回的多场景智能问答方法, 其特征在于, 所述采 用规则模板的方法对输入的问题进行意图识别, 具体为: 通过人工分析每个意图下 的有代 表性的例句, 总结出规则模板, 然后 将用户的输入问句进 行分词、 词性标注、 命名实体识别、 依存句法分析、 语义分析 的操作后套用所述的规则模板, 当与所述规则模板匹对的某个规 则模板达到所设阈值之后就认为该输入问句就属于所总结 出的规则模板对应的意图。 8.如权利要求6所述的一种基于多路召回的多场景智能问答方法, 其特征在于, 所述步 骤S200, 具体为: 将所述的基于关键字召回的带有相似度的候选问题列表和 基于语义检索 的召回问题列表合并, 并进行去重后, 再合并任务识别模型召回的任务, 按照相似度从 高到 低进行排序, 生成第二 候选问题列表。 9.如权利要求8所述的一种基于多路召回的多场景智能问答方法, 其特征在于, 所述步 骤S300, 具体为: 在所述第二候选问题列表中, 当排序后Top1  问题为任务型问答场景时, 若相似度大于 第一阈值, 则执 行召回的问题对应的任务, 响应用户; 若相似度小于等于第 一阈值, 则将所述第 二候选问题列表中相似度大于第 二阈值的最 多前10个问题进行返回, 作为用户的推荐问题; 当排序后Top1  问题为FAQ问答场景, 若相似度大于第三阈值: 则直接返回输入 的问题 对应的回答, 响应用户; 同时将剩余的第二候选 问题列表中相似度大于第二阈值的最多前 10个问题, 作为用户的推荐问题; 若相似度小于等于第 三阈值, 则将所述第 二候选问题列表中相似度大于第 二阈值的最 多前10个问题, 作为用户的推荐问题。 10.一种采用权利要求1至9任一一项所述的基于多路召回的多场景智能问答方法的系 统, 其特征在于, 包括: 多路模型召回模块: 用于接收用户提出的实时问题, 并将问题同时输入到多路模型进 行问题检索和任务识别, 召回多路模型检索到的带有相似度的第一候选 问题列表; 所述多 路模型召回模块支持分布式部署; 归并排序模块: 用于将多路模型返回的第一候选问题列表进行归并, 并按照相似度进 行排序, 生成第二 候选问题列表; 执行模块: 用于从第二候选问题列表中, 根据 阈值获得Top1  或者 TopK 问题列表, 生 成回答响应用户。权 利 要 求 书 2/2 页 3 CN 115470338 A 3

PDF文档 专利 一种基于多路召回的多场景智能问答方法和系统

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于多路召回的多场景智能问答方法和系统 第 1 页 专利 一种基于多路召回的多场景智能问答方法和系统 第 2 页 专利 一种基于多路召回的多场景智能问答方法和系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:49:08上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。