全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211355375.0 (22)申请日 2022.11.01 (71)申请人 杭州一知智能科技有限公司 地址 311200 浙江省杭州市萧 山区启迪路 198号杭州湾信息 港F座7楼 (72)发明人 王海涛 姜兴华 陈煦  (74)专利代理 机构 杭州求是专利事务所有限公 司 33200 专利代理师 郑海峰 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/33(2019.01) G06F 16/35(2019.01) G06F 40/211(2020.01) G06K 9/62(2022.01) (54)发明名称 一种意图识别方法、 系统、 电子设备和存储 介质 (57)摘要 本发明公开了一种意图识别方法、 系统、 电 子设备和存储介质, 属于意图识别领域。 收集目 标场景下的目标意图语料库和非目标意图语料 库; 训练双头意图识别模型, 输出各语料对应的 特征一和特征二; 获取语料的句特征, 计算各类 目标意图对应语料的句特征的类内期望向量和 类内协方差矩阵, 作为各类目标意图的意图簇; 计算语料的句特征与各类目标意图的意图簇的 最近距离, 将最近距离作为对应语料的特征三; 拼接特征一、 特征二和特征三, 根据总特征训练 第三分类器; 由双头意图识别模型、 类内期望向 量和类内协方差矩阵计算待识别语料的总特征, 进而得到意图识别结果。 本发明在加强对非目标 意图识别的同时, 提高了模型的目标识别结果, 鲁棒性高, 适用范围广。 权利要求书2页 说明书9页 附图5页 CN 115408509 A 2022.11.29 CN 115408509 A 1.一种意图识别方法, 其特 征在于, 包括: 收集目标场景 下的目标意图语料库和非目标意图语料库; 利用目标意图语料库和非目标意图语料库训练双头意图识别模型, 由训练好的双头意 图识别模型输出二分类置信度和多分类置信度, 分别作为各语料对应的特 征一和特 征二; 获取目标意图语料和非 目标意图语料的句特征, 计算各类目标意图对应语料的句特征 的类内期望 向量和类内协方差矩阵, 作为各类目标意图的意图簇; 计算 目标意图语料和非 目标意图语料中每一条语料的句特征与各类目标意图的意图簇的最近距离, 将最近距离作 为对应语料的特 征三; 拼接特征一、 特征二和特征三, 将各语料的特征拼接结果作为对应语料的总特征, 构建 正负样本训练第三分类 器; 根据所述的双头意图识别模型、 类 内期望向量和类 内协方差矩阵计算待识别语料的总 特征作为训练好的第三分类器的输入, 得到待识别语料 的意图识别结果; 若识别结果为其 他意图, 则将第三分类器的识别结果作为最 终识别结果输出; 若识别结果为目标意图, 则根 据双头意图识别模型输出的多分类置信度得到最终识别结果输出。 2.根据权利要求1所述的意图识别方法, 其特征在于, 所述的目标意图语料库和非 目标 意图语料库的构建方法为: 从目标场景下的总语料库中筛选目标意图, 根据目标意图从总语料库中随机采样得到 目标意图语料库; 采用目标意图语料库训练弱分类器, 利用弱分类器识别目标场景下的总语料库, 按比 例筛选置信度低于第一阈值和高于第二阈值的语料进 行人工标注真实意图, 若真实意图不 属于目标意图, 则人工标注为其他意图; 筛选出人工标注为其他意图的语料进 行聚类处理, 取各聚类簇中距离 簇中心最近的m条语料并进行 数据扩充, 组成非目标意图语料库。 3.根据权利要求1所述的意图识别方法, 其特征在于, 所述的双头意图识别模型由意图 特征编码器、 第一分类器和第二分类器构成, 所述的意图特征编码器用于编码语料 的句特 征; 所述的第一分类器用于将语料 的句特征分类为 目标意图和非目标意图两类, 将分类概 率作为对应语料的特征一, 第二分类器用于将语料的句特征分类为 非目标意图和具体所属 的目标意图类型, 将分类概 率作为对应 语料的特 征二。 4.根据权利要求3所述的意图识别方法, 其特征在于, 所述的目标意图语料和非 目标意 图语料的句特 征是由训练好的双头意图识别模型中的意图特 征编码器进行编码后得到的。 5.根据权利要求3所述的意图识别方法, 其特征在于, 所述的特征二取自第 二分类器输 出的分类概 率中概率最高的K个概 率值。 6.根据权利要求3所述的意图识别方法, 其特征在于, 所述的双头意图识别模型的训练 过程包括: 从目标意图语料库和非目标意图语料库中随机抽取b1个例句, 通过意图特征编码器编 码b1个例句的句特 征, 将各例 句所属的意图类型作为标签; 合成句特征: 从b1个例句对应的句特征中随机抽取至少包含2种意图类 型的a个句特征, 将a个句特征的平均值作为合成句特征, 所述合成句特征的标签设为其他意图; 循环执行b2 次合成句特 征的操作; 利用第一分类器和第二分类器对b1个例句的句特征以及b2个合成句特征进行分类, 根权 利 要 求 书 1/2 页 2 CN 115408509 A 2据分类结果和标签 计算分类损失, 对双头意图识别模型进行训练。 7.根据权利要求1所述的意图识别方法, 其特征在于, 所述的计算目标意图语料和非 目 标意图语料中每一条语料的句特 征与各类目标意图的意图簇的最近距离, 计算公式为: 其中, f3,i表示第i个样本语料对应的特征三, zi表示第i个样本语料的句特征, 是第j 类目标意图对应语料的句特征的类内期望向量, 是第j类目标意图对应语料的句特征的 类内协方差矩阵, c是目标意图的种类数, 上角标T表示 转置。 8.一种意图识别系统, 其特 征在于, 包括: 语料库获取模块, 其用于收集目标场景 下的目标意图语料库和非目标意图语料库; 双头意图识别模型构建及训练模块, 其用于利用目标意图语料库和非 目标意图语料库 训练双头意图识别模型, 由训练好的双头意图识别模型输出二分类置信度和多分类置信 度, 分别作为各语料对应的特 征一和特 征二; 意图簇构建及距离计算模块, 其用于获取目标意图语料和非目标意图语料的句特征, 计算各类目标意图对应语料的句特征的类内期 望向量和类内协方差矩阵, 作为各类目标意 图的意图簇; 计算目标意图语料和非目标意图语料中每一条语料的句特征与各类目标意图 的意图簇的最近距离, 将最近距离作为对应 语料的特 征三; 第三分类器构建及训练模块, 其用于拼接双头意图识别模型构建及训练模块得到的特 征一、 特征二、 以及意图簇构建及距离计算模块得到的特征三, 将各语料的特征拼接结果作 为对应语料的总特 征, 构建正负 样本训练第三分类 器; 意图识别模块, 其用于获取待识别语料的总特征, 并利用训练好的第三分类器得到待 识别语料 的意图识别结果; 若识别结果为其他意图, 则将第三分类器的识别结果作为最终 识别结果输出; 若识别结果为 目标意图, 则根据双头意图识别模型输出 的多分类置信度得 到最终识别结果输出。 9.一种电子设备, 其特征在于, 包括处理器和存储器, 所述存储器存储有能够被所述处 理器执行 的机器可执行指令, 所述处理器执行所述机器可执行指令以实现权利要求1 ‑7任 一项所述的意图识别方法。 10.一种机器可读存储介质, 其特征在于, 该机器可读存储介质存储有机器可执行指 令, 该机器可执行指 令在被处理器调用和执行时, 用于实现权利要求 1‑7任一项所述的意图 识别方法。权 利 要 求 书 2/2 页 3 CN 115408509 A 3

PDF文档 专利 一种意图识别方法、系统、电子设备和存储介质

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种意图识别方法、系统、电子设备和存储介质 第 1 页 专利 一种意图识别方法、系统、电子设备和存储介质 第 2 页 专利 一种意图识别方法、系统、电子设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:39:59上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。