全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210897675.5 (22)申请日 2022.07.28 (71)申请人 京东科技信息技 术有限公司 地址 100176 北京市北京经济技 术开发区 科创十一 街18号院2号楼6层6 01 (72)发明人 邓坤 邹波  (74)专利代理 机构 中原信达知识产权代理有限 责任公司 1 1219 专利代理师 韩黎捷 张效荣 (51)Int.Cl. G06F 40/194(2020.01) G06F 40/211(2020.01) G06F 40/30(2020.01) G06F 16/35(2019.01) G06N 3/04(2006.01)G06N 3/08(2006.01) G06Q 30/02(2012.01) (54)发明名称 对客服会话进行重复方案检测的方法和装 置 (57)摘要 本发明公开了一种对客服会话进行重复方 案检测的方法和装置, 涉及计算机技术领域。 该 方法的一具体实施方式包括: 获取待检测客服会 话包括的会话语句集合, 所述会话语句集合包括 多个轮次会话的客户语句和客服语句; 分别计算 每两个客服语句之间的相似度, 将相似度满足设 定阈值的客服语句保存到重复方案候选集中; 对 所述重复方案候选集中的每个候选客服语句, 获 取所述候选客服语句的上下文会话, 所述上下文 会话包括客户语句和客服语句; 根据每个所述候 选客服语句的上下文会话对所述待检测客服会 话进行重复方案检测。 该实施方式在保证召回率 的前提下, 使得对重复方案的检测结果更为准 确, 极大地简化了模型, 便于进行生产部署, 提升 了客服服务质量。 权利要求书2页 说明书11页 附图3页 CN 115470771 A 2022.12.13 CN 115470771 A 1.一种对客 服会话进行重复方案检测的方法, 其特 征在于, 包括: 获取待检测客服会话包括的会话语句集合, 所述会话语句集合包括多个轮次会话的客 户语句和客 服语句; 分别计算每两个客服语句之间的相似度, 将相似度满足设定 阈值的客服语句保存到重 复方案候选集中; 对所述重复方案候选集中的每个候选客服语句, 获取所述候选客服语句的上下文会 话, 所述上 下文会话包括 客户语句和客 服语句; 根据每个所述候选客服语句的上 下文会话对所述待检测客 服会话进行重复方案检测。 2.根据权利要求1所述的方法, 其特征在于, 在 分别计算每两个客服语句之间的相似度 之前, 还包括: 将所述会话语句集合中指定的客服语句删除, 所述指定的客服语句为预设的符合业务 规则的非方案客 服语句。 3.根据权利要求1所述的方法, 其特征在于, 所述两个客服语句之间的相似度 是根据两 个客服语句之 间的最长公共子序列长度, 以及所述两个客服语句的字符串长度进 行计算得 到的。 4.根据权利要求1所述的方法, 其特征在于, 分别计算每两个客服语句之间的相似度, 将相似度满足设定阈值的客 服语句保存到 重复方案候选集中, 包括: 分别计算每两个客服语句之间的相似度, 将相似度满足设定 阈值的两个客服语句保存 到第一候选集中; 将具有交集的多个第 一候选集进行取并集操作以得到重复方案候选集, 所述重复方案 候选集中的候选客 服语句不少于三个。 5.根据权利要求4所述的方法, 其特征在于, 若所有的第一候选集都没有交集, 则所述 待检测客 服会话不包括重复方案 。 6.根据权利要求1所述的方法, 其特征在于, 根据每个所述候选客服语句的上下文会话 对所述待检测客 服会话进行重复方案检测, 包括: 根据每个所述候选客服语句的上 下文会话, 判断两 两候选客 服语句是否是重复方案; 若所述重复方案候选集中有不少于三个候选客服语句是重复方案, 则所述待检测客服 会话包括重复方案 。 7.根据权利要求6所述的方法, 其特征在于, 根据每个所述候选客服语句的上下文会 话, 判断两 两候选客 服语句是否是重复方案, 包括: 分别对两个候选客服语句的上下文会话进行特征提取得到所述两个候选客服语句的 特征向量; 将所述两个候选客服语句的特征向量分别 输入到预先训练 的第一判断单元中, 判断所 述两个候选客 服语句是否是 方案语句; 将所述两个候选客服语句的特征向量拼接后输入到预先训练的第 二判断单元中, 判断 所述两个候选客 服语句是否 重复; 若所述两个候选客 服语句是 方案语句且重复, 则所述两个候选客 服语句是重复方案 。 8.根据权利要求7所述的方法, 其特征在于, 分别对两个候选客服语句的上下文会话进 行特征提取得到所述两个候选客 服语句的特 征向量, 包括:权 利 要 求 书 1/2 页 2 CN 115470771 A 2分别对两个候选客 服语句的上 下文会话中的每句话进行编码得到句向量 集合; 将所述句向量集合输入到自然语言处理编码器中进行处理, 得到所述两个候选客服语 句的特征向量。 9.根据权利要求1所述的方法, 其特征在于, 所述上下文会话包括所述候选客服语句所 在轮次会话的客户语句和客 服语句、 以及下一轮次的客户语句。 10.一种对客 服会话进行重复方案检测的装置, 其特 征在于, 包括: 会话语句 获取模块, 用于获取待检测客服会话包括的会话语句集合, 所述会话语句集 合包括多个 轮次会话的客户语句和客 服语句; 候选语句确定模块, 用于分别计算每两个客服语句之间的相似度, 将相似度满足设定 阈值的客 服语句保存到 重复方案候选集中; 上下文会话获取模块, 用于对所述重复方案候选集中的每个候选客服语句, 获取所述 候选客服语句的上 下文会话, 所述上 下文会话包括 客户语句和客 服语句; 重复方案检测模块, 用于根据每个所述候选客服语句的上下文会话对所述待检测客服 会话进行重复方案检测。 11.一种对客 服会话进行重复方案检测的电子设备, 其特 征在于, 包括: 一个或多个处 理器; 存储装置, 用于存 储一个或多个程序, 当所述一个或多个程序被所述一个或多个处理器执行, 使得所述一个或多个处理器实 现如权利要求1 ‑9中任一所述的方法。 12.一种计算机可读介质, 其上存储有计算机程序, 其特征在于, 所述程序被处理器执 行时实现如权利要求1 ‑9中任一所述的方法。权 利 要 求 书 2/2 页 3 CN 115470771 A 3

PDF文档 专利 对客服会话进行重复方案检测的方法和装置

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 对客服会话进行重复方案检测的方法和装置 第 1 页 专利 对客服会话进行重复方案检测的方法和装置 第 2 页 专利 对客服会话进行重复方案检测的方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:08:50上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。