全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211158181.1 (22)申请日 2022.09.22 (71)申请人 中国工商银行股份有限公司 地址 100140 北京市西城区复兴门内大街 55号 (72)发明人 李梓齐 于佳瑶 姚迪 范婷婷  (74)专利代理 机构 北京康信知识产权代理有限 责任公司 1 1240 专利代理师 黄海英 (51)Int.Cl. G06F 40/242(2020.01) G06F 40/289(2020.01) G06F 16/31(2019.01) G06K 9/62(2022.01) G06Q 40/02(2012.01) (54)发明名称 投诉事件的识别方法及装置、 存储介质、 电 子设备 (57)摘要 本发明公开了一种投诉事件的识别方法及 装置、 存储介质、 电子设备。 涉及人工智能技术领 域。 其中, 该方法包括: 响应用于识别目标文本的 投诉类型的识别请求, 对目标文本进行分词处 理, 得到目标文本的词列表以及词典, 其中, 目标 文本为投诉事件生成的文本, 投诉类型至少包 括: 代理机构投诉, 非代理机构投诉, 代理机构投 诉为用户通过代理机构触发的投诉事件; 依据词 列表和词典, 确定目标文本的文本向量; 将文本 向量输入识别模 型, 输出目标文本对应的投诉类 型。 本发明解决了相关技术中通过投诉类型识别 规则判断投诉内容是否为通过代理机构进行的 投诉, 识别效率低, 准确性差的技 术问题。 权利要求书2页 说明书12页 附图5页 CN 115438651 A 2022.12.06 CN 115438651 A 1.一种投诉 事件的识别方法, 其特 征在于, 包括: 响应用于识别目标文本的投诉类型的识别请求, 对所述目标文本进行分词处理, 得到 所述目标文本的词 列表以及词典, 其中, 所述目标文本为投诉事件生 成的文本, 所述投诉类 型至少包括: 代理机构投诉, 非代理机构投诉, 所述代理机构投诉为用户通过代理机构 触发 的投诉事件; 依据所述词列表和所述词典, 确定所述目标文本的文本向量; 将所述文本向量输入识别模型, 输出 所述目标文本对应的投诉类型。 2.根据权利要求1所述的识别方法, 其特征在于, 对所述目标文本进行分词处理, 得到 所述目标文本的词列表以及词典, 包括: 通过预设分词方式对所述目标文本进行分词, 得到所述词列表; 基于所述词列表, 建立所述词列表中的每个词的词索引, 得到所述词典, 其中, 所述词 典中的每个词, 通过键值对的形式进 行存储, 所述键值对的键为词, 所述键值对的值为所述 词的词索引的索引值。 3.根据权利要求2所述的识别方法, 其特征在于, 基于所述词列表, 建立所述词列表中 的每个词的词索引, 得到所述词典, 包括: 获取初始词典以及 初始词索引的索引值; 遍历所述词列表中的每 个词; 在遍历过程中, 若存在不在所述初始词典中的目标词, 则将所述索引值加1作为所述目 标词的值, 所述目标词作为键, 组成所述 目标词的键值对, 存入所述初始词典中, 得到所述 词典。 4.根据权利要求1所述的识别方法, 其特征在于, 依据所述词列表和所述词典, 确定所 述目标文本的文本向量, 包括: 获取初始文本向量; 通过预设编码算法, 依据所述词列表和所述词典对所述初始文本向量进行处理, 得到 所述目标文本的文本向量。 5.根据权利要求1所述的识别方法, 其特 征在于, 所述识别模型通过以下 方式得到: 获取多个历史文本, 并对每个历史文本进行分词处理, 得到每个历史文本对应的目标 词列表以及目标词典, 其中, 所述历史文本为历史 投诉事件生成的文本; 依据每个历史文本对应的目标词列表以及目标词典, 对对应的历史文本进行向量化处 理, 得到每 个历史文本的历史文本向量; 将每个历史文本向量, 对应的历史文本的投诉类型作为训练标签, 输入初始识别模型, 进行模型训练, 得到所述识别模型。 6.根据权利要求5所述的识别方法, 其特征在于, 将每个历史文本向量, 对应的历史文 本的投诉类型作为训练标签, 输入初始 识别模型, 进行模型训练, 得到所述识别模型, 包括: 将多个所述历史文本向量, 以及每个历史文本向量的投诉类型, 划分为训练集和测试 集; 基于所述训练集, 通过预设交叉验证的方式对所述初始识别模型进行训练, 并通过所 述测试集对训练后的所述初始 识别模型进行测试, 得到所述识别模型。 7.根据权利要求6所述的识别方法, 其特征在于, 基于所述训练集, 通过预设交叉验证权 利 要 求 书 1/2 页 2 CN 115438651 A 2的方式对所述初始 识别模型进行训练, 包括: 获取所述初始 识别模型的预设超参数区间、 预设超参数、 以及预设步长; 将所述训练集划分为目标训练集以及验证集; 基于所述目标训练集, 所述验证集, 对所述初始识别模型进行训练, 同时通过网格搜索 算法, 在所述预设超参数区间内, 基于所述预设步长, 调整所述初始识别模型的预设超参 数。 8.一种投诉 事件的识别装置, 其特 征在于, 包括: 第一处理单元, 用于响应用于识别目标文本的投诉类型的识别请求, 对所述目标文本 进行分词处理, 得到所述目标文本的词 列表以及词典, 其中, 所述目标文本为投诉事件生成 的文本, 所述投诉类型至少包括: 代理机构投诉, 非代理机构投诉, 所述代理机构投诉为用 户通过代理机构触发的投诉 事件; 确定单元, 用于依据所述词列表和所述词典, 确定所述目标文本的文本向量; 第二处理单元, 用于将所述文本向量输入识别模型, 输出所述目标文本对应的投诉类 型。 9.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质中存储有计算机 程序, 其中, 在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行权利要 求1至7中任意 一项所述的投诉 事件的识别方法。 10.一种电子设备, 其特征在于, 包括一个或多个处理器和存储器, 所述存储器用于存 储一个或多个程序, 其中, 当所述一个或多个程序被所述一个或多个处理器执行时, 使得所 述一个或多个处 理器实现权利要求1至7中任意 一项所述的投诉 事件的识别方法。权 利 要 求 书 2/2 页 3 CN 115438651 A 3

PDF文档 专利 投诉事件的识别方法及装置、存储介质、电子设备

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 投诉事件的识别方法及装置、存储介质、电子设备 第 1 页 专利 投诉事件的识别方法及装置、存储介质、电子设备 第 2 页 专利 投诉事件的识别方法及装置、存储介质、电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:15:28上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。