全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210967723.3 (22)申请日 2022.08.12 (71)申请人 深圳太极数智技 术有限公司 地址 518000 广东省深圳市福田区梅林街 道梅都社区中康路136号深圳新一代 产业园3栋1402 (72)发明人 陈昭 巩福 黄鼎 李晓琼  (74)专利代理 机构 深圳中一联合知识产权代理 有限公司 4 4414 专利代理师 甘莹 (51)Int.Cl. G06K 9/62(2022.01) G06F 40/295(2020.01) G06Q 50/26(2012.01) (54)发明名称 投诉举报对象识别方法、 装置、 设备及存储 介质 (57)摘要 本申请适用于数据处理技术领域, 提供一种 投诉举报 对象识别方法、 装置、 设备及存储介质, 其中投诉举报 对象识别方法包括: 获取投诉举报 数据集; 两两计算投诉举报数据集中每两条投诉 举报数据之间的第一相似度; 将第一相似度大于 预设相似度阈值的投诉举报数据合并为相同对 象数据集; 计算相同对象数据集与预设对象集中 每个预设对象之间的匹配度; 将与相同对象数据 集匹配度最高的预设对象作为目标投诉举报对 象。 本申请能够节省传统人工提取投诉举报对象 的时间, 提高投诉举报对象提取的时效性、 便捷 性。 权利要求书2页 说明书9页 附图6页 CN 115374846 A 2022.11.22 CN 115374846 A 1.一种投诉举报对象识别方法, 其特 征在于, 包括: 获取投诉举报数据集; 两两计算所述投诉举报数据集中每两条投诉举报数据之间的第一相似度; 将所述第一相似度大于预设相似度阈值的所述投诉举报数据合并为相同对象数据集; 计算所述相同对象数据集与预设对象集中每 个预设对象之间的匹配度; 将与所述相同对象数据集匹配度最高的所述预设对象作为目标投诉举报对象。 2.如权利要求1所述的投诉举报对象识别方法, 其特征在于, 所述两两计算所述投诉举 报数据集中每两条投诉举报数据之间的第一相似度, 包括: 提取每条 所述投诉举报数据的对象名称、 地址和人名; 分别两两计算每两条所述投诉举报数据之间的第 一对象名称相似度、 第 一地址相似度 和第一人名相似度; 将所述第一对象名称相似度、 所述第一地址相似度和所述第一人名相似度相加, 得到 所述第一相似度。 3.如权利要求1所述的投诉举报对象识别方法, 其特征在于, 获取所述预设相似度阈值 的步骤, 包括: 获取对象识别验证数据集; 两两计算所述对象识别验证数据集中每两条对象识别验证数据之间的第二相似度; 两两评价所述对象识别验证数据集中每两条对象识别验证数据 是否属于相同对象, 得 到评价结果; 根据所述第二相似度与所述评价结果, 得到所述预设相似度阈值。 4.如权利要求3所述的投诉举报对象识别方法, 其特征在于, 所述获取对象识别验证数 据集, 包括: 获取第一投诉举报文本数据集与对象识别开源数据集; 提取所述第一投诉举报文本数据集的对象名称、 地址和人名; 将所述第一投诉举报文本数据集的对象名称、 地址和人名替换进所述对象识别开源数 据集的对应位置, 得到第二投诉举报文本数据集; 将所述第二投诉举报文本数据集、 所述预设对象集和所述对象识别开源数据集合并, 得到所述对象识别验证数据集。 5.如权利要求3所述的投诉举报对象识别方法, 其特征在于, 所述两两计算所述对象识 别验证数据集中每两条对象识别验证数据之间的第二相似度, 包括: 提取每条 所述对象识别验证数据的对象名称、 地址和人名; 分别两两计算每两条所述对象识别验证数据之间的第 二对象名称相似度、 第 二地址相 似度和第二人名相似度; 将所述第二对象名称相似度、 所述第二地址相似度和所述第二人名相似度相加, 得到 所述第二相似度。 6.如权利要求3所述的投诉举报对象识别方法, 其特征在于, 所述根据 所述第二相似度 与所述评价结果, 得到所述预设相似度阈值, 包括: 设置相似度阈值; 根据所述第 二相似度与所述相似度阈值, 两两判断所述对象识别验证数据集中每两条权 利 要 求 书 1/2 页 2 CN 115374846 A 2对象识别验证数据是否属于相同对象, 得到判断结果; 计算所述判断结果与所述评价结果相同的概 率; 在所述概率不大于预设概 率时, 重新设置所述相似度阈值; 返回执行所述根据所述第 二相似度与所述相似度阈值, 两两判断所述对象识别验证数 据集中每两条对 象识别验证数据是否属于相同对 象, 得到判断结果的步骤, 直至所述概率 大于所述预设概 率; 将所述概率大于所述预设概 率时的所述相似度阈值作为所述预设相似度阈值。 7.如权利要求1所述的投诉举报对象识别方法, 其特征在于, 所述计算所述相同对象数 据集与预设对象集中每 个预设对象之间的匹配度, 包括: 分别提取所述相同对象数据集中每条所述投诉举报数据, 以及所述预设对象集中每个 所述预设对象的对象名称、 地址和人名; 根据所述相同对象数据集中每条所述投诉举报数据, 以及所述预设对象集中每个所述 预设对象的对象名称、 地址和人名, 分别计算所述相同对 象数据集中每条所述投诉举报数 据与所述预设对象集之间的相似度矩阵; 根据所述相似度矩阵, 计算所述相同对象数据集与所述预设对象集中每个所述预设对 象之间的所述匹配度。 8.一种投诉举报对象识别装置, 其特 征在于, 包括: 数据获取模块, 用于获取投诉举报数据集; 相似计算模块, 用于两两计算所述投诉举报数据集中每两条投诉举报数据之间的第 一 相似度; 数据合并模块, 用于将所述第 一相似度大于预设相似度阈值的所述投诉举报数据合并 为相同对象数据集; 匹配计算模块, 用于计算所述相同对象数据集与 预设对象集中每个预设对象之间的匹 配度; 目标获取模块, 用于将与 所述相同对象数据集匹配度最高的所述预设对象作为目标投 诉举报对象。 9.一种终端设备, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器上 运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求1至7 任一项所述的投诉举报对象识别方法。 10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在 于, 所述计算机程序被处理器执行时实现如权利要求 1至7任一项 所述的投诉举报对象识别 方法。权 利 要 求 书 2/2 页 3 CN 115374846 A 3

PDF文档 专利 投诉举报对象识别方法、装置、设备及存储介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 投诉举报对象识别方法、装置、设备及存储介质 第 1 页 专利 投诉举报对象识别方法、装置、设备及存储介质 第 2 页 专利 投诉举报对象识别方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:41:22上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。