全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210649487.0 (22)申请日 2022.06.08 (71)申请人 中国工商银行股份有限公司 地址 100140 北京市西城区复兴门内大街 55号 (72)发明人 张诚 吕博良 程佩哲 金驰  (74)专利代理 机构 中科专利商标代理有限责任 公司 11021 专利代理师 樊晓 (51)Int.Cl. G06F 16/23(2019.01) G06F 16/33(2019.01) G06F 40/289(2020.01) G06F 40/216(2020.01) G06F 40/242(2020.01)G06F 16/35(2019.01) (54)发明名称 搜索模型的更新方法及 装置、 电子设备和可 读存储介质 (57)摘要 本公开提供了一种搜索模型的更新方法及 装置、 电子设备和可读存储介质, 可以应用于人 工智能技术领域、 信息安全领域和金融领域。 该 搜索模型的更新方法包括: 响应于接收到针对搜 索模型的检测请求, 将检测请求中的检测文本与 搜索模型的热词库进行匹配, 得到匹配结果, 其 中, 检测文本包括搜索模型的敏感词库中的至少 一个敏感词, 热词库包括至少一个热词, 匹配结 果与至少一个热词相关联; 根据敏感词库, 对匹 配结果进行检测, 得到检测结果; 在检测结果表 征搜索模型存在漏洞的情况下, 设置更新规则; 基于更新规则, 对热词库进行更新, 以便更新搜 索模型。 权利要求书2页 说明书14页 附图4页 CN 115033581 A 2022.09.09 CN 115033581 A 1.一种搜索模型的更新方法, 包括: 响应于接收到针对所述搜索模型的检测请求, 将所述检测请求中的检测文本与所述搜 索模型的热词 库进行匹配, 得到匹配结果, 其中, 所述检测文本包括所述搜索 模型的敏感词 库中的至少一个敏感词, 所述热词库包括至少一个热词, 所述匹配结果与所述至少一个热 词相关联; 根据所述敏感词库, 对所述匹配结果进行检测, 得到检测结果; 在所述检测结果表征 所述搜索模型存在漏洞的情况 下, 设置更新 规则; 以及 基于所述更新 规则, 对所述热词库进行 更新, 以便更新所述搜索模型。 2.根据权利要求1所述的方法, 其中, 所述搜索模型还包括初始热词库, 所述初始热词 库是通过以下 方式来构建的: 获取用户输入所述搜索模型的历史搜索语句; 对所述历史搜索语句进行 过滤处理, 得到过 滤后的历史搜索语句; 对所述过 滤后的历史搜索语句进行分词处 理, 得到多个分词结果; 分别确定所述多个分词结果中两 两之间的第一相似度, 得到多个所述第一相似度; 在确定多个所述第 一相似度中存在第 一目标相似度的情况下, 统计与 所述第一目标相 似度对应的分词结果的数量; 在所述分词结果的数量超过第 一预设阈值的情况下, 将与所述第 一目标相似度对应的 分词结果确定为所述热词; 以及 根据所述热词, 构建所述搜索模型的所述初始热词库。 3.根据权利要求2所述的方法, 其中, 所述热词库是通过以下 方式来构建的: 利用所述搜索模型, 对所述敏感词库中的每个敏感词分别按照预设次数进行搜索; 以 及 在所述预设次数超过第二预设阈值的情况下, 将所述敏感词添加至所述初始热词库, 得到所述热词库。 4.根据权利要求2或3所述的方法, 其中, 所述搜索模型还包括语句库, 所述语句库是通 过以下方式来构建的: 将所述过 滤后的历史搜索语句和所述热词映射至倒排索引; 以及 根据所述倒排索引, 构建所述搜索模型的所述语句库。 5.根据权利要求4所述的方法, 其中, 所述将所述检测请求中的检测文本与 所述搜索模 型的热词库进行匹配, 得到匹配结果包括: 对所述检测文本进行处 理, 得到处 理结果; 分别确定所述处理结果与 所述热词库中每个热词之间的第 二相似度, 得到多个所述第 二相似度; 在确定多个所述第 二相似度中存在第 二目标相似度的情况下, 将与 所述第二目标相似 度对应的热词确定为匹配热词; 根据所述匹配热词和所述倒排索引, 在所述搜索模型的所述语句库中确定至少一个匹 配语句; 以及 根据所述至少一个匹配 语句, 确定所述匹配结果。 6.根据权利要求1所述的方法, 其中, 所述根据所述敏感词库, 对所述匹配结果进行检权 利 要 求 书 1/2 页 2 CN 115033581 A 2测, 得到检测结果包括: 分别确定所述匹配结果与 所述敏感词库中每个敏感词之间的第 三相似度, 得到多个所 述第三相似度; 以及 在确定多个所述第 三相似度中存在第 三目标相似度的情况下, 确定检测到搜索模型存 在漏洞。 7.根据权利要求1所述的方法, 其中, 所述更新规则包括第一更新规则和第二更新规 则; 所述基于所述更新 规则, 对所述热词库进行 更新包括: 在确定所述热词库中存在第 一类别词汇的情况下, 对属于所述第 一类别词汇的热词执 行所述第一更新 规则; 以及 在确定所述热词库中存在第 二类别词汇的情况下, 对属于所述第 二类别词汇的热词执 行所述第二更新 规则。 8.根据权利要求1所述的方法, 其中, 所述敏感词库是通过以下 方式来构建的: 通过爬虫获取用户在预设时段内输入的目标关键词, 其中, 所述目标关键词属于目标 类别, 所述目标类别包括以下至少之一: 卡 号、 账户、 密码和地址; 在所述目标关键词的数量超过第 三预设阈值的情况下, 将所述目标关键词确定为所述 敏感词; 以及 根据所述敏感词, 构建所述搜索模型的所述敏感词库。 9.一种搜索模型的更新装置, 包括: 匹配模块, 用于响应于接收到针对所述搜索模型的检测请求, 将所述检测请求中的检 测文本与所述搜索 模型的热词库进行匹配, 得到匹配结果, 其中, 所述检测文本包括所述搜 索模型的敏感词库中的至少一个敏感词, 所述热词库包括至少一个热词, 所述匹配结果与 所述至少一个热词相关联; 检测模块, 用于根据所述敏感词库, 对所述匹配结果进行检测, 得到检测结果; 设置模块, 用于在所述检测结果表征所述搜索模型存在漏洞的情况下, 设置更新规则; 以及 更新模块, 用于基于所述更新 规则, 对所述热词库进行 更新, 以便更新所述搜索模型。 10.一种电子设备, 包括: 一个或多个处 理器; 存储器, 用于存 储一个或多个指令, 其中, 当所述一个或多个指令被所述一个或多个处理器执行时, 使得所述一个或多个 处理器实现权利要求1至8中任一项所述的方法。 11.一种计算机可读存储介质, 其上存储有可执行指令, 所述可执行指令被处理器执行 时使处理器实现权利要求1至8中任一项所述的方法。 12.一种计算机程序产品, 所述计算机程序产品包括计算机可执行指令, 所述计算机可 执行指令在被执 行时用于实现权利要求1至8中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115033581 A 3

PDF文档 专利 搜索模型的更新方法及装置、电子设备和可读存储介质

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 搜索模型的更新方法及装置、电子设备和可读存储介质 第 1 页 专利 搜索模型的更新方法及装置、电子设备和可读存储介质 第 2 页 专利 搜索模型的更新方法及装置、电子设备和可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:49:36上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。