全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211147620.9 (22)申请日 2022.09.21 (71)申请人 云智慧 (北京) 科技有限公司 地址 100096 北京市海淀区清河西三 旗东 路6幢2层210室 (72)发明人 雍旭龙 钟威 郑铁樵 张博  (74)专利代理 机构 北京华桐专利代理事务所 (特殊普通 合伙) 16111 专利代理师 王华兴 (51)Int.Cl. G06F 11/30(2006.01) G06F 16/31(2019.01) G06F 16/33(2019.01) G06F 16/36(2019.01) G06F 40/242(2020.01)G06F 40/289(2020.01) (54)发明名称 一种日志模式的确定方法、 装置及设备 (57)摘要 本发明的实施例提供一种日志模式的确定 方法、 装置及设备, 所述方法包括: 获取业务系统 运行中产生的至少一条日志数据; 利用日志模式 搜索引擎对 所述至少一条日志数据进行搜索, 获 得搜索结果; 所述日志模式搜索引 擎包括: 根据 预设日志模式构建的查询树和哈希表; 所述预设 日志模式是所述预设日志模式训练模型对历史 日志数据分别对应的历史日志模式进行训练得 到; 根据所述搜索结果, 确定所述至少一条日志 数据分别对应的日志模式。 本发明提供的方案, 提高了日志模式识别的准确性及效率。 权利要求书2页 说明书15页 附图8页 CN 115221013 A 2022.10.21 CN 115221013 A 1.一种日志模式的确定方法, 其特 征在于, 包括: 获取业务系统运行中产生的至少一条日志数据; 利用日志模式搜索引擎对所述至少一条日志数据进行搜索, 获得搜索结果; 所述日志 模式搜索引擎包括: 根据预设日志模式构建的查询树和哈希表; 所述预设日志模式是所述 预设日志模式训练模型对历史日志数据分别对应的历史日志模式进行训练得到; 根据所述搜索结果, 确定所述至少一条日志数据分别对应的日志模式。 2.根据权利要求1所述的日志模式的确定方法, 其特征在于, 根据 预设日志模式构建查 询树和哈希 表, 包括: 按照所述预设日志模式中的通配符, 对所述预设日志模式进行分割处理, 得到多个词 构成的词典; 将所述多个词, 按照预设规则添加到前缀 树结构中, 得到所述 查询树; 将所述多个词分别作为所述哈希表的键, 将多个词分别所属的所述预设日志模式的标 识作为所述键对应的值, 得到所述哈希 表。 3.根据权利要求2所述的日志模式的确定方法, 其特征在于, 利用日志模式搜索引擎对 所述至少一条日志数据进行搜索, 获得搜索结果, 包括: 按照所述查询树的查找规则, 查询日志数据中包含在词典里的所有词作为第 一查询结 果; 在所述哈希表中, 依次以所述第一查询结果中的词为键获取对应的值, 得到第二查询 结果; 对所述第二查询结果中的值进行合并, 得到一个元素均为日志模式标识的列表作为搜 索结果。 4.根据权利要求3所述的日志模式的确定方法, 其特征在于, 根据所述搜索结果, 确定 所述至少一条日志数据分别对应的日志模式, 包括: 获得所述搜索结果中至少一个目标值与所述预设日志模式的标识的相似度得分; 根据所述相似度得分, 确定所述预设日志模式 中的候选日志模式; 根据所述预设日志模式的正则表达式, 生成所述 候选日志模式的正则表达式; 将所述候选日志模式的正则表达式与所述日志数据进行匹配处理, 若匹配成功, 则确 定所述日志数据的模式为所述 候选日志模式。 5.根据权利要求 4所述的日志模式的确定方法, 其特 征在于, 还 包括: 若所述候选日志模式的正则表达 式与所述日志数据匹配不成功, 则将所述日志数据输 入所述预设日志模式训练模型中进行训练。 6.根据权利要求1所述的日志模式的确定方法, 其特征在于, 所述预设日志模式训练模 型对历史日志数据分别对应的历史日志模式进行训练, 得到所述预设日志模式, 包括: 按照所述历史日志数据对应的日志模式的分割符, 对所述历史日志数据进行分割, 得 到多个词; 将所述多个词中的K个关键词构成的分词序列, 配置一哈希标识; 其中, K为 正整数; 以所述哈希标识为组别, 将所述分词序列作为所述哈希标识对应的组别下的日志模 式, 获取所述哈希标识对应的组别下的每一个日志模式与所述历史日志数据对应的日志模 式的相似度, 将所述相似度大于一预设阈值时对应的所述哈希标识对应的组别下的日志模权 利 要 求 书 1/2 页 2 CN 115221013 A 2式, 确定为当前历史日志数据的预设日志模式。 7.根据权利要求6所述的日志模式的确定方法, 其特征在于, 获取所述哈希标识对应的 组别下的每一个日志模式与所述历史日志数据对应的日志模式的相似度, 包括: 通过 获取所述哈希标识对应的组别下的每 一个日志 模式与所述历史日志数据对应的日志模式的相似度; 其中, 表示相似度; 表示哈希标识组别下的第i个日志模式pat tern的利用分隔符进行分割后 的分词结果; Tokens表示历史日志数据按照分隔符分割后获得的所有词的总个数, i 为正整数; 其中: , 其中, 表示所有分词To kens中的第p个词; 表示哈希标识组别下的任一日志模式利用分隔符进行分割后获得的 总词数pat tern_words中的第q个词, p、 q均为 正整数。 8.一种日志模式的确定装置, 其特 征在于, 包括: 获取模块, 用于获取业 务系统运行中产生的至少一条日志数据; 处理模块, 用于利用日志模式搜索引擎对所述至少一条日志数据进行搜索, 获得搜索 结果; 所述日志模式搜索引擎包括根据预设日志模式构建的查询树和哈希表; 所述预设日 志模式是所述预设日志模式训练模型对历史日志数据分别对应的历史日志模式进行训练 得到; 根据所述搜索结果, 确定所述至少一条日志数据分别对应的日志模式。 9.一种计算设备, 其特征在于, 包括: 处理器、 存储器、 通信接口和通信总线, 所述处理 器、 所述存储器和所述通信接口通过所述通信总线完成相互间的通信; 所述存储器用于存 放至少一可执行指令, 所述可执行指令使所述处理器执行如权利要求1 ‑7中任一项所述的 方法对应的操作。 10.一种计算机可读存储介质, 其特征在于, 存储有指令, 所述指令在计算机上运行时, 使得计算机执 行如权利要求1至7任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115221013 A 3

.PDF文档 专利 一种日志模式的确定方法、装置及设备

文档预览
中文文档 26 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共26页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种日志模式的确定方法、装置及设备 第 1 页 专利 一种日志模式的确定方法、装置及设备 第 2 页 专利 一种日志模式的确定方法、装置及设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:39:55上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。