全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211054217.1 (22)申请日 2022.08.31 (71)申请人 武汉思普崚技术有限公司 地址 430073 湖北省武汉市东湖新 技术开 发区光谷大道308号光谷动力节能环 保科技企业孵化器(加速器)一期11栋 3层01室 (72)发明人 邱浩  (74)专利代理 机构 北京众达德权知识产权代理 有限公司 1 1570 专利代理师 王春艳 (51)Int.Cl. G06F 11/36(2006.01) G06F 21/62(2013.01) G06K 9/62(2022.01)H04L 9/40(2022.01) H04L 67/02(2022.01) (54)发明名称 网页应用指纹信息的识别方法及相关 设备 (57)摘要 本申请实施例提供一种网页应用指纹信息 的识别方法及相关设备, 主要目的在于解决web 应用指纹识别过程中, 其中, 一些常见的指纹识 别方式, 会通过网站的特定图片文件, js文件, css样式等这样过爬虫抓取这些文件并计算md5 值, 但是在实际的应用场景中, 在使用建站系统、 框架的过程中, 对网站进行二次开发后导致上述 通过md5匹配的方法失效的问题。 其中, 上述方法 包括: 读取目标网页应用的网页信息, 提取所述 网页信息中的目标class属性信息, 基于所述目 标class属性信息通过预设属性 分类词集确定 所 述目标网页应用对应的目标网页框架, 基于所述 目标网页框架 识别所述网页应用的指纹信息 。 权利要求书2页 说明书9页 附图3页 CN 115437930 A 2022.12.06 CN 115437930 A 1.一种网页应用指纹信息的识别方法, 其特 征在于, 包括: 读取目标网页应用的网页信息; 提取所述网页信息中的目标clas s属性信息; 基于所述目标class属性信息通过预设属性分类词集确定所述目标网页应用对应的目 标网页框架; 基于所述目标网页框架 识别所述网页应用的指纹信息 。 2.根据权利要求1所述的方法, 其特 征在于, 还 包括: 遍历网页框架库; 获取不同网页框架关联的关键 class属性信息以生成所述预设属性分类词集。 3.根据权利要求2所述的方法, 其特征在于, 所述获取不同网页框架关联的关键class 属性信息以生成所述预设属性分类词集, 包括: 提取不同网页框架关联的clas s属性信息 排除不同网页框架关联的相同的clas s属性信息; 选择与其他网页框架不同的cl ass属性信息作 为每个网页框架的关键cl ass属性, 以生 成所述预设属性分类词集。 4.根据权利要求2所述的方法, 其特征在于, 所述获取不同网页框架关联的关键class 属性信息以生成所述预设属性分类词集, 包括: 通过TF‑IDF算法获取不同网页框架关联的关键cl ass属性信息以生成所述预设属性分 类词集。 5.根据权利要求1所述的方法, 其特征在于, 所述提取所述网页信息中的目标class属 性信息, 包括: 提取所述网页信息中的html文件和cs s文件中的目标clas s属性信息 。 6.根据权利要求5所述的方法, 其特征在于, 所述提取所述网页信息中的html文件和 css文件中的目标clas s属性信息, 包括: 在所述目标class属性信息的所属文件为html文件且同一class属性信息中存在至少 两个class属性内容的情况下, 将所述至少两个class属性进 行拆分以获得至少两个所述目 标class属性信息; 在所述目标class属性信息的所属文件为css文件的情况下, 提取特定标识符后的内容 作为所述目标clas s属性信息 。 7.根据权利要求5所述的方法, 其特征在于, 所述基于所述目标class属性信息通过预 设属性分类词集确定所述目标网页应用对应的目标网页框架, 包括: 获取所述目标clas s属性信息与所述预设属性分类词集的clas s属性交集; 通过KNN算法计算所述class属性交集与所述预设属性分类词集相似度, 以确定所述目 标网页应用对应的目标网页框架。 8.一种网站框架 识别的装置, 其特 征在于, 包括: 读取单元, 用于读取目标网页应用的网页信息; 提取单元, 用于提取 所述网页信息中的目标clas s属性信息; 确定单元, 用于基于所述目标class属性信息通过预设属性分类词集确定所述目标网 页应用对应的目标网页框架;权 利 要 求 书 1/2 页 2 CN 115437930 A 2识别单元, 用于基于所述目标网页框架 识别所述网页应用的指纹信息 。 9.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质包括存储的程序, 其中, 在所述程序被处理器执行时实现如权利要求1至权利要求7中任一项所述的网页应用 指纹信息的识别方法。 10.一种电子设备, 其特征在于, 所述电子设备包括至少一个处理器、 以及与所述处理 器连接的至少一个存储器; 其中, 所述处理器用于调用所述存储器中的程序指 令, 执行如权 利要求1至 权利要求7中任一项所述的网页应用指纹信息的识别方法。权 利 要 求 书 2/2 页 3 CN 115437930 A 3

PDF文档 专利 网页应用指纹信息的识别方法及相关设备

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 网页应用指纹信息的识别方法及相关设备 第 1 页 专利 网页应用指纹信息的识别方法及相关设备 第 2 页 专利 网页应用指纹信息的识别方法及相关设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:27:05上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。