全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210561174.X (22)申请日 2022.05.23 (71)申请人 中国电子科技 集团公司第三十八研 究所 地址 230088 安徽省合肥市高新 技术开发 区香樟大道19 9号 (72)发明人 查珊珊 田富君 张燕龙 张哲昆  (74)专利代理 机构 合肥市浩智运专利代理事务 所(普通合伙) 34124 专利代理师 朱文振 (51)Int.Cl. G06F 16/2455(2019.01) G06F 16/2458(2019.01) G06F 16/22(2019.01) G06F 16/215(2019.01) (54)发明名称 基于数据挖掘的系留气球故障关联规则挖 掘方法及系统 (57)摘要 本发明提供一种基于数据挖掘的系留气球 故障关联规则挖掘方法及系统, 方法包括: 统计 系留气球子系统故障数据频次; 创建长度为1的 初始频繁集L1; 所有频繁集的超集Lk ‑1创建候选 集CK; 判断候选集中的项是否大于最小支持度; 若是, 则保留频繁项集; 判断频繁项集的置信度 是否大于最小置信度; 若是, 则判定为初步强关 联规则; 若否, 则判定为初步弱关联规则; 读取故 障时间段系留气球关重件状态数据; 数值异常 值、 正则化处理; 数据归一化处理; 互信息方法过 滤; 量化分析关联度; 挖掘故障关联规则, 量化各 子系统关联程度。 本发明解决了依赖于故障系统 经验库完整性以及数据利用率低的技 术问题。 权利要求书3页 说明书10页 附图6页 CN 115033602 A 2022.09.09 CN 115033602 A 1.一种基于数据 挖掘的系留气球故障关联规则挖掘方法, 其特 征在于, 所述方法包括: S1、 读取系留气球的运维管理系统故障数据库中的系留气球历史故障数据, 据以统计 各系留气球子系统的故障频次数据。 S2、 利用Apriori算法建立系留气球分系统挖掘模型, 以根据所述故障频次数据, 通过 预设最小支持度阈值判定断获取频繁项集, 根据所述频繁项集, 并以预设置信度为指标, 逐 层迭代搜索挖掘所述频繁项集中的项目集内部的潜在关联规则, 所述 步骤S2还 包括: S21、 根据实际情况 预设最小支持度阈值和最小置信度阈值; S22、 获取第一频繁项集L1, 以所述第一频繁项集L1自连接产生第二频繁项集L2, 以所 述第二频繁项集L2与第三频繁项集L3连接, 以产生候选集C3, 删除所述候选集中C3低于所 述最小支持度阈值的项, 循环执行本步骤, 删除所述所述候选集中低于最小支持度阈值的 项; S23、 执行所述步骤S22, 直至所述候选集为空, 当支持度不小于所述最小支持度阈值且 所述预设置信度不小于所述 最小置信度阈值时, 判定找到最大 频繁项集; S24、 根据所述 最大频繁项集确定所述潜在关联规则; S3、 采集并读取多类传感器数据中的气球状态数据, 数据类型多样且量纲不统一, 对所 述气球状态数据进 行补全、 正则化以及 归一化处理, 以统一气 球状态数据的量纲, 据以得到 关重件状态数据; S4、 评价各所述子系统中的所述关重件状态数据的特征相关性, 据以进行特征排序得 到相关性排序关重件状态数据, 以预设阈值过滤筛选所述相关性排序关重件状态数据, 以 获得强关联度特 征, 将所述强关联度特 征作为子系统 ‑关重件故障树状网路关联规则。 2.根据权利要求1所述的一种基于数据挖掘的系留气球故障关联规则挖掘方法, 其特 征在于, 所述 步骤S1包括: S11、 连接系留气球在特定时间段内的所述运维管理系 统故障数据库, 通过UDP协议传 输所述所述 运维管理系统故障数据库中的系留气球历史故障数据表; S12、 统计系留气球子系统在所述特定时间段内的故障频次。 3.根据权利要求2所述的一种基于数据挖掘的系留气球故障关联规则挖掘方法, 其特 征在于, 所述步骤S12中的所述系留气球子系统包括: 球体结构分系统、 地面系留设施分系 统、 测控分系统、 地 面保障系统、 系留缆绳、 压调分系统及电源分系统。 4.根据权利要求1所述的一种基于数据挖掘的系留气球故障关联规则挖掘方法, 其特 征在于, 所述 步骤S22还包括: S221、 第k‑1次找到所述频繁项集 k‑1的项集Lk‑1,据以产生 k‑候选项集 合Ck; S222、 确定所述 k‑候选项集 合Ck中每项的所述支持度; S223、 删除所述 k‑候选项集 合Ck中低于所述 最小支持度阈值的项。 5.根据权利要求1所述的一种基于数据挖掘的系留气球故障关联规则挖掘方法, 其特 征在于, 所述 步骤S23还 包括: S231、 找出k ‑频繁项集 Lk,直至所述 候选集Ck 为空集; S232、 判断是否支持度不小于所述最小支持度阈值且所述预设置信度不小于所述最小 置信度阈值; S233、 若是, 则判定找到所述 最大频繁项集;权 利 要 求 书 1/3 页 2 CN 115033602 A 2S234、 若否, 则持续执 行所述步骤S231至所述 步骤S233。 6.根据权利要求1所述的一种基于数据挖掘的系留气球故障关联规则挖掘方法, 其特 征在于, 所述 步骤S3包括: S31、 读取并通过UD P协议传输分系统故障相同时间段的所述气球 状态数据; S32、 对所述气球 状态数据中各分系统原 始状态数据的缺失值进行补全; S33、 采用python正则表达式从所述各分系统原始状态数据中提取状态参数值, 合并坐 标数据, 以得到正则化气球数据; S34: 以下述最大最小归一化逻辑处理所述正则化气球数据, 以统一所述正则化气球数 据的量纲: 其中ximin表示数据集Xij中的最小值, ximax表示数据集Xij中的最大值, xin为归一化的值。 7.根据权利要求1所述的一种基于数据挖掘的系留气球故障关联规则挖掘方法, 其特 征在于, 所述 步骤S4包括: S41、 利用预置 逻辑计算所述关重件状态数据, 以获取关重件故障因素间互信息值; S42、 处理所述关重件故障因素间互信息值, 以量化关重件故障因素之间的关联程度, 滤除低于所述预设阈值的弱关联因素, 以获得 所述关重件故障因素之间的强关联规则; S43、 处理所述关重件故障因素之间的强关联规则, 据以验证补充所述潜在关联规则, 以获取所述子系统 ‑关重件故障树状网路关联规则。 8.根据权利要求7所述的一种基于数据挖掘的系留气球故障关联规则挖掘方法, 其特 征在于, 所述 步骤S41包括: S411、 以预置导入逻辑从sk learn工具中导入度量指标 数据metrics; S412、 调用mutual_i nfo_score, 以下述逻辑计算所述关重件故障因素间互信息值: 其中A,B分别为给定 的随机变量, p(a)为离散随机变量A的边缘分布概率, p(b)为离散 随机变量B的边 缘分布概 率, p(a)p(b)为上述离 散随机变量A、 B的联合 概率分布p(a,b)。 9.根据权利要求7所述的一种基于数据挖掘的系留气球故障关联规则挖掘方法, 其特 征在于, 所述 步骤S42包括: S421、 量化关重件故障因素之间的关联程度, 设定阈值为4.0, 以过滤筛选低于阈值的 弱关联因素; S422、 获得所述关重件故障因素之间的所述强关联规则。 10.一种基于数据挖掘的系留气球故障关联规则挖掘系统, 其特征在于, 所述系统包 括: 故障频次统计模块, 用以读取系留气球的运维管理系统故障数据库中的系留气球历史 故障数据, 据以统计各系留气球子系统的故障频次数据。 挖掘模型建立模块, 用以利用Apriori算法建立系留气球分系统挖掘模型, 以根据所述 故障频次数据, 通过预设最小支持度阈值判定断获取频繁项集, 根据所述频繁项集, 并以预 设置信度为指标, 逐层迭代搜索挖掘所述频繁项集中的项目集内部的潜在关联规则, 所述权 利 要 求 书 2/3 页 3 CN 115033602 A 3

.PDF文档 专利 基于数据挖掘的系留气球故障关联规则挖掘方法及系统

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于数据挖掘的系留气球故障关联规则挖掘方法及系统 第 1 页 专利 基于数据挖掘的系留气球故障关联规则挖掘方法及系统 第 2 页 专利 基于数据挖掘的系留气球故障关联规则挖掘方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 00:13:54上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。