全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210518796.4 (22)申请日 2022.05.13 (71)申请人 中铁西北 科学研究院有限公司 地址 730000 甘肃省兰州市城关区民主东 路365号 (72)发明人 吴红刚 陈浩 袁中夏 孔庆祥  袁荣涛 康万鹏 李永强 张俊德  王永翔 赖国泉 张良峰 朱兆荣  赵守全 程飞 杨景川 黄强斌  游朝勇 王涛 李亮 尹威江  冯文强 张乾翼 任庆钊 王德双  (74)专利代理 机构 兰州智和专利代理事务所 (普通合伙) 62201 专利代理师 周立新(51)Int.Cl. G06V 10/44(2022.01) G06V 10/25(2022.01) G06V 10/762(2022.01) G06N 20/00(2019.01) (54)发明名称 一种应用 于数据曲线过渡阶段的特征提取 及界限识别方法 (57)摘要 本发明公开了一种应用于数据曲线过渡阶 段的特征提取及界限识别方法, 本发 明属于数据 分析技术领域。 采用数据切割的方法剔除无关数 据, 保留目标区间的数据, 并将目标区间的数据 转换为散点图, 运用K ‑Means算法对目标区间的 数据进行聚类 分析确定主要区间, 进而运用数学 方法对主要区间的数据进行运算, 确定数据变化 阶段的界限值。 本发明的步骤包括: 1) 绘制数据 曲线; 2) 确定 特征的目标区间; 3) 数据切割; 4) K ‑ Means数据分类; 5) 确定 特征界限。 本发明根据数 据曲线的变化特点, 采用数据切割的方式保留重 要信息, 放大数据的关键 特征, 进而引入K ‑Means 算法对重要信息进行深入筛选, 由筛选结果确定 数据的特征界限, 完成数据曲线关键特征的提 取。 权利要求书1页 说明书4页 附图4页 CN 115170820 A 2022.10.11 CN 115170820 A 1.一种应用于数据曲线过渡阶段的特征提取及界限识别方法, 其特征在于, 包括以下 步骤: 1) 绘制数据曲线: 导入试验数据, 按照试验数据类型和试验要求绘制试验数据对应的 数据曲线图; 2) 确定特征的目标区间: 根据数据曲线特性分析步骤1) 绘制的数据曲线图, 划定数据 曲线拐点、 上升、 下降或其他关键节 点的特征数据所在的变化区间, 将 变化区间作为目标区 间; 3) 数据切割: 择取步骤2) 确定的目标区间, 根据该目标区间内数据曲线 的波动趋势和 波动幅度, 划分上、 下水平分界线或左、 右垂直分界线, 确保特征数据位于两条分界线划定 的区间内; 4) K‑Means数据分类: 将步骤3) 两条分界线所围成的数据曲线转化为直角坐标散点图, 并根据散点图中数据点的分布密集程度确定 分类数量K的数值, 然后采用K ‑Means算法对散 点图进行聚类; 通过K‑Means算法聚类, 确定散点密度最大的一类数据, 并将该类数据所对应的分布区 间作为核心目标区间, 对比所述核心目标区间和步骤2) 划定的目标区间; 若核心目标区间 的大部或全部落至目标区间内, 则进行下一步; 若核心目标区的大部或全部未落至目标区 间内, 则调整K值大小再次进行聚类, 直至核心目标区间的大部或全部落至目标区间内, 再 进行下一步; 5) 确定特征界限: 对步骤4) 确定的核心目标 区间内的数据进行数学分析获取数据曲线 的特征界限, 求取核心目标区间内的各个散点对应的横轴或纵轴 数据值的平均值, 平均值 即为横向或纵向的特 征界限。 2.根据权利要求1所述的一种应用于数据曲线过渡阶段的特征提取及界限识别方法, 其特征在于, 所述步骤3) 在划分分 界线之前, 首先对目标区间内数据曲线进 行数据处理, 加 大目标区间内数据曲线的变化频率或变化幅度, 并绘制数据 处理后的曲线图, 再对数据 处 理后的曲线图划分 分界线。 3.根据权利要求2所述的一种应用于数据曲线过渡阶段的特征提取及界限识别方法, 其特征在于, 所述数据处 理的方法为 求导、 作差或积分处 理。权 利 要 求 书 1/1 页 2 CN 115170820 A 2一种应用于数据曲线 过渡阶段的特征提取及界限识别方 法 技术领域 [0001]本发明属于数据处理技术领域, 具体涉及 一种应用于数据曲线过渡阶段的特征提 取及界限识别方法。 背景技术 [0002]在实际数据分析中, 为方便研究试验数据, 往往需要将采集的数据绘制成可视化 曲线, 对于数据曲线变化趋势的判断和重要 特征的提取是研究分析的重要内容。 其中, 曲线 过渡区段通常是不同变化阶段划分的重要依据。 因此, 如何提取过渡阶段的数据变化特征、 确定不同阶段 的界限值在数据 处理中显得尤为重要。 然而, 在实际的数据分析过程中经常 会遇到关键特征难以提取的问题, 导致数据关键特性不易凸显、 特征界限难以确定、 影响曲 线趋势判断等问题, 不利于数据的深入挖掘。 [0003]目前, 对于数据曲线重要特征的提取主要分为两大类, 一类是是依据曲线图的变 化趋势直观划分数据的重要特征, 受人为主观因素影响大, 缺 乏系统性的数据分析作为支 撑。 另一类是构建相应的数学模型, 如分类网络、 机器学习、 深度学习, 根据自身的数据特点 通过建立标签集进行模型迭代训练, 得到优化后的模型用于数据特征提取, 这一类专利针 对性强在各自的目标领域有较为优异的表现, 但模型构建复杂且缺乏普适性不能较好地运 用于具有过渡特 征的数据曲线的特 征提取和阶段界限识别。 发明内容 [0004]本发明提供了一种应用于数据曲线过渡阶段的特征提取及界限识别方法, 目的在 于能够快速提取数据过渡特征、 识别阶段变化界限, 填补该领域内相关方法的空白, 解决现 有技术方法中对于数据过渡 特征的提取过于复杂、 效率偏低、 准确度不高的问题, 同时为准 确识别数据不同变化阶段的界限提供有效方法。 [0005]为此, 本发明采用如下技 术方案: 一种应用于数据曲线过渡阶段的特 征提取及界限识别方法, 包括以下步骤: 1) 绘制数据曲线: 导入试验数据, 按照试验数据类型和试验要求绘制试验数据对 应的数据曲线图; 2) 确定特征的目标区间: 根据数据曲线特性分析步骤1) 绘制的数据曲线图, 划定 数据曲线拐点、 上升、 下降或其他关键节点的特征数据所在的变化区间, 将 变化区间作为目 标区间; 3) 数据切割: 择取步骤2) 确定的目标区间, 根据该目标区间内数据曲线的波动趋 势和波动幅度, 划分上、 下水平分界线或左、 右垂直分界线, 确保特征数据位于两条分界线 划定的区间内; 4) K‑Means数据分类: 将步骤3) 两条分界线所围成的数据曲线转化为直角坐标散 点图, 并根据散点图中数据点的分布密集程度确 定分类数量K的数值, 然后采用K ‑Means算 法对散点图进行聚类;说 明 书 1/4 页 3 CN 115170820 A 3

PDF文档 专利 一种应用于数据曲线过渡阶段的特征提取及界限识别方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种应用于数据曲线过渡阶段的特征提取及界限识别方法 第 1 页 专利 一种应用于数据曲线过渡阶段的特征提取及界限识别方法 第 2 页 专利 一种应用于数据曲线过渡阶段的特征提取及界限识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:10:39上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。