全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210964513.9 (22)申请日 2022.08.11 (71)申请人 河海大学 地址 211100 江苏省南京市江宁区佛城西 路8号 (72)发明人 万定生 张婧玉 余宇峰  (51)Int.Cl. G06F 16/2458(2019.01) G06K 9/62(2022.01) G06Q 50/26(2012.01) (54)发明名称 一种基于极值点划分和L-K模式距离的降雨 过程相似性搜索方法及系统 (57)摘要 本发明提出了一种基于极值点划分和L ‑K模 式距离的降雨过程相似性搜索方法及系统, 属于 水文水资源与数据挖掘技术交叉领域。 首先根据 最小降雨间隔时间将雨量序列划分为多个单场 降雨序列, 然后依据滑动窗口的思想确定序列中 的重要极值点, 得到L ‑K模式序列; 定义 分段距离 以及L‑K模式距离, 基于此构建距离累积矩阵计 算单场降雨间的相似距离; 采用基于DTW距离指 标的聚类算法对 单场降雨序列进行聚类, 并根据 聚类结果标记每场降雨, 将雨量站的降雨序列转 换为模式序列, 最后基于分类距离计算雨量站点 间的相似距离。 本发明方法从单场降雨角度出 发, 更细粒度地分析降雨过程信息, 定义序列重 要极值点和L ‑K模式距离, 提供了一种降雨过程 相似性搜索方法及系统。 权利要求书4页 说明书9页 附图3页 CN 115309805 A 2022.11.08 CN 115309805 A 1.一种基于极值点划分和L ‑K模式距离的降雨过程相似性搜索方法及系统, 其特征在 于, 包括如下步骤: 步骤1: 从单个雨量站点一段时期的历史雨量数据中, 根据最小降雨间隔时间(T)将雨 量序列划分为 N个单场降雨序列; 步骤2: 对单场降雨的总雨 量进行统计分析, 删除无效降雨数据; 步骤3: 依据滑动窗口 的思想确定单场降雨时间序列中的重要极值 点; 步骤4: 根据重要极值点对单场降雨时间序列进行分段, 提取分段特征, 得到L ‑K模式序 列; 步骤5: 定义分段距离以及L ‑K模式距离, 并基于此构建距离累积矩阵计算单场降雨间 的相似距离 。 步骤6: 采用改进的K ‑means算法对待比较的两个雨 量站的所有降雨序列进行聚类。 步骤7: 根据聚类结果标记每场降雨, 将雨量站的降雨序列转换为模式序列, 最后基于 分类距离计算 雨量站点间的相似距离 。 2.根据权利要求1所述的基于极值点划分和L ‑K模式距离的降雨过程相似性搜索方法 及系统, 其特征在于: 所述步骤1中的最小降雨间隔时间(T)并没有统一的规定, 并且不同的 最小降雨间隔时间会产生不同的划分结果。 假设最小降雨间隔时间取T, 对历史雨量序列从 前向后扫描, 第一个非0值则记录为单场降雨的开始, 若扫描到连续T个0, 则扫描 结束, 认为 连续T个0之前的序列为 一次独立的降雨过程, 即单场降雨序列。 3.根据权利要求1所述的基于极值点划分和L ‑K模式距离的降雨过程相似性搜索方法 及系统, 其特征在于: 所述步骤2中的无效降雨的定义是指单场降雨量≤2mm的降雨为无效 降雨(一般不产生径流), 降雨 量>2mm的降雨为有效降雨。 4.根据权利要求1所述的基于极值点划分和L ‑K模式距离的降雨过程相似性搜索方法 及系统, 其特 征在于: 所述 步骤3中的确定 重要极值 点具体包括如下步骤: 步骤31: 设单场降雨时间序列为X=<x1, x2, ..., xn>, 且序列长度为n。 设w是用户指定的 窗口大小。 例如w=3, 则表示在数据点前三个和后三个点的范围内进行计算, 也就是(xi‑3, xi‑2, xi‑1, xi, xi+1, xi+2, xi+3)。 步骤32: 根据单场降雨序列X=<x1, x2, ..., xn>生成一个等长的0 ‑1模式序列。 算法如 下: 窗口中心从x1滑动到xn, 如果xi是窗口内 的最大值则 记为1, 如果xi是窗口内的最小值则 记为‑1, 否则记为0 。 步骤33: 根据0 ‑1模式序列来确定重要极值点。 首先, 序列的起始点和终止点是重要极 值点; 其次, 0 ‑1模式中所有不连续的1和 ‑1都是重要极值点; 连续的1和连续的 ‑1只记录首 尾为重要极值 点。 5.根据权利要求1所述的基于极值点划分和L ‑K模式距离的降雨过程相似性搜索方法 及系统, 其特征在于: 所述步骤4中的根据重要极值点对单场降雨时间序列进行分段, 具体 包括如下步骤: 步骤41: 根据重要极值点对序列分段。 也就是说, 将单场降雨时间序列X=<x1, x2, ..., xn>表示为单场降雨分段序列, 即X ’=<(x1, xa, ta), (xa, xb, tb), ..., (xm, xn, tn)>。 以(xa, xb, tb)为例, xa表示这一段的起始数据点, xb表示这一段的终止数据点, tb表示这 一段的结束时刻。权 利 要 求 书 1/4 页 2 CN 115309805 A 2步骤42: 提取每一分段的线段长度和线段斜率作为特征, 将单场降雨分段序列表示为 L‑K模式序列。 以(xa, xb, tb)为例, 其线段长度是tb‑ta, 线段斜率是 用l表示线段长度, 用k表示线 段斜率, (xa, xb, tb)就可以表示 为(la, lb)。 例如, 设单场降雨时间序列[1.5, 1, 0.5, 0.5, 1, 3.5, 6.5, 0.5, 0], 序列长度为9, 下标范 围0‑8。 取w=3, 得到0 ‑1模式序列为[1, 0, ‑1,‑1, 0, 0, 1, 0, ‑1], 因此重要极值点的下标是0, 2, 3, 6, 8; 根据重要极值点对序列进行划分, 得到单场降雨分段序列[(1.5, 0.5, 2), (0.5, 0.5, 3), (0.5, 6.5, 6), (6.5, 0, 8)]; 提取分段长度和斜率, 得到L ‑K模式序列 [(2,‑0.5), (1, 0), (3, 2), (2, ‑3.25)]。 6.根据权利要求1所述的基于极值点划分和L ‑K模式距离的降雨过程相似性搜索方法 及系统, 其特 征在于: 所述 步骤5中的分段距离, 定义如下: 以分段(2, ‑0, 5), (1, ‑3)为例, 计算 这两个分段之间的分段距离: 计算得到, 分段(2, ‑0, 5), (1, ‑3)之间的分段距离为6 。 7.根据权利要求1所述的基于极值点划分和L ‑K模式距离的降雨过程相似性搜索方法 及系统, 其特征在于: 所述步骤5中的基于 分段距离构建累积矩阵计算单场降雨间的相似距 离, 具体步骤如下: 步骤51: 设序列a长度为m, 序列b长度为n, 距离累积矩阵大小为m ×n, 记为dp[m][n]。 采 用分段距离计算两 两分段的相似距离, 函数记作LKmode()。 步骤52: 根据下面的公式计算距离累积矩阵。 距离累积矩阵的dp[ ‑1][‑1]就代表两条 时间序列间 的L‑K模式距离。 距离越小, 序列间 相似度越高。 8.根据权利要求1所述的基于极值点划分和L ‑K模式距离的降雨过程相似性搜索方法 及系统, 其特征在于: 所述步骤6中的采用改进的K ‑means算法对 所有单场降雨进行聚类, 具 体步骤如下: 步骤61: 指定聚类类别数K的初始值为MinK, MinK为2到10之间 的自然数; 指定聚类类别 数K的阈值为MaxK, MaxK为15 到30之间的自然数; 步骤62: 判断K是否小于等于预设的阈值MaxK, 如果是, 则随机从样本数据中取K个样本 点作为初始聚类中心, 转向步骤6 3, 否则转向步骤67; 这里的样本数据指的是, 对两个待比较的雨量站的历史雨量数据进行步骤1到步骤4的 处理, 得到C个单场降雨的L ‑K模式序列。 雨量站1划分出N个单场降雨, 雨量站2划分出M个单 场降雨, 即C= N+M, 每一个样本数据就是 单场降雨的L ‑K模式序列。 步骤63: 分别计算各个样本点到各聚类 中心的距离, 计算距离时采用步骤5中所述的L ‑权 利 要 求 书 2/4 页 3 CN 115309805 A 3

PDF文档 专利 一种基于极值点划分和L-K模式距离的降雨过程相似性搜索方法及系统

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于极值点划分和L-K模式距离的降雨过程相似性搜索方法及系统 第 1 页 专利 一种基于极值点划分和L-K模式距离的降雨过程相似性搜索方法及系统 第 2 页 专利 一种基于极值点划分和L-K模式距离的降雨过程相似性搜索方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:41:23上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。