全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211397238.3 (22)申请日 2022.11.09 (71)申请人 北京沃东天骏信息技 术有限公司 地址 100176 北京市北京经济技 术开发区 科创十一 街18号院2号楼4层A402室 申请人 北京京东世纪贸易有限公司 (72)发明人 王中泽 赵旭玲  (74)专利代理 机构 中原信达知识产权代理有限 责任公司 1 1219 专利代理师 冯亚娥 杨倩 (51)Int.Cl. G06F 16/25(2019.01) G06F 16/27(2019.01) G06F 17/18(2006.01) (54)发明名称 一种数据处 理方法和装置 (57)摘要 本发明公开了一种数据处理方法和装置, 涉 及电商及信息安全技术领域。 该方法的一实施方 式包括: 获取数据处理请求包括的待分析指标的 数据序列, 数据序列包括有待分析指标的对应于 多个时间点的指标数值; 将数据序列划分成多个 数组对, 数据组由一个指标数值或者多个连续变 化的时间点的指标数值构成; 根据数组对具有的 两个互补的数据组包括的指标数值, 计算数组对 的指标损失; 根据多个数组对的指标损失, 确定 指标损失最小的目标数组对; 分别确定目标数组 对中每一个数据组的异常指标数值及对应于异 常指标数值的异常行为, 将异常指标数值和异常 行为对应推送给管理端。 该实施方式有效的提高 数据异常 分析的准确性。 权利要求书3页 说明书16页 附图8页 CN 115544152 A 2022.12.30 CN 115544152 A 1.一种数据处 理方法, 其特 征在于, 包括: 接收数据处 理请求, 其中, 所述数据处 理请求包括待分析指标; 获取对应于所述待分析指标的数据序列, 其中, 所述数据序列包括所述待分析指标的 对应于多个时间点的指标 数值; 将所述数据序列包括的多个指标数值划分成多个数组对, 其中, 每一个所述数组对具 有两个互补的数据组, 每一个数据组由一个指标数值或者多个连续变化的时间点的指标数 值构成, 两个互补的数据组包括的所有指标数值与所述数据序列包括的所有指标数值一一 对应, 且两个互补的数据组所包括的指标 数值的时间点 不重叠; 针对每一个所述数组对, 根据所述数组对具有的两个互补的数据组所包括的指标数 值, 计算所述数组对的指标损失; 根据多个所述数组对的指标损失, 确定指标损失最小的目标 数组对; 分别确定所述目标数组对中每一个数据组的异常指标数值及对应于所述异常指标数 值的异常行为; 将所述异常指标 数值和所述异常行为对应 推送给管理端。 2.根据权利要求1所述的数据处理方法, 其特征在于, 所述数据处理请求还包括数据类 型; 在所述数据类型满足预设的数据处理条件的情况, 执行将所述数据序列包括的多个指 标数值划分成多个数组对的步骤。 3.根据权利要求1或2所述的数据处理方法, 其特征在于, 所述将所述数据序列包括的 多个指标 数值划分成多个数组对, 包括: 在每相邻两个时间点之间构建出初始分割点; 针对每一个所述初始分割点, 将位于所述初始分割点两侧的指标数值划分到两个互补 的数据组中, 构成一个数组对。 4.根据权利要求1所述的数据处理方法, 其特征在于, 所述计算所述数组对的指标损 失, 包括: 计算所述数组对具有的两个互补的数据组的数组均值; 针对每一个所述指标数值, 计算所述指标数值相对于其所属数据组的数组均值的方 差; 累加每一个所述指标 数值所对应的方差, 得到所述数组对的指标损失。 5.根据权利要求3所述的数据处 理方法, 其特 征在于, 还 包括: 从多个所述初始分割点中筛选出对应于最小指标损失的数组对的实际分割点, 并确定 经过所述实际分割点的直线为所述数据序列的阶梯分割线, 其中, 所述 阶梯分割线上 的每 一个点对应于所述实际分割点的时间点, 且所述阶梯分割线 上的各个点所对应的指标数值 均不相同; 所述分别确定所述目标 数组对中每一个数据组的异常指标 数值, 包括: 根据分布于所述阶梯分割 线两侧的指标数值, 分别确定分布于所述阶梯 分割线两侧的 异常指标 数值。 6.根据权利要求3所述的数据处理方法, 其特征在于, 所述在每相邻 两个时间点之间构 建出初始分割点, 包括:权 利 要 求 书 1/3 页 2 CN 115544152 A 2确定每相邻两个时间点的所述中间点 为初始分割点。 7.根据权利要求5所述的数据处 理方法, 其特 征在于, 所述确定异常指标 数值, 包括: 根据所述阶梯 分割线和分布于所述阶梯 分割线两侧的指标数值, 在所述阶梯分割 线两 侧划分出异常区域; 从所述数据 序列包括的多个指标 数值中筛 选出位于所述异常区域内的异常指标 数值。 8.根据权利要求7所述的数据处理方法, 其特征在于, 所述在所述阶梯分割 线两侧划分 出异常区域, 包括: 绘制二维坐标系, 其中, 所述二维坐标系中的一条坐标轴对应于所述数据序列中的时 间点, 另一条坐标轴对应于所述待分析指标, 所述阶梯分割线平行于所述另一条坐标轴; 按照分布于所述阶梯分割 线两侧的指标数值的均值, 在所述阶梯 分割线的两侧分别绘 制对应于均值的直线, 并绘制连接 两条所述直线的曲线; 根据绘制出的连接两条所述直线的曲线与所述实际分割线的交叉点所对应的指标数 值以及预设的异常容忍度, 确定所述阶梯分割线两侧的异常边界值; 根据所述异常边界值, 在所述阶梯分割 线的两侧分别绘制垂直于所述另一条坐标轴的 异常边界曲线; 确定所述阶梯 分割线的两侧中的每一侧的异常边界曲线为起点, 远离该侧的对应于均 值的直线的区域 为该侧的异常区域。 9.根据权利要求1所述的数据处 理方法, 其特 征在于, 所述数据处 理请求还 包括数据变更参数; 所述数据处理方法还包括: 根据所述数据变更参数, 将所述数据序列划分成多个数据 子序列, 其中, 每相邻两个数据子序列中包括有 多个重合的时间点和对应的指标 数值; 所述将所述数据序列包括的多个指标数值划分成多个数组对, 包括: 将每一个所述数 据子序列包括的多个指标 数值划分成多个数组对。 10.一种数据处理装置, 其特征在于, 包括: 接收模块、 数据分析模块以及推送模块, 其 中, 所述接收模块, 用于 接收数据处 理请求, 其中, 所述数据处 理请求包括待分析指标; 所述数据分析模块, 用于获取对应于所述待分析指标的数据序列, 其中, 所述数据序列 包括有所述待分析指标的对应于多个时间点的指标数值; 将所述数据序列包括的多个指标 数值划分成多个数 组对, 其中, 每一个所述数组对 具有两个互补的数据组, 每一个数据组由 一个指标数值或者多个连续变化的时间点的指标数值构成, 两个互补的数据组包括的所有 指标数值与所述数据序列包括的所有指标数值一一对应, 且两个互补的数据组所包括的指 标数值的时间点不重叠; 针对每一个所述数组对, 根据所述数组对具有的两个互补的数据 组所包括的指标数值, 计算所述数组对的指标损失; 根据多个所述数组对的指标损失, 确定 所述数据序列的阶梯分割线; 根据多个所述数组对的指标损失, 确定指标损失最小的目标 数组对; 分别确定所述目标数组对中每一个数据组的异常指标数值及 对应于所述异常指标 数值的异常行为; 所述推送模块, 用于将所述异常指标 数值和所述异常行为对应 推送给管理端。 11.一种电子设备, 其特 征在于, 包括: 一个或多个处 理器;权 利 要 求 书 2/3 页 3 CN 115544152 A 3

PDF文档 专利 一种数据处理方法和装置

文档预览
中文文档 28 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种数据处理方法和装置 第 1 页 专利 一种数据处理方法和装置 第 2 页 专利 一种数据处理方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:35:49上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。