(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211066771.1
(22)申请日 2022.09.01
(71)申请人 合肥综合 性国家科 学中心人工智能
研究院 (安徽省人工智能实验室)
地址 230000 安徽省合肥市高新区望江西
路5089号, 中国科学技术大学先进技
术研究院未来中心B120 5-B1208
(72)发明人 许镇义 王仁军 康宇 曹洋
(74)专利代理 机构 合肥天明专利事务所(普通
合伙) 34115
专利代理师 苗娟
(51)Int.Cl.
G07C 5/08(2006.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)G06K 9/62(2022.01)
G01D 21/02(2006.01)
(54)发明名称
基于自监督表征网络的异常时序序列检测
方法及存 储介质
(57)摘要
本发明的一种基于自监督表征网络的异常
时序序列检测方法及存储介质, 包括以下步骤,
S1: 抽取道路移动源OBD数据集, 并预处理; S2: 构
建时序行驶工况数据集; 将污染物NOx浓度和其
他特征属性组成多维度的OBD工况时序数据集,
按照时间戳整理出连续时间段的排放序列; S3:
构建高排放浓度序列识别模型, 具体为构建一种
基于自监督表征网络的异常时序序列检测模型。
本发明结合OBD数据集中多元车辆运行属性信
息, 避免了外界因素对监测环境的干扰, 为获取
真实排放状况数据提供了前提。 同时, 采用基于
重构的方法划分高排放的和正常排放的序列的
表征。 解决同类的基于深度学习方法 因行驶工况
丰富多变、 排放表征学习能力不足而造成的高排
放源识别准确率低的问题。
权利要求书3页 说明书10页 附图2页
CN 115439956 A
2022.12.06
CN 115439956 A
1.一种基于自监 督表征网络的异常时序 序列检测方法, 其特 征在于, 包括以下步骤,
S1: 抽取道路移动源OBD数据集, 并预处 理;
S2: 构建时序行驶工况数据集; 将污染物NOx浓度和其他特征属性组成多维度的OBD工
况时序数据集, 按照时间戳整理出 连续时间段的排 放序列;
S3: 构建高排放浓度序列识别模型, 具体为构建一种基于自监督表征网络的异常时序
序列检测模型。
2.根据权利要求1所述的基于自监督表征网络的异常时序序列检测方法, 其特征在于:
步骤S1中具体包括采集数辆机动车多日连续时间段内的车载诊断系统实时监测数据, 其中
包含时间戳、 后处理下游NOx值、 发动机转速、 实际输出扭矩百分比、 油门踏板开度、 发动机
瞬时喷油量、 发动机瞬时燃油消耗 率、 经纬度这些 特征属性;
上述步骤S1中预处 理具体细分为如下步骤:
S11: 对于抽取 得到的车辆OBD数据集中存在的空值, 删除其所对应的整行 数据;
S12: 根据车辆实际排放状况将数个OBD数据集人为划分为 “正常排放 ”和“高排放”标
签;
S13: 对数据集使用归一 化处理, 表达为:
其中, xi表示真实值,
表示xi的归一化值, xmax和xmin分别为当前属性中的最大值和最
小值。
3.根据权利要求2所述的基于自监督表征网络的异常时序序列检测方法, 其特征在于:
所述上述 步骤S2具体细分为如下步骤:
S21: 考虑一个经步骤S1处理得到的车辆排放特征数据集
其中的x
(i)∈Rm是一个包含m维特征的向量, 该数据集根据时间戳被划分为时间步长为l的排放序列
集合X={X1,X2,…,XN}, 其中, Xi∈Rl×m表示一个二维矩阵。
4.根据权利要求3所述的基于自监督表征网络的异常时序序列检测方法, 其特征在于:
上述步骤S3具体细分为如下步骤:
S31: 编码; 根据车辆排 放输入序列x的维度, 经 过编码器映射后得到编码向量z;
S32: 自监 督学习模块;
S33: 表征记 忆模块, 通过记录原型模式来增强模型区分正常和异常数据的能力;
S34: 解码; 车辆排放输入序列x经过一系列重构后, 需要进行解码器Decoder进行解码
得到原始维度空间下的输出序列x ′;
S35: 模型的训练和预测;
S36: 模型分类性能评估。
5.根据权利要求4所述的基于自监督表征网络的异常时序序列检测方法, 其特征在于:
步骤S311的编码过程被表示 为:
z=fe(x; θe) (2)
其中, fe表示编码器Encoder的映射 函数, θe表示编码器内部所有的参数。
6.根据权利要求5所述的基于自监督表征网络的异常时序序列检测方法, 其特征在于:权 利 要 求 书 1/3 页
2
CN 115439956 A
2步骤S32具体包括:
S321: 以下 六种信号变换来增 加源数据集的表征 数量, 具体描述如下:
以时序排 放序列T=[t1,t2,...,tn]为例:
(1)噪声; 加入了高斯噪声的变换;
(2)反向; 这种变换使样本沿着时间维度反向, 从而得到时间方向相反的样本Top:
Top=[tn,...,t2,t1] (3)
(3)置换: 这种变换通过对不同的时间窗口进行切片和交换, 假设切片长度为2, 使信号
沿时间维度随机扰动, 增强所 得模型的置换不变性质, 生成新的样本Tpe:
Tpe=[...,t1,t2,....,tn‑l,tn‑l+1,....](l<n) (4)
(4)缩放: 通过乘以一个随机标量来改变一个时间窗 口内信号的大小; 缩放信号Tsc的添
加可以帮助模型 学习缩放 不变模式, 被表示 为:
Tsc=[t1×s,t2×s,...,tn×s],s∈S (5)
(5)否定: 按‑1缩放, 得到 输入信号的镜像序列Tne:
Tne=[‑t1,‑t2,...,‑tn] (6)
(6)平滑: 应用Savitzky ‑Golay方法对信号进行平 滑处理;
S322: 使用交叉熵损失函数来区分它 们的变换类型:
式中, C为自监督学习类别数, 包括原始信号和6种变换信号; yi和pi分别是预测标签和
预测概率; 预测概 率pi被应用Softmax激活函数计算得到, 其表达式如下:
其中, 1≤i≤ C, Oi表示全连接层的最后一层输出的第i个值, exp表示自然常数 e。
7.根据权利要求5所述的基于自监督表征网络的异常时序序列检测方法, 其特征在于:
步骤S33具体包括:
S331: 给定一个经步骤S31得到的编码向量z∈RF,初始化一个表征记忆矩阵M∈RT×F, 记
忆权重向量w∈RT被计算为:
w=S(z,M) (9)
其中, S(·)表示相似性 函数, 其计算表达式为:
其中, exp表示自然常数 e, Mi表示表征记 忆矩阵M的第i个行向量且
S332: 将S331得到的记忆权重向量w与表征记忆矩阵M进行计算, 得到表征记忆向量
其被表示 为:
S333: 为促进网络更新和收敛, 需要计算记忆权重向量w的稀疏损 失值LSPAR, 计算方式
为:权 利 要 求 书 2/3 页
3
CN 115439956 A
3
专利 基于自监督表征网络的异常时序序列检测方法及存储介质
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-17 23:54:21上传分享