专利基于自监督表征网络的异常时序序列检测方法及存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211066771.1 (22)申请日 2022.09.01 (71)申请人合肥综合性国家科学中心人工智能研究院（安徽省人工智能实验室）地址 230000 安徽省合肥市高新区望江西路5089号，中国科学技术大学先进技术研究院未来中心B120 5-B1208 (72)发明人许镇义　王仁军　康宇　曹洋　 (74)专利代理机构合肥天明专利事务所(普通合伙) 34115 专利代理师苗娟 (51)Int.Cl. G07C 5/08(2006.01) G06N 3/04(2006.01) G06N 3/08(2006.01)G06K 9/62(2022.01) G01D 21/02(2006.01) (54)发明名称基于自监督表征网络的异常时序序列检测方法及存储介质 (57)摘要本发明的一种基于自监督表征网络的异常时序序列检测方法及存储介质，包括以下步骤， S1：抽取道路移动源OBD数据集，并预处理； S2：构建时序行驶工况数据集；将污染物NOx浓度和其他特征属性组成多维度的OBD工况时序数据集，按照时间戳整理出连续时间段的排放序列； S3：构建高排放浓度序列识别模型，具体为构建一种基于自监督表征网络的异常时序序列检测模型。本发明结合OBD数据集中多元车辆运行属性信息，避免了外界因素对监测环境的干扰，为获取真实排放状况数据提供了前提。同时，采用基于重构的方法划分高排放的和正常排放的序列的表征。解决同类的基于深度学习方法因行驶工况丰富多变、排放表征学习能力不足而造成的高排放源识别准确率低的问题。权利要求书3页说明书10页附图2页 CN 115439956 A 2022.12.06 CN 115439956 A 1.一种基于自监督表征网络的异常时序序列检测方法，其特征在于，包括以下步骤， S1：抽取道路移动源OBD数据集，并预处理； S2：构建时序行驶工况数据集；将污染物NOx浓度和其他特征属性组成多维度的OBD工况时序数据集，按照时间戳整理出连续时间段的排放序列； S3：构建高排放浓度序列识别模型，具体为构建一种基于自监督表征网络的异常时序序列检测模型。 2.根据权利要求1所述的基于自监督表征网络的异常时序序列检测方法，其特征在于：步骤S1中具体包括采集数辆机动车多日连续时间段内的车载诊断系统实时监测数据，其中包含时间戳、后处理下游NOx值、发动机转速、实际输出扭矩百分比、油门踏板开度、发动机瞬时喷油量、发动机瞬时燃油消耗率、经纬度这些特征属性；上述步骤S1中预处理具体细分为如下步骤： S11：对于抽取得到的车辆OBD数据集中存在的空值，删除其所对应的整行数据； S12：根据车辆实际排放状况将数个OBD数据集人为划分为 “正常排放 ”和“高排放”标签； S13：对数据集使用归一化处理，表达为：其中， xi表示真实值，表示xi的归一化值， xmax和xmin分别为当前属性中的最大值和最小值。 3.根据权利要求2所述的基于自监督表征网络的异常时序序列检测方法，其特征在于：所述上述步骤S2具体细分为如下步骤： S21：考虑一个经步骤S1处理得到的车辆排放特征数据集其中的x (i)∈Rm是一个包含m维特征的向量，该数据集根据时间戳被划分为时间步长为l的排放序列集合X＝{X1,X2,…,XN}，其中， Xi∈Rl×m表示一个二维矩阵。 4.根据权利要求3所述的基于自监督表征网络的异常时序序列检测方法，其特征在于：上述步骤S3具体细分为如下步骤： S31：编码；根据车辆排放输入序列x的维度，经过编码器映射后得到编码向量z； S32：自监督学习模块； S33：表征记忆模块，通过记录原型模式来增强模型区分正常和异常数据的能力； S34：解码；车辆排放输入序列x经过一系列重构后，需要进行解码器Decoder进行解码得到原始维度空间下的输出序列x ′； S35：模型的训练和预测； S36：模型分类性能评估。 5.根据权利要求4所述的基于自监督表征网络的异常时序序列检测方法，其特征在于：步骤S311的编码过程被表示为： z＝fe(x； θe) (2) 其中， fe表示编码器Encoder的映射函数， θe表示编码器内部所有的参数。 6.根据权利要求5所述的基于自监督表征网络的异常时序序列检测方法，其特征在于：权　利　要　求　书 1/3 页 2 CN 115439956 A 2步骤S32具体包括： S321：以下六种信号变换来增加源数据集的表征数量，具体描述如下：以时序排放序列T＝[t1,t2,...,tn]为例： (1)噪声；加入了高斯噪声的变换； (2)反向；这种变换使样本沿着时间维度反向，从而得到时间方向相反的样本Top： Top＝[tn,...,t2,t1] (3) (3)置换：这种变换通过对不同的时间窗口进行切片和交换，假设切片长度为2，使信号沿时间维度随机扰动，增强所得模型的置换不变性质，生成新的样本Tpe： Tpe＝[...,t1,t2,....,tn‑l,tn‑l+1,....](l<n) (4) (4)缩放：通过乘以一个随机标量来改变一个时间窗口内信号的大小；缩放信号Tsc的添加可以帮助模型学习缩放不变模式，被表示为： Tsc＝[t1×s,t2×s,...,tn×s],s∈S (5) (5)否定：按‑1缩放，得到输入信号的镜像序列Tne： Tne＝[‑t1,‑t2,...,‑tn] (6) (6)平滑：应用Savitzky ‑Golay方法对信号进行平滑处理； S322：使用交叉熵损失函数来区分它们的变换类型：式中， C为自监督学习类别数，包括原始信号和6种变换信号； yi和pi分别是预测标签和预测概率；预测概率pi被应用Softmax激活函数计算得到，其表达式如下：其中， 1≤i≤ C， Oi表示全连接层的最后一层输出的第i个值， exp表示自然常数 e。 7.根据权利要求5所述的基于自监督表征网络的异常时序序列检测方法，其特征在于：步骤S33具体包括： S331：给定一个经步骤S31得到的编码向量z∈RF,初始化一个表征记忆矩阵M∈RT×F，记忆权重向量w∈RT被计算为： w＝S(z,M) (9) 其中， S(·)表示相似性函数，其计算表达式为：其中， exp表示自然常数 e， Mi表示表征记忆矩阵M的第i个行向量且 S332：将S331得到的记忆权重向量w与表征记忆矩阵M进行计算，得到表征记忆向量其被表示为： S333：为促进网络更新和收敛，需要计算记忆权重向量w的稀疏损失值LSPAR，计算方式为：权　利　要　求　书 2/3 页 3 CN 115439956 A 3

专利 基于自监督表征网络的异常时序序列检测方法及存储介质

专利基于自监督表征网络的异常时序序列检测方法及存储介质