(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210948773.7
(22)申请日 2022.08.09
(71)申请人 东华理工大 学
地址 344000 江西省抚州市学府路5 6号
(72)发明人 徐洪珍 宋文琳 韦诗玥 王强
(74)专利代理 机构 南昌华成联合知识产权代理
事务所(普通 合伙) 36126
专利代理师 张建新
(51)Int.Cl.
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06N 3/00(2006.01)
G06Q 10/04(2012.01)
G06Q 50/26(2012.01)
(54)发明名称
一种基于混合深度学习模型的空气质量预
测方法
(57)摘要
本发明属于空气质量监测技术领域, 具体涉
及一种基于混合深度学习模型的空气质量预测
方法, 其包括以下步骤: (1)构建 空气质量预测数
据集, 并对空气质量数据进行预处理; (2)将预处
理后的空气质量数据集分解为多个相互独立的
固有模态函数IMF子数据集和一个残差子数据
集; (3)对上述固有模态函数IM F子数据集和残 差
子数据集进行特征选择, 选取有利于预测的子数
据集并进行重构, 获得优化后的空气质量数据
集; (4)采用三层双向长短期记忆神经网络BLS TM
与自注意力机制以串 联的方式, 构建一个深层深
度学习BALSTM模型; (5)将优化后的空气质量数
据集输入到构建的模型中进行学习、 预测, 得到
最后的空气质量预测结果。
权利要求书3页 说明书7页 附图2页
CN 115293269 A
2022.11.04
CN 115293269 A
1.一种基于混合深度学习模型的空气质量预测方法, 其特 征在于, 包括以下步骤:
S1.构建空气质量预测数据集, 并对空气质量数据进行预处理; 采集需要预测城市的原
始空气质 量数据, 包括PM2.5、 PM10、 SO2、 NO2、 O3、 CO六种大气污染物数据和空气质 量指数
AQI; 分别创建上述六种大气 污染物数据和AQI组成的7个空气参数数组, 作为空气质量预测
的初始数据集; 对空气质量初始数据集进行缺失值处 理、 季节性处 理和标准 化处理预处理;
S2.利用自适应噪声完全集合经验模态分解CEEMDAN方法将预处理后的空气质量数据
集分解为多个相互独立的固有模态函数IMF子数据集和一个残差 子数据集;
S3.利用改进的混沌二进制乌鸦搜索算法CBCSA对上述 固有模态函数IMF子数据集和残
差子数据集进行特征选择, 选取有利于预测的子数据集并进行重构, 获得优化后的空气质
量数据集;
S4.采用三层双向长短期记忆神经网络BLSTM与自注意力机制以串联的方式, 构 建一个
深层深度学习BALSTM模 型; 该模型在前两层BLSTM中添加了Dr opout方法来减小模 型的过拟
合问题, 并选取Sigmoid作为自注 意力机制层的激活函数, 最后结果输入到全连接层中作为
最后预测结果的输出;
S5.将步骤S3所得优化后的空气质量数据 集输入到步骤S4构 建的深层深度学习BALSTM
模型中进行 学习、 预测, 得到最后的空气质量预测结果。
2.根据权利要求1所述的基于混合深度 学习模型的空气质量预测方法, 其特征在于, 步
骤S1中, 缺失值处理方法为: 对于缺失的部分空气质量数据利用原始空气质量数据的平均
值进行填充;
季节性处 理包括定义季节指数, 计算公式如下:
其中Se表示季节因子, seAi表示收集的原始空气质量数据中各个季节数据历年的平均
数, i=1,2,3,4, 分别代表春夏秋冬4个季节, yearA表示收集的原始空气质量数据的平均
值;
标准化处理为: 首先计算出所有原始空气质量数据的平均值yearA和标准差σ, 然后再
对其进行Z ‑score标准化, 计算公式如下:
x=(x0‑yearA)/σ
其中x0表示任意标准 化处理前的空气质量数据, x表示标准 化处理后的空气质量数据。
3.根据权利要求1所述的基于混合深度 学习模型的空气质量预测方法, 其特征在于, 步
骤S2的具体过程如下:
S21: 设定拟分解的固有模态函数的总个数maxImf;
S22: 在经过S1步处理后的空气质量数据集的7个空气参数数组中加入自适应的噪声,
生成的新数据集记为X;
S23: 找出X中的所有极大值点和极小值点, 用三次样条差值函数分别拟合形成X的上包
络线和下包络线, 将X减去得到的上包络线和下包络线的均值, 得到新的数据集, 如果新的
数据集中不存在负的局部 极大值和正的局部 极小值, 则终止数据处理; 否则继续上述过程,
直到不存在负的局部极大值和正的局部 极小值为止; 经过该分解后的数据集记为固有模态
函数数据集IMF1;权 利 要 求 书 1/3 页
2
CN 115293269 A
2S24: 从X中减掉 提取的上述数据集 IMF1, 得到余项数据集RES1: RES1=X‑IMF1;
S25: 将RES1当作X, 重复S23~S24的步骤, 直到分解次数达到maxImf为止, 则得到一序列
的固有模态函 数数据集IMFi和余项数据集RESi, i=1,2, …,maxImf; 最后一个 余项数据集即
为残差数据集;
S26: 将上述所有的固有模态函数数据集IMFi与残差数据集组合成一个广义数组, 即为
用CEEMDAN方法分解后的空气质量数据集X'。
4.根据权利要求3所述的基于混合深度 学习模型的空气质量预测方法, 其特征在于, 步
骤S3对固有模态函数IMF子数据集和残差子数据集进行特征选择, 选取有利于预测的子数
据集的具体过程如下:
S31: 对混沌二进制乌鸦搜索算法进行初始化;
设置乌鸦的数量n、 最大感知概率APmax、 最小感知 概率APmin、 最大飞行距离flmax、 最小飞
行距离flmin、 最大迭代次数tmax等参数, 并用Logistic混沌映射函数创建每只乌鸦的混沌
映射值;
S32: 将步骤S2输出的分解后的空气质量数据集X'中各个空气质量数据作为各只乌鸦
的初始位置pi和初始记忆mi, i=1,2,…,n;
S33: 更新每只乌鸦的位置;
在每轮迭代过程中通过以下公式动态更新每只乌鸦的感知概 率和飞行距离:
其中t为迭代的轮次, tmax为最大迭代次数, APt为第t轮迭代 时乌鸦的感知概率, flt为
第t轮迭代时乌鸦的飞行距离;
然后通过 下面公式更新每只乌鸦的位置
其中, pi,t+1为乌鸦i在第t+1次迭代的位置, pi,t为乌鸦i在第t次迭代的位置, Ci和Cj分别
为乌鸦i和乌鸦j的混沌映射值, mj,t为第t次迭代被跟踪的乌鸦j的食物藏匿地点, 即第t次
迭代乌鸦j的记 忆;
S34: 将每只乌鸦的新 位置转化为二进制值 位置;
定义转换函数如下:
其中, d为经 过S1步骤预处 理后的空气质量数据的平均值;
通过下面公式将每只乌鸦的新 位置转化为二进制值 位置
其中, bpi,t+1为乌鸦i在第t+1次迭代的二进制值 位置;
S35: 计算每只乌鸦二进制位置bpi,t+1的适应度值;权 利 要 求 书 2/3 页
3
CN 115293269 A
3
专利 一种基于混合深度学习模型的空气质量预测方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-24 00:41:25上传分享