(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210327700.6
(22)申请日 2022.03.31
(65)同一申请的已公布的文献号
申请公布号 CN 114419558 A
(43)申请公布日 2022.04.29
(73)专利权人 华南理工大 学
地址 510640 广东省广州市天河区五山路
381号
专利权人 广州地铁集团有限公司
深圳市朗驰 欣创科技股份有限公
司
(72)发明人 柯峰 方恩权 杨利萍 庄泽升
彭东亮 马跃 何冬冬
(74)专利代理 机构 广州市华学知识产权代理有
限公司 4 4245
专利代理师 李君
(51)Int.Cl.
G06V 20/52(2022.01)
G06V 10/44(2022.01)
G06V 10/764(2022.01)G06V 10/82(2022.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(56)对比文件
US 2021110136 A1,2021.04.15
CN 10952 2819 A,2019.0 3.26
CN 111507962 A,2020.08.07
CN 112231974 A,2021.01.15
CN 107292298 A,2017.10.24
CN 110059582 A,2019.07.26
CN 109063728 A,2018.12.21
CN 111553298 A,2020.08.18
史海山等.基于遗传神经网络的火灾图像识
别及应用. 《计算机科 学》 .2006,(第11期),
吴雪等.基于数据增强的卷积神经网络火灾
识别. 《科 学技术与工程》 .2020,(第0 3期), (续)
审查员 罗秀英
(54)发明名称
火灾视频图像识别方法、 系统、 计算机设备
及存储介质
(57)摘要
本发明公开了一种火灾视频图像识别方法、
系统、 计算机设备及存储介质, 所述火灾视频图
像识别方法包括: 获取数据集, 所述数据集为火
灾与非火灾的视频图像数据集; 构建卷积神经网
络; 利用数据集对卷积神经网络进行训练, 得到
火灾视频图像识别模型; 获取待识别视频, 并对
待识别视频进行分帧处理, 得到待识别视频图
像; 将待识别视频图像输入火灾视频图像识别模
型, 实现火灾视频图像识别。 本发明能够在减少
网络模型参数量的同时, 提高网络模 型的检测效
率与准确率, 实现对火灾视频图像的快速识别,
从而能够及时发现火灾隐患, 保证人身财产安全。
[转续页]
权利要求书2页 说明书9页 附图8页
CN 114419558 B
2022.07.05
CN 114419558 B
(56)对比文件
G Ciabur ro.Sound event detecti on in
underground park ing garage using
convolutional neural netw ork. 《Big Data
and Cogn itive Computi ng》 .2020,第4卷(第3期),
吴喆.基于深度学习的动态背景 下航道船舶
检测识别与跟踪研究. 《中国优秀硕士学位 论文
全文数据库 (工程科技 Ⅱ辑)》 .2020,(第3期),2/2 页
2[接上页]
CN 114419558 B1.一种火灾视频图像识别方法, 其特 征在于, 所述方法包括:
获取数据集, 所述数据集 为火灾与非火灾的视频图像数据集;
构建卷积神经网络, 所述卷积神经网络包括一层输入层、 一层模块A、 三层模块B、 两层
模块C、 两层1 ×1卷积块A、 四层最大池化层、 一层自适应平均池化层、 一层 flatten层、 一层
dropout层、 一层全连接层和一层 softmax分类层;
利用数据集对卷积神经网络进行训练, 得到火灾视频图像识别模型;
获取待识别视频, 并对待识别视频进行分帧处 理, 得到待识别视频图像;
将待识别视频图像输入火灾视频图像识别模型, 实现 火灾视频图像识别;
所述模块A包括输入层、 第一特征提取层和输出层; 所述模块B包括输入层、 第二特征提
取层和输出层; 所述模块C包括输入层、 第三特 征提取层和输出层;
所述第一特征提取层包括第一输入通道、 第一输出通道、 第二输出通道和第三输出通
道;
所述第一输入通道为第一3 ×3卷积块A、 第二3 ×3卷积块A、 第三3 ×3卷积块A依次连
接;
所述第一输出通道输出第一3 ×3卷积块A的特 征信息矩阵;
所述第二输出通道输出第二3 ×3卷积块A的特 征信息矩阵;
所述第三输出通道输出第三3 ×3卷积块A的特 征信息矩阵。
2.根据权利要求1所述的火灾视频图像识别方法, 其特征在于, 三层模块B分别为第一
模块B、 第二模块B和第三模块B, 两层模块C分别为第一模块C和第二模块C, 两层1 ×1卷积块
A分别为第一1 ×1卷积块A和 第二1×1卷积块A, 四层最大池化层分别为第一池化层、 第二池
化层、 第三池化层和第四池化层;
所述构建卷积神经网络, 具体如下:
依次连接输入层、 模块A、 第一最大池化层、 第一模块B、 第一1 ×1卷积块A、 第二最大池
化层、 第一模块C、 第三最大池化层、 第二1 ×1卷积块A、 第二模块B、 第四最大池化层、 第二模
块C、 第三模块B、 自适应平均池化层、 dropout层、flatten层、 全连接层、 softmax分类层, 进
而构建得到卷积神经网络 。
3.根据权利要求1所述的火灾视频图像识别方法, 其特征在于, 所述第 二特征提取层包
括第二输入通道、 第三输入通道、 第四输入通道、 第四输出通道、 第五输出通道、 第六输出通
道、 第七输出通道和第八输出通道;
所述第二输入通道为第三1 ×1卷积块A;
所述第三输入通道, 具体为: 先将第一3 ×3卷积块B和第二3 ×3卷积块B依次连接, 并将
第一3×3卷积块B的特征信息矩阵输出和第二3 ×3卷积块B的特征信息矩阵输出相加之后,
再与第一激活层和第三3 ×3卷积块B依次连接;
所述第四输入通道为第五最大池化层和第四1 ×1卷积块A 依次连接;
所述第四输出通道输出第三1 ×1卷积块A的特 征信息矩阵;
所述第五输出通道输出第一3 ×3卷积块B的特 征信息矩阵;
所述第六输出通道输出第二3 ×3卷积块B的特 征信息矩阵;
所述第七输出通道输出第三3 ×3卷积块B的特 征信息矩阵;
所述第八输出通道输出第四1 ×1卷积块A的特 征信息矩阵。权 利 要 求 书 1/2 页
2
CN 114419558 B
3
专利 火灾视频图像识别方法、系统、计算机设备及存储介质
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:11:20上传分享