(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211051097.X
(22)申请日 2022.08.31
(71)申请人 联通 (上海) 产业互联网有限公司
地址 200050 上海市长 宁区长宁路1033号7
楼
(72)发明人 孙盛婷 胡超 贺盼博 邬伟杰
赖盛鑫
(74)专利代理 机构 池州市卓燊知识产权代理事
务所(普通 合伙) 3421 1
专利代理师 蒙绍嵩
(51)Int.Cl.
G06V 20/40(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06V 10/774(2022.01)G06V 20/52(2022.01)
(54)发明名称
一种结合深度学习的复杂场景工地头盔检
测算法
(57)摘要
本发明涉及工地头盔检测技术领域, 尤其为
一种结合深度学习的复杂场景工地头盔检测算
法, 其步骤具体如下: S1, 目标检测; S2, SE网络 添
加; S3, mastic 数据增强优 化, 本发明通过设计一
种结合深度学习的复杂场景工地头盔检测算法,
通过结合目标检测与 SE网络, 其中目标检测采用
预训练模型, 并且在模型的网络层的不同位置增
加了SE网络, 使优化后的模型更加关注全局变
量, 提高了模 型对小目标信息和密集目标信息的
检测性能, 同时, 算法在不同工地, 不同摄像机视
角, 不同光线下等各种复杂实际工作环境中均可
使用, 泛化性好, 并且算法精度高, 模型响应快,
鲁棒性好, 在保证精度的同时可达到超实时的处
理速率。
权利要求书2页 说明书5页
CN 115457435 A
2022.12.09
CN 115457435 A
1.一种结合深度学习的复杂场景工地头盔检测算法, 其 步骤具体如下:
S1, 目标检测: 采用一阶段目标检测算法, 其中阶段目标检测算法主要为yolo、 ss d或者
retinanet, 并利用coco数据集预训练模型, 得到工地头盔检测器, 用该检测器可以检测出
图片中工地头盔与人头的位置坐标及宽高;
S2, SE网络添加: 在检测算法的backbo ne中引入SE网络, 以获取全局特 征信息;
S3, mastic数据增强优化: 首先, 将拼图的数量从4个改变为16个, 然后添加判断条件,
以确保尽可能少的无用区域, 从而填充的黑白边界位于图像的边 缘。
2.根据权利要求1所述的一种结合深度学习的复杂场景工地头盔检测算法, 其特征在
于, 所述S1中用该检测器可以检测出图片中工地头盔与人头的位置坐标及宽高的具体步骤
如下:
基于yolov5模型, 将输入的源图片缩放与自动填充, 默认尺寸为608*608像素, 输入到
backbone网络进行特征提取, 得到包含[x,y,w,h,c,s]的识别结果, 其中x, y为目标中心点
坐标, w, h为目标框的宽和高, c是目标的类别, s为目标的置信度, 然后根据x, y, w, h和原图
得到具体目标的图片及其在原图中的位置坐标。
3.根据权利要求1所述的一种结合深度学习的复杂场景工地头盔检测算法, 其特征在
于, 所述S2中Backbo ne添加流程如下:
模型: Yolov5模型backbo ne添加SE网络;
输入: 图片, 默认对原图进行缩放与自动填充, 尺寸 为608*608像素;
步骤一: 将608*608*3的图像输入Focus模块, 采取切片操作, 经过一次卷积, 输出为
304*304*32大小的特 征图;
步骤二: 添加自注意力层SE(128), 提取全局特 征, 将输出作为下一层C 3模块的输入;
步骤三: 重复步骤二共计三次, 自注意力层的大小分别为SE(128), SE(25 6),SE(512);
步骤四: 使用S PP模块进行池化操作, 将结果特 征传入NE CK层。
4.根据权利要求1所述的一种结合深度学习的复杂场景工地头盔检测算法, 其特征在
于, 所述S2中SE网络给定 一个输入X(C`,H`,W`),通 过一系列卷积操作(Ftr)变换后得到特征
U(C,H,W), 从而通过三个操作来重标 前面得到的特 征, 具体步骤如下:
步骤一: Sque eze(Fsq)
深度学习的模型都依赖于卷积操作, 但是基于局部空间的卷积往往很难获得channel
之间的信息, 从而导 致网络的感受野比较小;
Squeeze采用global average pooling来实现将每个通道的二维特征(HxW)压缩为1个
实数, 每个值都具有一个c hannel上的全局感受野;
公式表示 为:
步骤二: Excitati on(Fex)
步骤一中获取了所有channel对应的全局特征, 步骤二通过Fsq操作得来的参数[C,1,1]
来为每个特征通道动态的生成一个权 重值;
公式表示 为:权 利 要 求 书 1/2 页
2
CN 115457435 A
2s=Fex(z,W)=σ(g(z,W) )=σ(W2δ(W1z))
步骤三: Scale(Fscale)
步骤三将学习到的归一 化权重加权到每个通道的特 征上, 逐个通道 乘以权重系数;
公式表示 为:
权 利 要 求 书 2/2 页
3
CN 115457435 A
3
专利 一种结合深度学习的复杂场景工地头盔检测算法
文档预览
中文文档
8 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:16:57上传分享