(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211323914.2
(22)申请日 2022.10.27
(71)申请人 江苏骠马智能工业设计 研究有限公
司
地址 213000 江苏省常州市新北区汉江西
路999号
(72)发明人 王顺 张睿 季松林
(74)专利代理 机构 常州联正专利代理事务所
(普通合伙) 32546
专利代理师 张岳
(51)Int.Cl.
G06V 10/75(2022.01)
G06V 10/80(2022.01)
G06V 10/82(2022.01)
(54)发明名称
基于深度学习的单模板匹配的方法
(57)摘要
本发明公开了一种基于深度学习的单模板
匹配的方法, 该方法应用于在过曝、 高噪声等恶
劣图像中定位出目标; 首先, 使用 深度学习中的
骨干网络提取图像特征; 接着, 对不同尺度的图
像特征做特征融合; 然后, 分别计算细节得分与
语义得分; 最后, 通过特征比对获取图像中的目
标位置。 本发 明使用深度学习中的骨干网络对图
像做特征提取, 比人工特征更加丰富; 另外加入
了特征融合模块, 使得特征同时具有语义和细 节
信息, 达到 更好的定位和抑噪效果; 此外, 分别计
算了细节得分与语义得分, 细 节得分增强了匹配
的精度, 语义得分增强了匹配的鲁棒 性。
权利要求书2页 说明书4页 附图2页
CN 115482405 A
2022.12.16
CN 115482405 A
1.一种基于深度学习的单模板匹配的方法, 其特 征在于, 包括如下步骤:
1)输入包含目标的图像R, 输入目标的模板图像T;
2)将图像R送入预训练好的骨干网络B中, 截取下采样n倍的输出Rn, 截取下采样2n倍的
输出R2n, 对图像T做同样的处 理, 获得Tn与T2n;
3)将R2n以双线性插值的方式进行2倍上采样得到
对T2n做同样的处 理, 得到
4)将
与Rn通过通道维度加权拼接, 得到融合后的特征
对Tn与
做同样的处理, 得
到
5)对
的通道维度做归一 化, 得到
对
做同样的处 理, 得到
6)以
作为卷积核对
进行步长为1的same 卷积, 得到细节得分图SD;
7)计算
中每一个 像素与
的相似度, 得到语义得分图SC;
8)将SD与SC通过加权相加, 得到融合后的得分图S;
9)取得分图S中像素值最大的坐标P, 并对坐标P进行下采样倍数补偿, 补偿后的坐标即
模板图像T在图像R中的位置 。
2.根据权利要求1所述的基于深度学习的单模板匹配的方法, 其特征在于: 所述步骤2)
中截取下采样n倍的输 出Rn, 截取下采样2n倍的输 出R2n, Rn的尺寸为[1,C,H,W ], R2n的尺寸为
[1,2C,H/2,W/2], C表示 通道数量, H表示高度, W表示宽度。
3.根据权利要求1所述的基于深度学习的单模板匹配的方法, 其特征在于: 所述步骤4)
中将
与Rn通过通道维度加权拼接, 得到融合后的特 征
的具体方法为:
其中,
的尺寸为[1,2C,H,W], cont( ·)表示通道维度拼接操作,
的尺寸为[1,3C,
H,W], α 逼近 于1,
包含更多的语义信息, α 逼近 于0,
包含更多的细节信息 。
4.根据权利要求1所述的基于深度学习的单模板匹配的方法, 其特征在于: 所述步骤5)
对
的通道维度做归一化的具体方法为:
通道维度的均值为
其尺寸为[1,1,H,
W],
通道维度的标准差为
其尺寸为[1,1,H,W]; 归一化的特征
可以表示为:
尺寸为[1,3C,H,W]。
5.根据权利要求1所述的基于深度学习的单模板匹配的方法, 其特征在于: 所述步骤7)
中计算
中每一个像素与
的相似度的具体方法为:
的尺寸为[1,3C,h,w], 那么
可以看做向量集合X={x1,…,xm,…,xhw},xn的尺寸为[1,3C ]; 同样的,
可以看做向
量集合Y={y1,…,ym,…,yHW}, yn的尺寸为[ 1,3C]; 分别 计算Y中每一个向量ym与X中每一个
向量xm的内积, 得到内积矩阵T, T的尺寸为[HW,hw]; 取出T中每一行中元素 的最大值, 得到权 利 要 求 书 1/2 页
2
CN 115482405 A
2语义得分图SC,SC的尺寸为[1,1,H,W]。
6.根据权利要求1所述的基于深度学习的单模板匹配的方法, 其特征在于: 所述步骤8)
中SD与SC通过加权相加, 得到得分图S的具体方法为:
S=α SC+(1‑α )SD, 0≤α ≤1
其中, 得分图S的尺寸为[1,1,H,W], α 逼近于1, S包含更多的语义信息, α 逼近于0, S包含
更多的细节信息 。
7.根据权利要求1所述的基于深度学习的单模板匹配的方法, 其特征在于: 所述步骤9)
中对坐标P进行下采样倍数补偿的具体方法为: P的原始坐标为(p,q), 补偿后的坐标为(np,
nq)。权 利 要 求 书 2/2 页
3
CN 115482405 A
3
专利 基于深度学习的单模板匹配的方法
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:26:49上传分享