全网唯一标准王
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210394883.3 (22)申请日 2022.04.15 (65)同一申请的已公布的文献号 申请公布号 CN 114494792 A (43)申请公布日 2022.05.13 (73)专利权人 珠海亿智电子科技有限公司 地址 519000 广东省珠海市高新区唐家湾 镇港乐路8号大洲科技园B区厂房803 室 (72)发明人 殷绪成 马嘉威 陈松路  (74)专利代理 机构 深圳青年人专利商标代理有 限公司 4 4350 专利代理师 吴桂华 (51)Int.Cl. G06V 10/764(2022.01)G06V 10/82(2022.01) G06V 10/25(2022.01) G06V 10/44(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (56)对比文件 CN 111950610 A,2020.1 1.17 CN 114332586 A,202 2.04.12 审查员 郑明月 (54)发明名称 基于单阶段的目标检测方法、 装置、 设备及 存储介质 (57)摘要 本发明适用目标检测技术领域, 提供了一种 基于单阶段的目标检测方法、 装置、 设备及存储 介质, 该方法包括: 采用特征提取网络对输入的 待检测图像进行特征提取, 得到待检测图像在不 同尺度下的多个第一特征图; 对每个第一特征图 进行定位和分类操作, 得到对应的第二特征图和 第三特征图; 对第二特征图、 第三特征图进行特 征对齐操作, 得到对应的第四特征图和第五特征 图, 对第四特征图和第五特征图进行交互操作, 得到对应的交并比分数、 预测框和分类分数; 基 于交并比分数、 分类分数和预测框, 确定待检测 图像的检测目标, 从而通过提高特征定位与特征 分类的一致性与差异性提高目标检测任务的协 调性, 进而提高目标检测的准确度。 权利要求书3页 说明书9页 附图5页 CN 114494792 B 2022.07.05 CN 114494792 B 1.一种目标检测方法, 其特 征在于, 所述方法包括: 采用特征提取网络对输入的待检测图像进行特征提取, 得到所述待检测图像在不同尺 度下的多个第一特 征图; 对每个第一特 征图进行定位和分类操作, 得到对应的第二特 征图和第三特 征图; 对所述第二特征图、 第三特征图进行特征对齐操作, 得到对应的第 四特征图和第五特 征图, 对所述第四特征图和第五特征图进 行交互操作, 得到对应的交并比分数、 预测框和分 类分数; 基于所有所述第一特征图对应的交并比分数、 分类分数和预测框, 确定所述待检测图 像的检测目标; 对所述第二特征图、 第三特征图进行特征对齐操作, 得到对应的第 四特征图和第五特 征图, 对所述第四特征图和第五特征图进 行交互操作, 得到对应的交并比分数、 预测框和分 类分数的步骤, 包括: 采用特征对齐网络对所述第二特征图、 第三特征图分别进行特征对齐操作, 得到对应 的第四特征图和第 五特征图, 所述特征对齐网络包括第一可变形卷积网络、 第二可变形卷 积网络和适配 器模块; 所述采用特征对齐网络对所述第二特征图、 第三特征图进行特征对齐操作, 得到所述 对应的第四特 征图和第五特 征图的步骤, 包括: 对所述第二特 征图进行 卷积运算, 得到初始边界框; 将所述第二特征图、 第三特征图和初始边界框输入所述适配器模块, 以基于所述第二 特征图、 第三特征图和初始 边界框, 生成所述第二特征图对应的偏移 量、 所述第三特征图对 应的掩码; 将所述第二特征图和所述偏移量输入所述第 一可变形卷积网络, 以根据 所述偏移量对 所述第二特 征图进行定位特 征对齐, 得到所述第四特 征图; 将所述第三特征图和所述掩码输入所述第 二可变形卷积网络, 以根据 所述掩码对所述 第三特征图进行分类特 征对齐, 得到所述第五特 征图。 2.如权利要求1所述的目标检测方法, 其特征在于, 对每个第 一特征图进行定位和分类 操作, 得到对应的第二特 征图和第三特 征图的步骤, 包括: 采用特征定位网络对每 个所述第一特 征图进行定位操作, 得到所述第二特 征图; 采用特征分类网络对每 个所述第一特 征图进行分类操作, 得到所述第三特 征图。 3.如权利要求2所述的目标检测方法, 其特征在于, 所述特征定位网络包括第一卷积 层、 第一归一层和第一激活层, 所述采用特征定位网络对每个所述第一特征图进行定位操 作, 得到所述第二特 征图的步骤, 包括: 将每个所述第 一特征图输入所述特征定位网络, 利用所述第 一卷积层对所述第 一特征 图进行卷积计算, 得到 定位特征图; 利用所述第 一归一层对所述定位特征图进行分组并计算每一组 的均值和方差, 以进行 归一化; 利用所述第 一激活层对归一化处理后的定位特征图进行激活处理, 得到所述第 二特征 图。 4.如权利要求2所述的目标检测方法, 其特征在于, 所述特征分类网络包括第二卷积权 利 要 求 书 1/3 页 2 CN 114494792 B 2层、 第二归一层和第二激活层, 所述采用特征分类网络对每个所述第一特征图进行分类操 作, 得到所述第三特 征图的步骤, 包括: 将每个所述第 一特征图输入所述特征分类网络, 利用所述第 二卷积层对所述第 一特征 图进行卷积计算, 得到分类特 征图; 利用所述第 二归一层对所述分类特征图进行分组并计算每一组 的均值和方差, 以进行 归一化; 利用所述第 二激活层对归一化处理后的分类特征图进行激活处理, 得到所述第 三特征 图。 5.如权利要求1所述的目标检测方法, 其特征在于, 对所述第二特征图、 第三特征图进 行特征对齐操作, 得到对应的第四特征图和第 五特征图, 对所述第四特征图和第 五特征图 进行交互操作, 得到对应的交并比分数、 预测框和分类分数的步骤, 包括: 采用特征交互网络对所述第 四特征图、 第五特征图进行特征交互操作, 得到所述对应 的交并比分数、 预测框和分类分数。 6.如权利要求5所述的目标检测方法, 其特征在于, 所述特征交互网络包括两个第 三卷 积层和两个池化层, 所述采用特征交互网络对所述第四特征图、 第 五特征图进行特征交互 操作, 得到所述对应的交并比分数、 预测框和分类分数的步骤, 包括: 将所述第四特征图和所述第五特征图输入所述特征交互网络, 利用两个所述第 三卷积 层分别对所述第四特征图和所述第五特征图进 行卷积运算, 得到所述第四特征图对应的交 并比分数以及所述第五特 征图对应的分类分数; 利用所述两个池化层对所述第四特征图和所述第五特征图分别进行降维操作, 对应得 到两个低维度特 征图; 基于所述对应得到的两个低维度特征图以及所述初始边界框, 使用解码函数, 生成所 述预测框 。 7.一种目标检测装置, 其特 征在于, 所述装置包括: 特征提取单元, 用于采用特征提取网络对输入的待检测图像进行特征提取, 得到所述 待检测图像在不同尺度下的多个第一特 征图; 定位与分类单元, 用于对每个第一特征图进行定位和分类操作, 得到对应的第二特征 图和第三特 征图; 对齐与交互单元, 用于对所述第 二特征图、 第 三特征图进行特征对齐操作, 得到对应的 第四特征图和第 五特征图, 对所述第四特征图和第 五特征图进行交互操作, 得到对应的交 并比分数、 预测框和分类分数; 目标确定单元, 用于基于所有所述第 一特征图对应的交并比分数、 分类分数和预测框, 确定所述待检测图像的检测目标; 所述对齐与交 互单元包括: 特征对齐单元, 用于采用特征对齐网络对所述第二特征图、 第三特征图分别进行特征 对齐操作, 得到对应的第四特征图和第 五特征图, 所述特征对齐网络包括第一可变形卷积 网络、 第二可变形 卷积网络和适配 器模块; 所述特征对齐单 元包括: 卷积运算单元, 用于对所述第二特 征图进行 卷积运算, 得到初始边界框;权 利 要 求 书 2/3 页 3 CN 114494792 B 3

PDF文档 专利 基于单阶段的目标检测方法、装置、设备及存储介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于单阶段的目标检测方法、装置、设备及存储介质 第 1 页 专利 基于单阶段的目标检测方法、装置、设备及存储介质 第 2 页 专利 基于单阶段的目标检测方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:11:05上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。