全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210558583.4 (22)申请日 2022.05.20 (71)申请人 东南大学 地址 211102 江苏省南京市江宁区东 南大 学路2号 (72)发明人 李春国 罗顺 刘周勇 李武斌  吴宇凡 杨绿溪  (74)专利代理 机构 南京瑞弘专利商标事务所 (普通合伙) 32249 专利代理师 秦秋星 (51)Int.Cl. G06V 10/44(2022.01) G06V 10/774(2022.01) G06K 9/62(2022.01) G06V 10/82(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于卷积注意力机制的复杂背景下目 标检测方法 (57)摘要 本发明公开了一种基于卷积注意力机制的 复杂背景下的目标检测方法, 可用于对复杂背景 下的前景目标进行精确检测。 该发明主要包括: 获取公开的复杂背景下目标检测数据集, 构建训 练集、 验证集和测试集; 构建基于卷积注意力机 制的人工神经网络模型ForegroundNet模型; 在 Pytorch深度学习平台上使 用训练集对 ForegroundNet网络模型进行监督训练; 在所构 建的测试集上评估收敛的Foregrou ndNet模型的 检测性能。 本发 明与当前主要的复杂背景目标检 测算法相比, 能够对前景目标的边缘区域进行精 确检测, 从而实现更高的检测性能。 本发明在测 试集上的检测结果对应的平均绝对误差更低, 增 强对齐指标、 结构指标及加权的F指标更高, 是一 种更加精确的复杂背景 下的目标检测算法。 权利要求书2页 说明书7页 附图7页 CN 114882241 A 2022.08.09 CN 114882241 A 1.一种基于卷积注意力机制的复杂背景下的目标检测方法, 其特征在于, 该方法包括 如下步骤: 步骤S1: 获取复杂背景目标检测数据集, 构建训练集、 验证集和 测试集; 步骤S2: 构建基于卷积注意力机制的ForegroundNet网络模型; 步骤S3: 在所构建的训练集上对ForegroundNet网络模型进行监督训练, 直到模型收敛 到最优性能; 步骤S4: 将收敛的ForegroundNet网络模型在 所构建的测试集上进行测试, 评估模型在 复杂背景 下的检测性能。 2.根据权利要求1所述一种基于卷积注意力机制的复杂背景下的目标检测方法, 其特 征在于, 所述 步骤S1中复杂背景目标检测数据集包 含数据集COD10K、 CAMO和C HAMELEON。 3.根据权利要求1所述一种基于卷积注意力机制的复杂背景下的目标检测方法, 其特 征在于, 所述步骤S2中所构建的基于卷积注 意力机制的ForegroundNet网络模 型包含: 特征 提取模块, 前 景背景提 议模块、 特 征生成模块和基于卷积注意力的特 征融合解码模块。 4.根据权利要求1所述一种基于卷积注意力机制的复杂背景下的目标检测方法, 其特 征在于, 所述 步骤S3具体包括: 步骤S301: 从所构建的训练集中随机抽取训练图片进行预处理, 首先利用插值算法将 输入图像和对应的真实标签的大小调整为H ×W, H表示图像高度, W表 示图像宽度; 随后进 行 图像数据增强处理, 最后将图像进行归一化处理后输入ForegroundNet网络模型进行监督 训练; 步骤S302: ForegroundNet网络模型通过特征提取模块提取出多尺度抽象特征, 前景背 景提议模块基于输入特征进行前景背景分割图的提议, 输出N层提议结果 k=1, 2,...,N, 提议结果中包含前景目标检测结果 和背景目标检测结果 随后特征 生成模块基于提议结果生成前景特征、 背景特征和边缘特征, 基于卷积注意力的特征融合 解码模块对每层的前景、 背 景和边缘特征进 行融合解码, 基于解码特征输出M层前景目标检 测结果, 用 来表示, k =N+1,N+2,. ..,N+M; 步骤S303: 基于提议结果和检测结果, 计算模型在监督训练过程中的损失函数Loverall, 其计算方法如式(1)所示, 其中, 和 分别表示第k层前景目标提议结果 和背景目标提议结果 对应的经过结构信息加权的交叉熵损失, 和 分别表示第k层 前景目标提 议结果 和背景目标提 议结果 对应的经 过结构信息加权的交并比损失; 步骤S304: 基于模型的整体损失函数Loverall, 采用随机梯度下降优化算法对 ForegroundNet模型的网络参数进行迭代更新; 步骤S305: ForegroundNet网络模型在训练过程逐渐收敛到最优性能, 随后将模型的网 络参数固化, 输入待检测图片进行前向计算, 在输出的N+M层不同的检测结果中, 选取尺度权 利 要 求 书 1/2 页 2 CN 114882241 A 2最大的前 景目标检测结果 作为模型的最终检测结果maskpred。 5.根据权利要求4所述一种基于卷积注意力机制的复杂背景下的目标检测方法, 其特 征在于, 以前景目标检测结果为例, 交叉熵损失和交并比损失的计算方法分别 如式(2)和式 (3)所示。 其中, maskgt(x,y)和 分别表示前景目标真实标签和第k层前景目标提议结 果中位置坐标为(x,y)的值, γ是和结构权重相关的参数, w(x,y)表示坐标为(x,y)的位置 对应的结构权 重, 其表达式如下: 其中, Axy表示坐标为(x,y)的像素周围像素的集 合。 6.根据权利要求1所述一种基于卷积注意力机制的复杂背景下的目标检测方法, 其特 征在于, 所述 步骤S4具体包括: 步骤S401: 逐一读取测试集中的待检测图片, 利用插值法将其大小调整为H ×W, H表示 图像高度, W表 示图像宽度, 随后将图片进行归一化, 输入收敛到最优性能的Foregr oundNet 网络模型中进行 前向计算, 输出对应的检测结果maskpred; 步骤S402: 根据模型的前景目标检测 结果maskpred和前景目标真实标签maskgt, 计算出 模型在测试集上的客观评价指标。 7.根据权利要求6所述一种基于卷积注意力机制的复杂背景下的目标检测方法, 其特 征在于, 所述 客观评价指标包 含: SM指标, E M指标、 WFM指标和MAE指标。权 利 要 求 书 2/2 页 3 CN 114882241 A 3

PDF文档 专利 一种基于卷积注意力机制的复杂背景下目标检测方法

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于卷积注意力机制的复杂背景下目标检测方法 第 1 页 专利 一种基于卷积注意力机制的复杂背景下目标检测方法 第 2 页 专利 一种基于卷积注意力机制的复杂背景下目标检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:10:30上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。