全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210579002.5 (22)申请日 2022.05.25 (71)申请人 成都理工大 学 地址 610000 四川省成 都市成华区二仙桥 东三路1号 (72)发明人 桑强 唐辉煌 杨月欣 李卓  (74)专利代理 机构 成都众恒智合专利代理事务 所(普通合伙) 51239 专利代理师 钟显毅 (51)Int.Cl. G06V 10/44(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01) (54)发明名称 一种基于深度学习的仿生目标轮廓提取算 法 (57)摘要 本发明公开了一种基于深度学习的仿生目 标轮廓提取算法, 通过将外区抑制机制与深度 CNN框架相结合, 建立受生物特性启发的边缘检 测模型, 使用该边缘检测模型对目标图像进行边 缘提取; 该边缘检测模型包括主干网络、 侧输出 层和外区抑制模块SSM。 本发明通过设计高效的 主干网络实现了边缘检测的精度和效率之间更 好的平衡, 并设计了多层卷积层堆叠结构的外区 抑制模块SSM来增加感受野并表征不同尺度上的 空间结构, 有效模拟了外区抑制效应, 经过SSM调 制操作可以使得网络在更大的视野范围上整合 重要信息。 而且本发明的模型不需要预训练的权 重来辅助训练, 网络参数明显降低, 在相同硬件 条件下的推理速度达到更快, 相较 现有技术而言 本发明更加高效、 轻量。 权利要求书3页 说明书6页 附图6页 CN 114972787 A 2022.08.30 CN 114972787 A 1.一种基于深度学习的仿生目标轮廓提取算法, 其特征在于, 通过将外区抑制机制与 深度CNN框架相结合, 建立受生物特性启发的边缘检测模 型, 使用该 受生物特性启发的边缘 检测模型对目标图像进行边 缘提取; 该受生物特性启发的边 缘检测模型包括主干网络、 侧输出层和外区抑制模块S SM; 所述主干网络包括基于CNN框架的多个阶段, 每两个阶段之间配置最大池化层进行下 采样, 其中第一个阶段配置为一个初始卷积层和三个残差卷积块, 其余 阶段配置为四个残 差卷积块; 所述外区抑制模块SSM配置为: 多个卷积核大小为3x3的卷积层串联, 构建指定尺度大 小感受野的卷积块, 并将该卷积块得到的特征图减去卷积块中低层卷积层的特征图, 形成 模拟nCRF的方环形感受野; 将所述外区抑制 模块SSM分别作用到主干网络的初始卷积层和 各个残差卷积块进行外区抑制调制产生特征图响应, 其中主干网络的不同阶段对应的外区 抑制模块S SM的方环形感受野的尺度不同, 以模拟V1神经 元对不同尺度特 征的响应; 所述侧输出层针对每个阶段的外区抑制调制产生的特征图响应都分别 使用eltwise层 相累加, 获得混合特征, 并分别通过1 ×1‑1的conv层得到对应每个阶段一张的特征图; 然后 利用双线性插值对除第一 阶段外的其他 阶段得到的特征图进行上采样使得分辨率变得与 输入图像相同, 并用交叉熵损失/sigmoid层连接到上采样层得到每个阶段的损失; 将所有 上采样层以及第一阶段的conv层进行concatenate操作, 然后使用一个1 ×1‑1的conv层来 融合每个阶段的特 征图, 最后通过交叉熵损失/sigmo id层得到融合损失/ 输出。 2.根据权利要求1所述的基于深度学习的仿生目标轮廓 提取算法, 其特征在于, 所述主 干网络中的每个残差卷积块依次包含3x3大小的卷积层、 ReLU层和1x1大小的卷积层, 将该 1x1大小的卷积层的卷积结果和输入到残差卷积块的特征图相加得到该残差卷积块的输 出。 3.根据权利要求1所述的基于深度学习的仿生目标轮廓 提取算法, 其特征在于, 所述主 干网络配置为四个阶段, 该四个阶段的通道数依次配置为24、 48、 96、 96 。 4.根据权利要求1~3任一项所述的基于深度 学习的仿生目标轮廓 提取算法, 其特征在 于, 所述外区抑制模块SSM的方环形感受野的尺度包括: 9x9 /3x3、 15x15/5x5、 21x21/7x7, 其 中, 9x9、 15x15、 21x21表示多个卷积层串联构建的卷积块的感受野尺度, 3x3、 5x5、 7x7表示 作为CRF的小卷积块的感受野尺度。 5.根据权利要求4所述的基于深度学习的仿生目标轮廓 提取算法, 其特征在于, 所述外 区抑制模块S SM对主干网络的第j个通道的调制特 征 由下列各式计算获得: 权 利 要 求 书 1/3 页 2 CN 114972787 A 2上式中, SSM_n,n=1,2,3表示不同尺度的SSM, 表示SSM的第m层卷积层的第j个 通道的特征响应, 2≤m≤10, 表示CRF的第i个通道的特征响应, 表示输入特征 图 的第i个特征通道上的第j个卷积核, 表示输入特征图 的第i 个特征通道上的第j个卷积核, 和 表示对应 的偏置项, CRF的第j个通道响 应特征 由下式计算获得: 式中, Ii表示输入特征图I的第i个通道特征响应, 表示输入特征图I的第i个特征 通道上的第j个卷积核, 表示对应的偏置项。 6.根据权利要求5所述的基于深度学习的仿生目标轮廓 提取算法, 其特征在于, 所述进 行外区抑制调制产生特 征图响应的过程 为 通过将CRF的既定特性与nCRF的调制特性相减, 然后进行ReLU操作, 公式如下: 式中, ReLU表示激活函数, 表示外区抑制 调制的第j个通道特征调制结果, 表 示CRF的第j个通道响应特征, 表示外区抑制模块SSM对主干网络的第j个通道的调制 特征。 7.根据权利要求6所述的基于深度学习的仿生目标轮廓 提取算法, 其特征在于, 所述交 叉熵损失/sigmo id层使用加权交叉熵损失函数, 单个 像素的预测损失 公式: 式中, yi表示真值标签边缘图的第i个像素值, Xi表示输入特征图的第i个像素的激活 值, W表示权 重参数, P()表示sigmo id函数, th表示阈值, 式中, Y+和Y‑分别表示边缘和非边缘真实像素的个数, Y表示总像素个数, γ表示用于平 衡边缘和非边 缘真实像素之间关系的设定参数, 总损失函数用下式表示:权 利 要 求 书 2/3 页 3 CN 114972787 A 3

PDF文档 专利 一种基于深度学习的仿生目标轮廓提取算法

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于深度学习的仿生目标轮廓提取算法 第 1 页 专利 一种基于深度学习的仿生目标轮廓提取算法 第 2 页 专利 一种基于深度学习的仿生目标轮廓提取算法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:10:27上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。