全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211383465.0 (22)申请日 2022.11.07 (71)申请人 腾讯科技 (深圳) 有限公司 地址 518044 广东省深圳市南 山区高新区 科技中一路腾讯大厦3 5层 (72)发明人 姚舜禹 杨继超  (74)专利代理 机构 北京同达信恒知识产权代理 有限公司 1 1291 专利代理师 朱佳 (51)Int.Cl. G06V 10/80(2022.01) G06V 10/25(2022.01) G06V 10/82(2022.01) (54)发明名称 一种图像 检测方法、 装置、 设备及存 储介质 (57)摘要 本申请实施例提供了一种图像检测方法、 装 置、 设备及存储介质, 可应用于人工智能、 云技 术、 智慧交通、 车载等各种场景, 该方法包括: 在 对待检测图像进行特征提取过程中, 迭代注入空 间定位图像对应的原始辅助特征, 获得多个判别 图像特征。 将多个判别图像特征进行融合后联合 待检测图像的初步图像特征, 预测待检测图像包 含的显著性区域。 由于在显著性目标检测过程 中, 既使用了外观信息, 又使用了空间定位信息, 因此在复杂场景下也能获得较高的准确性。 采用 注射的方式将原始辅助特征与待检测图像的图 像特征进行融合, 没有采用编码器来提取辅助特 征, 这样既获得了更好的融合效果, 提高显著性 目标检测过程的准确性, 同时降低了模型架构的 模型参数量。 权利要求书2页 说明书18页 附图11页 CN 115439726 A 2022.12.06 CN 115439726 A 1.一种图像 检测方法, 其特 征在于, 包括: 针对目标场景, 分别获取待检测图像和空间定位图像; 对所述待检测图像进行 特征提取, 获得初步图像特 征; 对所述空间定位图像对应的原始辅助 特征和所述初步图像特征进行多次迭代融合, 获 得多次迭代融合分别输出的判别图像特 征; 将获得的多个判别图像特征进行融合, 获得目标图像特征, 并基于所述初步图像特征 和所述目标图像特 征, 预测所述待检测图像包 含的显著性区域。 2.如权利要求1所述的方法, 其特征在于, 所述对所述空间定位图像对应的原始辅助 特 征和所述初步图像特征进行多次迭代融合, 获得多次迭代融合分别输出 的判别图像特征, 包括: 针对初次迭代融合过程, 执行以下步骤: 对所述空间定位图像进行特征提取, 获得所述 空间定位图像的原始辅助特征; 向所述初步图像特征注入所述原始辅助特征, 获得融合尺 度特征; 将 融合尺度特征与所述原始辅助特征融合, 并对融合获得的图像特征进行特征提 取, 获得初次迭代输出的判别图像特 征; 针对每个非初次迭代融合过程, 执行以下步骤: 对所述空间定位图像进行特征提取, 获 得所述空间定位图像的原始辅助特征; 向距离本次迭代时间最近的一次迭代输出的判别图 像特征注入所述原始辅助特征, 获得融合尺度特征; 将所述融合尺度特征与所述最近的一 次迭代输出 的判别图像特征融合, 并对融合获得的图像特征进行特征提取, 获得本次迭代 输出的判别图像特 征。 3.如权利要求2所述的方法, 其特征在于, 所述对所述空间定位图像进行特征提取, 获 得原始辅助特 征, 包括: 对所述空间定位图像进行转置卷积处理, 并对获得的图像特征进行像素反混洗操作, 获得候选图像特 征; 对所述候选图像特 征进行转置卷积处 理, 获得所述原始辅助特 征。 4.如权利要求2所述的方法, 其特征在于, 所述向距离本次迭代时间最近的一 次迭代输 出的判别图像特 征注入所述原 始辅助特 征, 获得融合尺度特 征, 包括: 对所述最近的一次迭代输出的判别图像特 征进行转置处 理, 获得转置图像特 征; 将所述转置图像特 征和所述原 始辅助特 征融合, 获得中间辅助特 征; 将所述转置图像特 征和所述中间辅助特 征融合, 获得 所述融合尺度特 征。 5.如权利要求4所述的方法, 其特征在于, 所述将所述转置图像特征和所述原始辅助 特 征融合, 获得中间辅助特 征, 包括: 将所述转置图像特征和所述原始辅助 特征合并, 并对合并获得的图像特征进行全连接 处理, 获得第一 候选融合特 征; 对所述第一 候选融合特 征进行转置卷积处 理, 生成第一类卷积核; 将所述原始辅助 特征和所述第 一类卷积核融合, 并对融合获得的图像特征进行卷积处 理, 获得所述中间辅助特 征。 6.如权利要求4所述的方法, 其特征在于, 所述将所述转置图像特征和所述中间辅助 特 征融合, 获得 所述融合尺度特 征, 包括: 将所述转置图像特征和所述中间辅助 特征合并, 并对合并获得的图像特征进行全连接权 利 要 求 书 1/2 页 2 CN 115439726 A 2处理, 获得第二 候选融合特 征; 对所述第二 候选融合特 征进行转置卷积处 理, 生成第二类卷积核; 将所述中间辅助 特征和所述第 二类卷积核融合, 并对融合获得的图像特征进行卷积处 理, 获得所述融合尺度特 征。 7.如权利要求1所述的方法, 其特征在于, 所述将获得的多个判别图像特征进行融合, 获得目标图像特 征, 包括: 针对所述多个判别图像特征中的每个判别图像特征, 执行以下操作: 提取一个判别图 像特征的全局上下文信息, 并结合所述全局上下文信息和所述一个判别图像特征, 获得一 个全局图像特 征; 将获得的多个全局图像特 征调整为相同尺度后融合, 获得 所述目标图像特 征。 8.如权利要求1所述的方法, 其特征在于, 所述基于所述初步图像特征和所述目标图像 特征, 预测所述待检测图像包 含的显著性区域, 包括: 对所述目标图像特 征进行扩展卷积处 理, 获得扩展图像特 征; 将所述扩展图像特征与所述初步图像特征融合, 并对融合获得的图像特征依次进行卷 积处理和上采样处 理, 获得所述待检测图像包 含的显著性区域。 9.如权利要求8所述的方法, 其特征在于, 所述对所述目标图像特征进行扩展卷积处 理, 获得扩展图像特 征, 包括: 针对预设的多个扩展率中的每个扩展率, 执行以下操作: 采用一个扩展率对所述目标 图像特征进行卷积处理, 获得一个候选卷积特 征; 将获得的多个候选卷积特 征融合, 获得 所述扩展图像特 征。 10.如权利要求1至9任一所述的方法, 其特征在于, 所述空间定位图像为深度图像或红 外图像。 11.一种图像 检测装置, 其特 征在于, 包括: 获取单元, 用于针对目标场景, 分别获取待检测图像和空间定位图像; 提取单元, 用于对所述待检测图像进行 特征提取, 获得初步图像特 征; 处理单元, 用于对所述空间定位图像对应的原始辅助特征和所述初步图像特征进行多 次迭代融合, 获得多次迭代融合分别输出的判别图像特 征; 预测单元, 用于将获得的多个判别图像特征进行融合, 获得目标图像特征, 并基于所述 初步图像特 征和所述目标图像特 征, 预测所述待检测图像包 含的显著性区域。 12.一种计算机设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计 算机程序, 其特征在于, 所述处理器执行所述程序时实现权利要求1~10任一所述方法 的步 骤。 13.一种计算机可读存储介质, 其特征在于, 其存储有可由计算机设备执行的计算机程 序, 当所述程序在计算机设备上运行时, 使得所述计算机设备执行权利要求1~10任一所述 方法的步骤。 14.一种计算机程序产品, 其特征在于, 所述计算机程序产品包括存储在计算机可读存 储介质上 的计算机程序, 所述计算机程序包括程序指令, 当所述程序指令被计算机设备执 行时, 使所述计算机设备 执行权利要求1 ‑10任一项所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 115439726 A 3

PDF文档 专利 一种图像检测方法、装置、设备及存储介质

文档预览
中文文档 32 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共32页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种图像检测方法、装置、设备及存储介质 第 1 页 专利 一种图像检测方法、装置、设备及存储介质 第 2 页 专利 一种图像检测方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:26:44上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。