全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210181434.0 (22)申请日 2022.02.25 (71)申请人 腾讯科技 (深圳) 有限公司 地址 518057 广东省深圳市南 山区高新区 科技中一路腾讯大厦3 5层 (72)发明人 江铖 庞建业 姚建华  (74)专利代理 机构 深圳市深佳知识产权代理事 务所(普通 合伙) 44285 专利代理师 闵晶晶 (51)Int.Cl. G06T 7/11(2017.01) G06T 3/40(2006.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06K 9/62(2022.01)G06V 10/44(2022.01) G06V 10/77(2022.01) (54)发明名称 一种图像分割的方法、 相关装置、 设备以及 存储介质 (57)摘要 本申请公开了一种涉及人工智能技术的图 像分割方法, 包括: 获取原始图像的原始图像特 征; 通过图像 分割模型中的编码器获取第一图像 特征, 局部视觉模块包括空间增强模块, 空间增 强模块基于输入图像特征生 成空间缩放因子, 空 间缩放因子可修正输入图像特征的空间特征; 通 过图像分割模 型中的解码器获取第二图像特征; 对第二图像特征和编码器中第一个局部视觉模 块输出的第三图像特征进行拼接, 得到目标图像 特征; 根据目标图像特征, 生 成目标分割图像。 本 申请还提供了装置、 设备及介质。 本申请使用空 间缩放因子调整图像特征的空间特征, 该空间缩 放因子是基于输入图像特征自适应生成的, 从而 降低了模型配 置的难度。 权利要求书5页 说明书27页 附图10页 CN 114549556 A 2022.05.27 CN 114549556 A 1.一种图像分割的方法, 其特 征在于, 包括: 获取原始图像所对应的原 始图像特 征; 基于所述原始图像特征, 通过图像分割模型中的编码器获取第一图像特征, 其中, 所述 编码器包括若干个局部视觉模块和若干个下采样层, 所述局部视觉模块包括空间增强模 块, 所述空间增强模块用于基于输入图像特征生成空间缩放因子, 所述空间缩放因子用于 修正所述输入图像特 征所对应的空间特 征; 基于所述第 一图像特征, 通过所述图像分割模型中的解码器获取第二图像特征, 其中, 所述解码器包括若干个所述局部 视觉模块和若干个上采样层; 对所述第二图像特征和所述编码器中第一个所述局部视觉模块输出的第三图像特征 进行拼接, 得到目标图像特征, 其中, 所述第二图像特征为所述解码器中最后一个所述局部 视觉模块输出的图像特 征; 根据所述目标图像特 征, 生成目标分割图像。 2.根据权利要求1所述的方法, 其特征在于, 所述局部视觉模块还包括第 一归一化层和 注意力模块; 所述第一归一 化层用于对第一输入特 征进行归一 化处理, 得到第一归一 化特征; 所述注意力模块用于对所述第 一归一化特征进行特征提取, 得到所述第 一归一化特征 的空间特 征; 所述空间增强模块用于对所述第 一归一化特征进行最大池化操作和平均池化操作, 得 到目标合并结果, 其中, 所述目标合并结果包括 最大池化结果与平均池化结果; 所述空间增强模块还用于对所述目标合并结果进行 卷积操作, 得到卷积结果; 所述空间增强模块还用于采用激活函数对所述卷积结果进行计算, 得到目标空间缩放 因子。 3.根据权利要求1所述的方法, 其特征在于, 所述局部视觉模块还包括第 一归一化层和 注意力模块; 所述注意力模块用于对第 一输入特征进行特征提取, 得到所述第 一输入特征的空间特 征; 所述空间增强模块用于对所述第一输入特征的空间特征进行最大池化操作和平均池 化操作, 得到目标合并结果, 其中, 所述目标合并结果为包括最大池化结果与平均池化结 果; 所述空间增强模块还用于对所述目标合并结果进行 卷积操作, 得到卷积结果; 所述空间增强模块还用于采用激活函数对所述卷积结果进行计算, 得到目标空间缩放 因子; 所述第一归一化层用于对修正后的空间特征进行归一化处理, 其中, 所述修正后的空 间特征为采用所述目标空间缩放因子对所述第一输入特 征的空间特 征进行修 正后得到的。 4.根据权利要求1所述的方法, 其特征在于, 所述局部视觉模块还包括通道增强模块, 所述通道增强模块基于输入图像特征生成通道缩放因子, 所述通道缩放因子用于修正所述 输入图像特 征所对应的通道特 征。 5.根据权利要求4所述的方法, 其特征在于, 所述局部视觉模块还包括第 二归一化层和 多层感知机;权 利 要 求 书 1/5 页 2 CN 114549556 A 2所述第二归一 化层用于对第二输入特 征进行归一 化处理, 得到第二归一 化特征; 所述多层感知机用于对所述第 二归一化特征进行特征提取, 得到所述第 二归一化特征 的通道特 征; 所述通道增强模块用于对所述第 二归一化特征的通道特征进行最大池化操作, 得到最 大池化结果, 并对所述所述第二归一化特征 的通道特征进行平均池化操作, 得到平均池化 结果; 所述通道增强模块还用于对所述最大池化结果进行卷积操作, 得到第一卷积结果, 并 对所述平均池化结果进行 卷积操作, 得到第二卷积结果; 所述通道增强模块还用于根据 所述第一卷积结果和所述第 二卷积结果, 确定目标卷积 结果; 所述通道增强模块还用于采用激活函数对所述目标卷积结果进行计算, 得到目标通道 缩放因子 。 6.根据权利要求4所述的方法, 其特征在于, 所述局部视觉模块还包括第 二归一化层和 多层感知机; 所述多层感知机用于对第 二输入特征进行特征提取, 得到所述第 二输入特征的通道特 征; 所述通道增强模块用于对所述第 二输入特征的通道特征进行最大池化操作, 得到最大 池化结果, 并对所述第二输入特 征的通道特 征进行平均池化操作, 得到平均池化结果; 所述通道增强模块还用于对所述最大池化结果进行卷积操作, 得到第一卷积结果, 并 对所述平均池化结果进行 卷积操作, 得到第二卷积结果; 所述通道增强模块还用于根据 所述第一卷积结果和所述第 二卷积结果, 确定目标卷积 结果; 所述通道增强模块还用于采用激活函数对所述目标卷积结果进行计算, 得到目标通道 缩放因子; 所述第二归一化层用于对修正后的通道特征进行归一化处理, 其中, 所述修正后的通 道特征为采用所述目标通道缩放因子对所述第二输入特 征的通道特 征进行修 正后得到的。 7.根据权利要求1至6 中任一项所述的方法, 其特征在于, 所述编码器包括M个所述局部 视觉模块以及N个所述下采样层, 所述解码器包括(M ‑1)个所述局部视觉模块以及N个所述 上采样层, 所述解码器所包括的(M ‑1)个所述局部视觉模块与所述编码器中对应的(M ‑1)个 所述局部 视觉模块跳跃 连接, 其中, 所述M为大于1的整数, 所述 N为大于等于1的整数; 所述编码器中第一个所述局部视觉模块输出的图像特征作为所述编码器中第一个所 述下采样层输入的图像特 征; 所述编码器中最后一个所述下采样层输出的图像特征作为所述编码器中最后一个所 述局部视觉模块输入的图像特 征; 所述编码器中最后一个所述局部视觉模块输出的图像特征作为所述解码器中第一个 所述上采样层输入的图像特 征; 所述解码器中第一个所述上采样层输出的图像特征作为所述解码器中第一个所述局 部视觉模块输入的图像特 征; 所述解码器中最后一个所述上采样层输出的图像特征作为所述编码器中最后一个所权 利 要 求 书 2/5 页 3 CN 114549556 A 3

PDF文档 专利 一种图像分割的方法、相关装置、设备以及存储介质

文档预览
中文文档 43 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共43页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种图像分割的方法、相关装置、设备以及存储介质 第 1 页 专利 一种图像分割的方法、相关装置、设备以及存储介质 第 2 页 专利 一种图像分割的方法、相关装置、设备以及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:12:00上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。