全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210584060.7 (22)申请日 2022.05.25 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 吴俊德 方慧卉 许言午  (74)专利代理 机构 中科专利商标代理有限责任 公司 11021 专利代理师 杨静 (51)Int.Cl. G06T 7/11(2017.01) G06T 7/00(2017.01) G06V 10/44(2022.01) G06N 3/08(2006.01) G06N 3/04(2006.01) (54)发明名称 图像分割方法、 训练方法、 装置、 电子设备以 及存储介质 (57)摘要 本公开提供了一种图像 分割方法、 模 型训练 方法、 装置、 电子设备以及存储介质, 涉及人工智 能技术领域, 尤其涉及计算机视觉、 深度学习技 术领域。 具体实现方案为: 对待分割图像进行N轮 处理, 得到第N图像分割结果, 其中, 第N图像分割 结果满足第一预定条件, N是大于或等于1的整 数; 将第N图像分割结果确定为目标图像分割结 果; 其中, 对待分割图像进行N轮处理, 得到第N图 像分割结果, 包括: 根据第(n ‑1)图像分割结果和 第(n‑1)多专家权重数据, 得到第n图像分割结 果, 其中, 第(n ‑1)多专家权重数据是根据第(n ‑ 1)图像分割结果的相关数据得到的, 其中, n是大 于或等于1且 小于或等于N的整数。 权利要求书6页 说明书28页 附图9页 CN 114913187 A 2022.08.16 CN 114913187 A 1.一种图像分割方法, 包括: 对待分割图像进行N轮处理, 得到第N 图像分割结果, 其中, 所述第N图像分割结果满足 第一预定条件, N是 大于或等于1的整数; 以及 将所述第N图像分割结果确定为目标图像分割结果; 其中, 所述对待分割图像进行N轮处 理, 得到第N图像分割结果, 包括: 根据第(n ‑1)图像分割结果和第(n ‑1)多专家权重数据, 得到第n图像分割结果, 其中, 所述第(n ‑1)多专家权重数据是根据第(n ‑1)图像分割结果的相关数据得到的, 其中, n是大 于或等于1且小于或等于N的整数。 2.根据权利要求1所述的方法, 其 中, 所述根据第(n ‑1)图像分割结果和第(n ‑1)多专家 权重数据, 得到第n图像分割结果, 包括: 根据第(n ‑1)第一中间特 征数据, 得到所述第(n ‑1)多专家权重数据; 根据所述第(n ‑1)图像分割结果和所述第(n ‑1)多专家权重数据, 得到第n第一中间特 征数据; 以及 根据所述第n第一中间特 征数据, 得到所述第n图像分割结果。 3.根据权利 要求2所述的方法, 其中, 所述根据所述第(n ‑1)图像分割结果和所述第(n ‑ 1)多专家权重数据, 得到第n第一中间特 征数据, 包括: 利用第一注意力策略处理所述第(n ‑1)图像分割结果和所述第(n ‑1)多专家权重数据, 得到第n第一中间特征数据, 其中, 所述第(n ‑1)图像分割结果用于作为第一键矩阵和第一 值矩阵, 所述第(n ‑1)多专家权重数据用于作为第一 查询矩阵。 4.根据权利要求3所述的方法, 其中, 所述利用第一注意力策略处理所述第(n ‑1)图像 分割结果和所述第(n ‑1)多专家权重数据, 得到第n第一中间特 征数据, 包括: 利用所述第一注意力策略对所述第(n ‑1)图像分割结果和所述第(n ‑1)多专家权重数 据进行M层级处 理, 得到所述第n第一中间特 征数据, 其中, M是 大于1的整数。 5.根据权利要求4所述的方法, 其中, 所述利用所述第一注意力策略对所述第(n ‑1)图 像分割结果和所述第(n ‑1)多专家权重数据进行多层级处理, 得到所述第n第一中间特征数 据, 包括: 在m=1的情况下, 利用所述第一注意力策略处理所述第(n ‑1)图像分割结果和所述第 (n‑1)多专家权重数据, 得到与第n轮的第m层级对应的第一中间特 征数据; 在m>1的情况下, 利用所述第一注意力策略处理与第n轮的第(m ‑1)层级对应的第一中 间特征数据和所述第(n ‑1)多专家权重数据, 得到与第n轮的第 m层级对应的第一中间特征 数据, 其中, 与所述第n轮的第(m ‑1)层级对应的第一中间特征数据用于作为第二键矩阵和 第二值矩阵, 所述第(n ‑1)多专家权重数据用于作为第二 查询矩阵; 以及 根据与第n轮的第T层级对应的第一中间特征数据, 得到所述第 n第一中间特征数据, 其 中, T是大于或等于1且小于或等于 M的整数。 6.根据权利要求5所述的方法, 其中, 所述利用所述第一注意力策略处理与第n轮的第 (m‑1)层级对应的第一中间特征数据和所述第(n ‑1)多专家权重数据, 得到与第n轮的第m层 级对应的第一中间特 征数据, 包括: 利用所述第一注意力策略处理与所述第n轮的第(m ‑1)层级对应的第一中间特征数据 和所述第(n ‑1)多专家权重数据, 得到与第n轮的第m层级对应的第二中间特 征数据; 以及权 利 要 求 书 1/6 页 2 CN 114913187 A 2根据与所述第n轮的第m层级对应的第二中间特征数据和与所述第n轮的第(m ‑1)层级 对应的第一中间特 征数据, 得到与所述第n轮的第m层级对应的第一中间特 征数据。 7.根据权利要求6所述的方法, 其中, 所述根据与所述第 n轮的第m层级对应的第 二中间 特征数据和与所述第n轮的第(m ‑1)层级对应的第一中间特征数据, 得到与所述第n轮的第m 层级对应的第一中间特 征数据, 包括: 根据与所述第n轮的第m层级对应的第二中间特征数据和与所述第n轮的第(m ‑1)层级 对应的第一中间特 征数据, 得到与第n轮的第m层级对应的第三中间特 征数据; 对与所述第 n轮的第m层级对应的第三中间特征数据进行空间变换, 得到与第n轮的第m 层级对应的第四中间特 征数据; 根据与所述第n轮的第m层级对应的第三中间特征数据和第四中间特征数据, 得到与第 n轮的第m层级对应的第五中间特 征数据; 以及 根据与所述第n轮的第m层级对应的第五中间特征数据, 得到与所述第n轮的第m层级对 应的第一中间特 征数据。 8.根据权利 要求2所述的方法, 其中, 所述根据所述第(n ‑1)图像分割结果和所述第(n ‑ 1)多专家权重数据, 得到第n第一中间特 征数据, 包括: 利用第一局部特征提取策略处理所述第(n ‑1)图像分割结果和所述第(n ‑1)多专家权 重数据, 得到所述第n第一中间特 征数据。 9.根据权利要求2~8中任一项所述的方法, 其中, 所述根据第(n ‑1)第一中间特征数 据, 得到所述第(n ‑1)多专家权重数据, 包括: 利用第二注意力策略处理所述第(n ‑1)第一中间特征数据, 得到所述第(n ‑1)多专家权 重数据, 其中, 所述第(n ‑1)第一中间特征数据用于作为第三键矩阵、 第三值矩阵和第三查 询矩阵。 10.根据权利要求9所述的方法, 其中, 所述利用第二注意力策略处理所述第(n ‑1)第一 中间特征数据, 得到所述第(n ‑1)多专家权重数据, 包括: 利用所述第二注意力策略处理所述第(n ‑1)第一中间特征数据, 得到第(n ‑1)第二中间 特征数据; 根据所述第(n ‑1)第二中间特 征数据, 得到第(n ‑1)第三中间特 征数据; 对所述第(n ‑1)第三中间特征数据进行空间变换, 得到第(n ‑1)第四中间特征数据; 以 及 根据所述第(n ‑1)第三中间特征数据和所述第(n ‑1)第四中间特征数据, 得到所述第 (n‑1)多专家权重数据。 11.根据权利要求2~8中任一项所述的方法, 其中, 所述根据第(n ‑1)第一中间特征数 据, 得到所述第(n ‑1)多专家权重数据, 包括: 利用第二局部特征提取策略处理所述第(n ‑1)第一中间特征数据, 得到所述第(n ‑1)多 专家权重数据。 12.一种图像分割模型的训练方法, 包括: 对深度学习模型执行R个模型参数调整周期的训练, 直至满足第 二预定条件, 其中, R是 大于或等于1的整数; 以及 将在满足所述第二预定条件的情况 下得到的深度学习模型确定为所述图像分割模型;权 利 要 求 书 2/6 页 3 CN 114913187 A 3

PDF文档 专利 图像分割方法、训练方法、装置、电子设备以及存储介质

文档预览
中文文档 44 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共44页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图像分割方法、训练方法、装置、电子设备以及存储介质 第 1 页 专利 图像分割方法、训练方法、装置、电子设备以及存储介质 第 2 页 专利 图像分割方法、训练方法、装置、电子设备以及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:10:26上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。