全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210359406.3 (22)申请日 2022.04.07 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 邹棹帆 郭知智 姜珊 刘瑞雪  岳海潇  (74)专利代理 机构 北京同立钧成知识产权代理 有限公司 1 1205 专利代理师 董建姣 黄健 (51)Int.Cl. G06T 7/00(2017.01) G06V 10/774(2022.01) G06V 10/74(2022.01) G06V 10/82(2022.01)G06V 10/44(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 合成图像识别方法及 装置、 图像识别模型训 练方法及装置 (57)摘要 本公开提供了一种合成图像识别方法及装 置、 图像识别模型训练方法及装置, 涉及人工智 能技术领域, 具体为深度学习、 图像处理、 计算机 视觉技术领域, 可应用于人脸识别等场景。 具体 实现方案为: 获取训练数据, 其中, 训练数据中包 括训练图像、 训练图像对应的训练标签, 训练标 签用于指示训练图像是否为合 成图像。 根据图像 识别模型中的特征提取层对训练图像进行处理, 得到训练图像的目标特征矩阵。 根据目标特征矩 阵, 确定训练图像的预测标签。 根据预测标签和 训练标签, 对图像识别模型的模型参数进行更 新。 本公开的技术方案可以有效提升图像识别模 型的处理泛化性, 进而提升合 成图像识别的正确 性。 权利要求书5页 说明书16页 附图6页 CN 114820467 A 2022.07.29 CN 114820467 A 1.一种合成图像识别方法, 包括: 获取待识别的第一图像; 根据图像识别模型中的特征提取层对所述第 一图像进行处理, 得到所述第 一图像的目 标特征矩阵, 其中, 所述 目标特征矩阵用于指示所述第一图像中的多个像素点之间的特征 相关度; 根据所述目标特征矩阵, 确定所述第一图像的输出标签, 所述输出标签用于指示所述 第一图像是否为 合成图像。 2.根据权利要求1所述的方法, 其中, 所述根据图像识别模型中的特征提取层对所述第 一图像进行处 理, 得到所述第一图像的目标 特征矩阵, 包括: 针对所述图像识别模型中的第 i个特征提取层, 根据所述第 i个特征提取层的特征提取 单元对所述第一图像进行特征提取处理, 得到所述第一图像在所述第i个特征提取层的第 一特征矩阵; 根据所述第一特征矩阵, 确定所述第一图像在所述第i个特征提取层对应的目标特征 矩阵; 其中, 所述i为大于等于1并且小于等于n的整数, 所述n为所述 图像识别模型中特征提 取层的数量。 3.根据权利要求2所述的方法, 其中, 所述根据所述第i个特征提取层的特征提取单元 对所述第一图像进行特征提取处理, 得到所述第一图像在所述第i个特征提取层的第一特 征矩阵, 包括: 确定所述第一 图像在所述第i个特征提取层对应的输入信息, 其中, 所述i等于1时, 所 述输入信息为所述第一图像, 所述i大于1时, 所述输入信息为第i ‑1个特征提取层中的特征 提取单元输出的初始特 征矩阵; 根据所述第i个特征提取层的特征提取单元对所述输入信息进行特征提取处理, 得到 所述第一图像在所述第i个特征提取层的初始特征矩阵, 其中, 所述初始特征矩阵的维度为 N×C×H/2i×W/2i; 对所述初始特征矩阵进行矩阵变换, 得到所述第一图像在所述第i个特征提取层的第 一特征矩阵, 所述第一特 征矩阵的维度为 N×C×HW/2i+1; 其中, 所述N为所述第一图像的数量, 所述C为所述第一 图像的通道数, 所述H为所述第 一图像的高度, 所述 W为所述第一图像的宽度。 4.根据权利要求2或3所述的方法, 其中, 所述根据 所述第一特征矩阵, 确定所述第一图 像在所述第i个特 征提取层对应的目标 特征矩阵, 包括: 对所述第 一特征矩阵进行通道置换处理, 得到第 二特征矩阵, 其中, 所述第 二特征矩阵 的维度为 N×HW/2i+1×C; 根据所述第 一特征矩阵和所述第 二特征矩阵进行矩阵点乘 处理, 得到所述第 一图像在 所述第i个特征提取层对应的目标特征矩阵, 所述目标特征矩阵的维度为N ×HW/2i+1×HW/ 2i+1。 5.根据权利要求1 ‑4任一项所述的方法, 其中, 所述图像识别网络中还 包括卷积层; 所述根据所述目标 特征矩阵, 确定所述第一图像的输出 标签, 包括: 将所述目标 特征矩阵输入至对应的卷积层中, 得到降维后的中间特 征;权 利 要 求 书 1/5 页 2 CN 114820467 A 2根据所述降维后的中间特 征进行特征连接处理, 得到所述第一图像的输出 标签。 6.根据权利要求5所述的方法, 其中, 所述图像识别网络中还 包括全连接层; 所述根据所述降维后的中间特征进行特征连接处理, 得到所述第一图像的输出标签, 包括: 根据所述全连接层对所述所述降维后的中间特征进行特征连接处理, 得到所述全连接 层输出的所述第一图像的输出 标签。 7.一种图像识别模型训练方法, 包括: 获取训练数据, 其中, 所述训练数据中包括训练图像、 所述训练图像对应的训练标签, 所述训练标签用于指示所述训练图像是否为 合成图像; 根据图像识别模型中的特征提取层对所述训练图像进行处理, 得到所述训练图像的目 标特征矩阵, 其中, 所述 目标特征矩阵用于指示所述训练图像中的多个像素点之间的特征 相关度; 根据所述目标 特征矩阵, 确定所述训练图像的预测标签; 根据所述预测标签和训练标签, 对所述图像识别模型的模型参数进行 更新。 8.根据权利要求7所述的方法, 其中, 所述根据图像识别模型中的特征提取层对所述训 练图像进行处 理, 得到所述训练图像的目标 特征矩阵, 包括: 针对所述图像识别模型中的第 i个特征提取层, 根据所述第 i个特征提取层的特征提取 单元对所述训练图像进行特征提取处理, 得到所述训练图像在所述第i个特征提取层的第 一特征矩阵; 根据所述第一特征矩阵, 确定所述训练图像在所述第i个特征提取层对应的目标特征 矩阵; 其中, 所述i为大于等于1并且小于等于n的整数, 所述n为所述 图像识别模型中特征提 取层的数量。 9.根据权利要求8所述的方法, 其中, 所述根据所述第i个特征提取层的特征提取单元 对所述训练图像进行特征提取处理, 得到所述训练图像在所述第i个特征提取层的第一特 征矩阵, 包括: 确定所述训练图像在所述第i个特征提取层对应的输入信息, 其中, 所述i等于1时, 所 述输入信息为所述训练图像, 所述i大于1时, 所述输入信息为第i ‑1个特征提取层中的特征 提取单元输出的初始特 征矩阵; 根据所述第i个特征提取层的特征提取单元对所述输入信息进行特征提取处理, 得到 所述训练图像在所述第i个特征提取层的初始特征矩阵, 其中, 所述初始特征矩阵的维度为 N×C×H/2i×W/2i; 对所述初始特征矩阵进行矩阵变换, 得到所述训练图像在所述第i个特征提取层的第 一特征矩阵, 所述第一特 征矩阵的维度为 N×C×HW/2i+1; 其中, 所述N为所述训练图像的数量, 所述C为所述训练图像的通道数, 所述H为所述训 练图像的高度, 所述 W为所述训练图像的宽度。 10.根据权利要求8或9所述的方法, 其中, 所述根据所述第一特征矩阵, 确定所述训练 图像在所述第i个特 征提取层对应的目标 特征矩阵, 包括: 对所述第 一特征矩阵进行通道置换处理, 得到第 二特征矩阵, 其中, 所述第 二特征矩阵权 利 要 求 书 2/5 页 3 CN 114820467 A 3

PDF文档 专利 合成图像识别方法及装置、图像识别模型训练方法及装置

文档预览
中文文档 28 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 合成图像识别方法及装置、图像识别模型训练方法及装置 第 1 页 专利 合成图像识别方法及装置、图像识别模型训练方法及装置 第 2 页 专利 合成图像识别方法及装置、图像识别模型训练方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:11:15上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。