全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210562102.7 (22)申请日 2022.05.23 (71)申请人 浙江大华 技术股份有限公司 地址 310053 浙江省杭州市滨江区滨安路 1187号 (72)发明人 李坡 王原原 郑佳  (74)专利代理 机构 北京同达信恒知识产权代理 有限公司 1 1291 专利代理师 杜晶 (51)Int.Cl. G06V 20/52(2022.01) G06V 40/10(2022.01) G06V 10/44(2022.01) G06V 10/764(2022.01) G06N 3/12(2006.01) (54)发明名称 一种识别模型的训练方法、 装置、 电子设备 和存储介质 (57)摘要 本申请涉及图像识别技术领域, 尤其涉及一 种识别模型的训练方法、 装置、 电子设备和存储 介质, 用以提高对目标物体的穿戴识别准确率。 其中, 方法包括: 根据目标训练样本集, 对训练 中 的识别模型执行循环迭代训练, 获得已训练的用 于确定目标对象是否穿戴目标物体的识别模型; 在一次训练中, 对目标训练样 本中的目标样本图 像进行特征提取, 获得至少两个样本对象特征, 基于样本对象特征获得目标样本图像的预测穿 戴类别, 以及各样本对象特征的预测场景类别; 基于预测穿戴类别和标注穿戴类别之间的差异, 和各预测场景类别与标注场景类别之间的差异, 对识别模型进行参数调整。 由于本申请通过已训 练的识别模 型确定目标对象是否穿戴目标物体, 提高识别准确率。 权利要求书4页 说明书19页 附图8页 CN 114882437 A 2022.08.09 CN 114882437 A 1.一种识别模型的训练方法, 其特 征在于, 该 方法包括: 根据目标训练样本集, 对训练中的识别模型执行循环迭代训练, 获得已训练的识别模 型; 所述已训练的识别模型用于识别待识别图像中的目标对 象是否穿戴目标物体; 每个目 标训练样本包括: 目标样本图像, 及表征所述 目标样本图像中的样本对 象是否穿戴目标物 体的标注穿戴类别, 和表征所述 目标样本图像的采样场景 的标注场景类别; 在一次循环迭 代训练中执 行以下操作: 利用所述训练中的识别模型对选取的目标训练样本中的目标样本图像进行多维度特 征提取, 获得至少 两个不同维度的样本对 象特征, 并基于所述至少 两个不同维度的样本对 象特征, 获得所述 目标样本图像对应的预测穿戴类别, 及各个样本对 象特征对应的预测场 景类别; 基于所述预测穿戴类别和所述标注穿戴类别之间的差异, 及各个预测场景类别与 所述 标注场景类别之间的差异, 对所述训练中的识别模型进行参数调整。 2.如权利要求1所述的方法, 其特征在于, 所述样本对象特征包括第一样本对象特征、 第二样本对象特 征和第三样本对象特 征; 所述利用所述训练中的识别模型对选取的目标训练样本中的目标样本图像进行多维 度特征提取, 获得至少两个不同维度的样本对象特 征, 包括: 对所述目标样本图像进行全局 和局部特征提取, 获得样本图像特 征; 对所述样本图像特 征进行特征映射, 获得图像维度的第一样本对象特 征; 对所述第一样本对象特 征进行特征映射, 获得实例维度的第二样本对象特 征; 对所述第二样本对象特 征进行穿戴特 征提取, 获得像素维度的第三样本对象特 征。 3.如权利要求2所述的方法, 其特 征在于, 通过以下 方式获得 所述样本对象特 征: 对待映射特 征进行目标检测, 获得检测目标的预测边界信息; 基于所述预测边界信息, 将所述待映射特 征映射为所述样本对象特 征; 其中, 若所述待映射特征为所述样本图像特征, 则所述检测目标为样本对象, 所述样本 对象特征为所述第一样本对 象特征; 若所述待映射特征为所述第一样本对 象特征, 则所述 检测目标为所述样本对象中与所述目标物体穿戴相关的目标部位, 所述样本对象特征为所 述第二样本对象特 征。 4.如权利要求1所述的方法, 其特征在于, 所述识别模型包括域分类网络; 通过以下方 式获得所述各个样本对象特 征对应的预测场景类别, 包括: 分别将所述各个样本对象特征输入对应的所述域分类网络, 获得所述各个样本对象特 征各自对应的预测场景类别。 5.如权利要求2所述的方法, 其特征在于, 所述识别模型包括穿戴分类网络; 所述基于 所述至少 两个不同维度的样本对 象特征, 获得所述 目标样本图像对应的预测 穿戴类别, 包 括: 将所述第三样本对象特征输入所述穿戴分类网络, 获得所述目标样本图像对应的预测 穿戴类别。 6.如权利要求3所述的方法, 其特征在于, 每个目标训练样本还包括: 所述目标样本 图 像的中的样本对象的标注边界信息以及所述目标部位的标注边界信息; 所述对待映射特征 进行目标检测, 获得检测目标的预测边界信息, 包括:权 利 要 求 书 1/4 页 2 CN 114882437 A 2基于所述待 映射特征中的至少一个正样本单元, 对所述检测目标进行边界预测, 获得 所述检测目标的至少一个候选边界信息; 基于所述至少一个候选边界信息的置信度, 确定所述检测目标的预测边界信息, 所述 至少一个候选边界信息的置信度是基于各个候选边界信息与相 应的标注边界信息之间的 交并比确定的。 7.如权利要求6所述的方法, 其特征在于, 所述预测边界信息包括: 所述检测目标的预 测中心位置坐标和预测对 象框尺寸; 所述基于所述待映射特征中的至少一个正样本单元, 对所述检测目标进行边界预测, 获得 所述检测目标的至少一个预测边界信息, 包括: 对每个正样本单 元, 分别执 行以下操作: 针对一个正样本单元, 确定所述检测目标的中心位置信息, 以及所述中心位置信息对 应的位置偏移信息; 基于所述位置偏移信 息对所述中心位置信 息进行调整, 获得所述检测目标的预测中心 位置坐标; 基于所述预测中心位置坐标, 获得 所述检测目标的预测对象框尺寸。 8.如权利要求6所述的方法, 其特 征在于, 通过以下 方式获得 所述正样本单 元: 基于所述标注边界信息, 确定 至少一个候选样本单 元; 基于所述各个候选样本单元各自的候选边界信 息与相应的标注边界信 息之间的差异, 确定所述各个候选样本单 元各自的损失值; 将各个损失值按照大小排序, 并将排序结果在第 一预设次序范围内的损失值对应的候 选样本单 元作为所述 正样本单 元。 9.如权利要求8所述的方法, 其特 征在于, 通过以下 方式确定所述第一预设次序范围: 分别确定各个候选样本单 元各自的预测边界信息与标注边界信息之间的交并比; 将各个交并比按照大小排序, 并基于排序 结果在第 二预设次序 范围内的交并比确定所 述第一预设次序范围。 10.如权利要求1~9任一项所述的方法, 其特征在于, 通过以下方式获取所述目标训练 样本集, 包括: 获取初始训练样本集, 所述初始训练样本集中的每个初始训练样本包括初始样本图 像, 所述初始训练样本集中的样本图像是通过对不同的采样场景进行采样获得的; 基于至少一种数据增强方式, 以及各个数据增强方式各自对应的至少一个目标增强参 数, 对所述初始训练样本集进行扩充, 获得 所述目标训练样本集。 11.如权利要求10所述的方法, 其特征在于, 在所述基于至少一种数据增强方式, 以及 各个数据增强方式各自对应的至少一个目标增强参数, 对所述初始训练样本集进行扩充, 获得所述目标训练样本集之前, 还 包括: 对所述初始训练样本集中的各个初始样本图像进行抠图粘贴, 获得中间训练样本集; 所述基于至少一种数据增强方式, 以及各个数据增强方式各自对应的至少一个目标增 强参数, 对所述初始训练样本集进行扩充, 获得 所述目标训练样本集, 包括: 基于所述至少一种数据增强方式, 以及各个数据增强方式各自对应的至少一个目标增 强参数, 对所述中间训练样本集中的中间样本图像进行数据增强, 获得所述 目标训练样本 集。权 利 要 求 书 2/4 页 3 CN 114882437 A 3

PDF文档 专利 一种识别模型的训练方法、装置、电子设备和存储介质

文档预览
中文文档 32 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共32页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种识别模型的训练方法、装置、电子设备和存储介质 第 1 页 专利 一种识别模型的训练方法、装置、电子设备和存储介质 第 2 页 专利 一种识别模型的训练方法、装置、电子设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:10:29上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。