全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210109350.6 (22)申请日 2022.01.28 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 何斌  (74)专利代理 机构 北京钲霖知识产权代理有限 公司 11722 专利代理师 李英艳 杨继成 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/44(2022.01) G06V 40/16(2022.01) G06V 20/00(2022.01) G06V 10/26(2022.01)G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/08(2006.01) (54)发明名称 训练模型的方法、 装置、 电子设备、 存储介质 及产品 (57)摘要 本公开提供了一种训练模型的方法、 装置、 电子设备、 存储介质及产品, 涉及人工智能技术 领域, 尤其涉及计算机视觉, 图像处理, 深度学习 等领域。 具体实现方案为: 获取第一图像集, 并调 用第一模型以及第二模型, 通过第一模型和第二 模型分别对第一图像集进行目标检测, 基于第一 目标检测结果和第二目标检测结果, 确定误检图 像; 生成包括误检图像的第二图像集, 并基于第 二图像集训练第一模型。 本公开通过对比第一模 型和第二模 型得到的目标检测结果, 确定第一模 型检测错误的误检图像。 利用包括有误检图像的 图像集对第一模 型进行训练, 使第一模型有针对 性学习误检图像的特征, 避免再次出现误检情 况, 进而提高了目标检测的准确率。 权利要求书2页 说明书8页 附图5页 CN 114445682 A 2022.05.06 CN 114445682 A 1.一种训练模型的方法, 包括: 获取第一图像集, 并调用第一模型以及第二模型, 通过所述第一模型和所述第二模型 分别对所述第一图像集进 行目标检测, 所述第一模型的目标检测准确度小于所述第二模型 的目标检测准确度; 确定所述第 一模型对所述第 一图像集进行目标检测的第 一目标检测结果, 并确定所述 第二模型对所述第一图像集进行目标检测的第二目标检测结果; 基于所述第一目标检测结果和所述第二目标检测结果, 确定误检图像; 生成包括所述 误检图像的第二图像集, 并基于所述第二图像集训练所述第一模型。 2.根据权利要求1所述的方法, 其中, 所述 生成包括所述 误检图像的第二图像集, 包括: 在目标数据库中, 获取多张目标图像, 所述目标图像中包括有所述第一模型和所述第 二模型进行目标检测的检测目标; 将所述多张目标图像与所述 误检图像进行组合, 生成包括组合后图像的第二图像集。 3.根据权利要求2所述的方法, 其中, 所述将所述多 张目标图像与所述误检图像进行组 合, 包括: 对所述误检图像进行 预处理, 得到误检区域图像; 对所述多张目标图像进行 预处理, 得到多张目标区域图像; 组合所述误检区域图像以及所述多张目标区域图像, 得到组合后图像, 其中, 所述组合 后图像的中心为所述 误检区域图像, 所述多张目标区域图像位于所述 误检区域图像周边。 4.根据权利要求3所述的方法, 其中, 所述误检区域图像与所述多 张目标区域图像以特 定方式呈现, 所述特定方式包括九宫格形式、 十 字形式和X 形式。 5.根据权利要求3所述的方法, 其中, 所述对所述误检图像进行预处理, 得到误检区域 图像, 包括: 扩展所述 误检图像的尺寸, 并在所述 误检图像中确定误检区域; 在扩展尺寸后的误检图像中裁 剪得到包括 误检区域的误检区域图像。 6.根据权利要求1 ‑5中任意一项所述的方法, 其中, 所述基于所述第 一目标检测结果和 所述第二目标检测结果, 确定误检图像, 包括: 确定第一模型对第 一图像集中第 一图像的第 一目标检测结果, 并确定所述第 二模型对 所述第一图像的第二目标检测结果; 确定所述第一目标检测结果和第二目标检测结果的交并比; 若所述交并比小于阈值, 则将所述第一图像确定为 误检图像。 7.一种训练模型的装置, 包括: 目标检测单元, 用于获取第 一图像集, 并调用第 一模型以及第二模型, 通过所述第一模 型和所述第二模型分别对所述第一图像集进 行目标检测, 所述第一模型的目标检测准确度 小于所述第二模型的目标检测准确度; 确定单元, 用于确定所述第 一模型对所述第 一图像集进行目标检测的第 一目标检测结 果, 并确定所述第二模型对所述第一图像集进行目标检测的第二 目标检测结果, 还用于基 于所述第一目标检测结果和所述第二目标检测结果, 确定误检图像; 生成单元, 用于生成包括所述 误检图像的第二图像集; 训练单元, 用于基于所述第二图像集训练所述第一模型。权 利 要 求 书 1/2 页 2 CN 114445682 A 28.根据权利要求7 所述的装置, 其中, 所述 生成单元, 还用于: 在目标数据库中, 获取多张目标图像, 所述目标图像中包括有所述第一模型和所述第 二模型进行目标检测的检测目标; 将所述多张目标图像与所述 误检图像进行组合, 生成包括组合后图像的第二图像集。 9.根据权利要求8所述的装置, 其中, 所述 生成单元, 还用于: 对所述误检图像进行 预处理, 得到误检区域图像; 对所述多张目标图像进行 预处理, 得到多张目标区域图像; 组合所述误检区域图像以及所述多张目标区域图像, 得到组合后图像, 其中, 所述组合 后图像的中心为所述 误检区域图像, 所述多张目标区域图像位于所述 误检区域图像周边。 10.根据权利要求9所述的装置, 其中, 所述误检区域图像与所述多张目标区域图像以 特定方式呈现, 所述特定方式包括九宫格形式、 十 字形式和X 形式。 11.根据权利要求9所述的装置, 其中, 所述 生成单元, 还用于: 扩展所述 误检图像的尺寸, 并在所述 误检图像中确定误检区域; 在扩展尺寸后的误检图像中裁 剪得到包括 误检区域的误检区域图像。 12.根据权利要求7 ‑11中任意一项所述的装置, 其中, 所述确定单 元, 用于: 确定第一模型对第 一图像集中第 一图像的第 一目标检测结果, 并确定所述第 二模型对 所述第一图像的第二目标检测结果; 确定所述第一目标检测结果和第二目标检测结果的交并比; 若所述交并比小于阈值, 则将所述第一图像确定为 误检图像。 13.一种电子设备, 包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的指令, 所述指令被所述至少一个处 理器执行, 以使所述至少一个处 理器能够执 行权利要求1 ‑6中任一项所述的方法。 14.一种存储有计算机指令的非瞬时计算机可读存储介质, 其中, 所述计算机指令用于 使所述计算机执 行根据权利要求1 ‑6中任一项所述的方法。 15.一种计算机程序产品, 包括计算机程序, 所述计算机程序在被处理器执行时实现根 据权利要求1 ‑6中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114445682 A 3

PDF文档 专利 训练模型的方法、装置、电子设备、存储介质及产品

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 训练模型的方法、装置、电子设备、存储介质及产品 第 1 页 专利 训练模型的方法、装置、电子设备、存储介质及产品 第 2 页 专利 训练模型的方法、装置、电子设备、存储介质及产品 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:12:14上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。