(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210815688.3
(22)申请日 2022.07.12
(71)申请人 东莞理工学院
地址 523000 广东省东莞 市松山湖科技产
业园区大 学路1号
(72)发明人 张兆云 蔡德隆
(74)专利代理 机构 合肥市浩智运专利代理事务
所(普通合伙) 34124
专利代理师 朱文振
(51)Int.Cl.
G06V 20/17(2022.01)
G06V 10/44(2022.01)
(54)发明名称
基于XML位置信息的高分辨率图像小目标训
练方法及系统
(57)摘要
本发明提供基于XML位置信息的高分辨率图
像小目标训练方法及系统, 方法包括: 采集获取
线路巡检高分辨率原图像, 数据标注线路巡检高
分辨率原图像, 以生成的xml文件, 提取xml文件
的对应标注框位置信息; 在 线路巡检高分辨率原
图像中裁剪标注框区域以及周边信息, 生成适用
新图像; 获取线路巡检高分辨率原图像与适用新
图像的坐标映射关系, 根据坐标映射关系从线路
巡检高分辨率原 图像剪裁的左上角点和右下角
点进行坐标重置, 以获得适用新图像的左上角点
和右下角点; 根据坐标点映射关系同步更新xml
文件中对应的目标标注框的位置以及适用新图
像的高和宽; 将适用新图像输入预置网络中训
练, 以得到目标区域训练结果。 本发明解决了模
型训练复杂以及训练效果 不佳的技 术问题。
权利要求书3页 说明书8页 附图2页
CN 115410099 A
2022.11.29
CN 115410099 A
1.基于XML 位置信息的高分辨 率图像小目标训练方法, 其特 征在于, 所述方法包括:
S1、 采集获取线路巡检高分辨率原图像, 数据标注所述线路巡检 高分辨率原图像, 以生
成的xml文件, 提取 所述xml文件的对应标注框位置信息;
S2、 在所述线路巡检高分辨率原图像中裁剪标注框区域以及周边信息, 生成适用新图
像, 其中, 所述 步骤S2包括:
S21、 获取 所述线路巡检高分辨 率原图像的高(H)与宽(W);
S22、 指定扩充倍数;
S23、 按所述指定扩充倍数在所述线路巡检高分辨率原图像上扩充目标区域, 据以获取
新生成图像的坐标点: (re_xmi n,re_ymi n)和(re_xmax,re_ymax);
S24、 根据所述步骤S23所获取 的所述新生成 图像的坐标点(re_xmin,re_ymin)和(re_
xmax,re_ymax)裁 剪所述线路巡检高分辨 率原图像, 据以生成所述 适用新图像;
S3、 获取所述线路巡检高分辨率原图像与所述适用新图像的坐标映射关系, 根据所述
坐标映射关系从所述线路巡检高分辨率原图像剪裁的左上角点(re_xmin,re_ ymin)和右下
角点(re_xmax,re_ymax)进行坐标重置, 以获得所述适用新图像的左上角点(0,0)和右下角
点(re_xmax ‑re_xmin,re_ymax ‑re_ymin);
S4、 根据所述坐标点映射关系同步更新所述xml文件中对应的目标标注框的位置以及
所述适用新图像的高和宽;
S5、 将所述 适用新图像输入预置网络中训练, 以得到目标区域训练结果。
2.根据权利要求1所述的基于XML位置信 息的高分辨率图像小目标训练方法, 其特征在
于, 所述步骤S1 中, 所述对应标注框位置信息包括: 标注框左上角点信息(xmin,ymin)、 右下
角点信息(xmax,ymax)、 框高(height)以及框 宽(width)。
3.根据权利要求1所述的基于XML位置信 息的高分辨率图像小目标训练方法, 其特征在
于, 所述步骤S22中, 所述扩充倍数指定值包括: pad ding_num=10 。
4.根据权利要求1所述的基于XML位置信 息的高分辨率图像小目标训练方法, 其特征在
于, 所述步骤S23中, 获取所述目标区域在所述线路巡检高分辨率原图像中的目标区域位置
数据, 据以利用预置扩充方式扩充所述目标区域, 以得到所述 新生成图像的坐标点。
5.根据权利要求1所述的基于XML位置信 息的高分辨率图像小目标训练方法, 其特征在
于, 所述步骤S23包括:
S231、 如果向左和向上扩充越界, 则指定向右和向下扩充padding_num倍数, 据以更新
所述坐标点;
S232、 如果只向上扩充越界, 则指定向下扩充padding_num倍数, 向左和向右分别扩充
padding_num/2倍数, 据以更新所述 坐标点;
S233、 如果向上和向右扩充越界, 则指定向左和向下扩充padding_num倍数, 据以更新
所述坐标点;
S234、 如果只向左扩充越界, 则指定向右扩充padding_num倍数, 向上和向下分别扩充
padding_num/2倍数, 据以更新所述 坐标点;
S235、 如果向四周扩充均不越界, 则指定向左、 向右、 向上和向下分别扩充padding_
num/2倍数, 据以更新所述 坐标点;
S236、 如果只向右扩充越界, 则指定向左扩充padding_num倍数, 向上和向下分别扩充权 利 要 求 书 1/3 页
2
CN 115410099 A
2padding_num/2倍数, 据以更新所述 坐标点;
S237、 如果向左和向下扩充越界, 则指定向右和向上扩充padding_num倍数, 据以更新
所述坐标点;
S238、 如果只向下扩充越界, 则指定向上扩充padding_num倍数, 向左和向右分别扩充
padding_num/2倍数, 据以更新所述 坐标点;
S239、 如果向下和向右扩充越界, 则指定向上和向左扩充padding_num倍数, 据以更新
所述坐标点。
6.根据权利要求1所述的基于XML位置信 息的高分辨率图像小目标训练方法, 其特征在
于, 所述步骤S3中, 利用下述逻辑获取所述线路巡检高分辨率原图像与所述适用新图像的
坐标映射关系:
7.根据权利要求1所述的基于XML位置信 息的高分辨率图像小目标训练方法, 其特征在
于, 所述步骤S4中, 利用下述逻辑, 根据所述坐标点映射关系同步更新所述xml文件中对应
的所述目标 标注框的位置:
8.根据权利要求1所述的基于XML位置信 息的高分辨率图像小目标训练方法, 其特征在
于, 所述步骤S4中, 利用下述逻辑, 根据所述坐标点映射关系同步更新所述适用新图像的高
和宽:
9.根据权利要求1所述的基于XML位置信 息的高分辨率图像小目标训练方法, 其特征在
于, 所述步骤S5中, 所述预置网络的默认输入尺寸 为640*640。
10.基于XML 位置信息的高分辨 率图像小目标训练系统, 其特 征在于, 所述系统包括:
xml文件处理模块, 用以采集获取线路巡检高分辨率原图像, 数据 标注所述线路巡检高
分辨率原图像, 以生成的xml文件, 提取 所述xml文件的对应标注框位置信息;
适用新图像生成模块, 用以在所述线路巡检 高分辨率原图像中裁剪标注框区域以及周
边信息, 生成适用新图像, 所述适用新图像生 成模块与所述xml文件处理模块连接, 其中, 所
述适用新图像生成模块包括:
原图参数模块, 用以获取 所述线路巡检高分辨 率原图像的高(H)与宽(W);
倍数模块, 用以指定扩充倍数;
目标区域扩充模块, 用以按所述指定扩充倍数在所述线路巡检 高分辨率原图像上扩充
目标区域, 据以获取新生成图像的坐标点: (re_xmin,re_ ymin)和(re_xmax,re_ymax), 所述
目标区域扩充模块与所述原图参数模块及所述 倍数模块连接;
裁剪模块, 用以根据所述步骤S23所获取的所述新生成图像的坐标点(re_xmin,re_权 利 要 求 书 2/3 页
3
CN 115410099 A
3
专利 基于XML位置信息的高分辨率图像小目标训练方法及系统
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-24 00:42:51上传分享