全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210697551.2 (22)申请日 2022.06.20 (71)申请人 华南理工大 学 地址 510640 广东省广州市天河区五山路 381号 (72)发明人 张铁 郭亮亮 邹焱飚  (74)专利代理 机构 广州市华学知识产权代理有 限公司 4 4245 专利代理师 郑秋松 (51)Int.Cl. G06T 7/00(2017.01) G06T 7/73(2017.01) G06V 10/44(2022.01) G06V 10/764(2022.01) G06V 10/766(2022.01)G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于YOLOv4-tiny模型的工件类别与位姿估 计方法 (57)摘要 本发明公开了一种基于YOLOv4 ‑tiny模型的 工件类别 与位姿估计方法, 包括以下步骤: S1、 对 YOLOv4‑tiny模型的特征提取网络进行轻量化, 特征提取网络对输入图像进行特征提取并输出 不同尺度的特征图; S2、 设置多组不同宽高和旋 转角度的锚框, 并分派到不同尺度的特征图上, 根据模型输出的预测结果生成相应的预测框; S3、 采集目标工件的图像数据, 使用旋转边界框 对目标工件的类别和位姿进行标注, 通过数据增 广预处理后获得数据集; S4、 利用数据集对 YOLOv4‑tiny模型进行迭代训练, 训练至损失函 数不再下降, 获取检测工件的最优YOLOv4 ‑tiny 模型; S5、 利用最优YOLOv 4‑tiny模型执行在线网 络推理, 对模型的预测结果进行后处理, 预测目 标工件的类别、 位置和姿态。 本发明能实现高效 的工件视 觉分类和位姿 估计。 权利要求书3页 说明书9页 附图3页 CN 115100136 A 2022.09.23 CN 115100136 A 1.一种基于YOLOv4 ‑tiny模型的工件类别与位姿估计方法, 其特征在于, 包括以下步 骤: S1、 对YOLOv4 ‑tiny模型的特征提取网络进行轻量化, 特征提取网络对输入图像进行特 征提取并输出不同尺度的特 征图; S2、 设置多组不同宽高和旋转角度的锚框, 并分派到不同尺度的特征图上, 根据模型输 出的预测结果 生成相应的预测框; S3、 采集目标工件的图像数据, 使用旋转边界框对目标工件的类别和位姿进行标注, 通 过数据增广预处 理后获得 数据集; S4、 利用数据集对YOLOv4 ‑tiny模型进行迭代训练, 训练至损失函数不再下降, 获取检 测工件的最优YOLOv4 ‑tiny模型; S5、 利用最优YOLOv4 ‑tiny模型执行在线网络推理, 对模型的预测结果进行后处理, 预 测目标工件的类别、 位置和姿态。 2.如权利要求1的基于YOLOv4 ‑tiny模型的工件类别与位姿估计方法, 其特征在于, 步 骤S1中, 使用可分离幻影卷积模块对YOLOv4 ‑tiny模型的特征提取网络进行轻量化, 可分离 幻影卷积模块包括逆深度可分离卷积和通道卷积线性运算, 逆深度可分离卷积用于生成 固 有特征图, 通道卷积线性运算用于生成幻影特征图; 逆深度可分离卷积可分解为点卷积和 深度卷积, 点卷积用于处理输入特征图的通道信息, 深度卷积用于处理输入特征图的空间 信息。 3.如权利要求2的基于YOLOv4 ‑tiny模型的工件类别与位姿估计方法, 其特征在于, 使 用可分离幻影卷积替换 标准卷积时, 计算 量的压缩比为: 其中, ci为输入通道 数, co为输出通道数, wi为输入特征图的宽, hi为输入特征图的高, wo 为输出特征图的宽, ho为输出特征图的高, s为压缩比参数, d为通道卷积线性运算的核尺寸 大小, k为原标准卷积的核尺寸大小, d≈ k且s<<ci, ci>>1。 4.如权利要求1的基于YOLOv4 ‑tiny模型的工件类别与位姿估计方法, 其特征在于, 步 骤S2中, 设置6组不同宽高的锚框, 并为每组锚框 设置6组不同的旋转角度, 然后将各 组锚框 分派到不同尺度的输出 特征图, 分别回归大目标和小目标。 5.如权利要求1的基于YOLOv4 ‑tiny模型的工件类别与位姿估计方法, 其特征在于, 步 骤S3中, 使用长边表 示法对采集的目标工件图像数据进 行参数标注, 具体方式为: 使用参数 集{x,y,w,h, θ,cls}来表示旋转边界框, 其中, x和y表示边界框中心点的坐标, w表示边界框 的宽, h表示边界框的高, 宽指 长边, 高指短边, θ是长边与X轴正向的夹角, 逆时针方向为正, 顺时针方向为负, cls为工件类别。权 利 要 求 书 1/3 页 2 CN 115100136 A 26.如权利要求1的基于YOLOv4 ‑tiny模型的工件类别与位姿估计方法, 其特征在于, 步 骤S3中, 制作数据集时使用数据增广的方式对原 始数据集进行扩充, 具体为: 对采集的目标工件图像使用随机缩放、 旋转和平移 的数据增广方法, 并对标签数据作 相应的变换, 然后为图像数据添加随机高斯噪音, 利用黑色像素将图像数据填充为正方形, 再按网络输入要求调整图像大小, 最后以4:1的比例将扩充后的数据集划分为训练集和测 试集。 7.如权利要求1的基于YOLOv4 ‑tiny模型的工件类别与位姿估计方法, 其特征在于, 步 骤S4中, 在YOLOv4 ‑tiny模型训练阶段, 计算旋转预测框与旋转真实框的交并比skewIoU, 并 根据交并比和角度差大小区分预测框为前 景或者背景。 8.如权利要求7的基于配网要素和神经网络的配网风险评估方法, 其特征在于, 步骤S4 中, 损失函数L由分类损失函数Lcls、 置信度损失函数Lconf和回归损失函数Lreg组成, 计算公 式分别如下: L=Lcls+Lconf+Lreg 其中, N是锚框的总数, Nobj是前景锚框的数量, Nnoobj是背景锚框的数量, 和 是二 元值; 当锚框n为前景时, 等于1, 当锚框n为背景时, 等于0, 则相反; λ1, λ2, λ3, λ4 是权衡各类损失的超参数, pn为类别的真实值, rn为置信度的真实值, qn是经过Sigmoid函数 归一化到(0,1)的各分类概率的预测值, tn是经过Sigmoid函数归一化到(0,1)的置信度的 预测值, un是真实边界框, vn是预测边界框, 是真实水平边界框, 是预测水平边界框 。 9.如权利要求8的基于配网要素和神经网络的配网风险评估方法, 其特征在于, 回归损 失函数Lreg中引入了基于ArIoU的常数因子 决定了梯度传播的方 向, |LArIoU|决定了梯度传播的大小, 是传统旋转边界框的回归损失函数, 的计算公 式如下: 其中, un是真实边界框, vn是预测边界框, 是真实水平边界框, 是预测水平边界框; 包括 损失函数和CIoU损失函数, 损失函数和CIoU损失函数分别 为:权 利 要 求 书 2/3 页 3 CN 115100136 A 3

PDF文档 专利 基于YOLOv4-tiny模型的工件类别与位姿估计方法

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于YOLOv4-tiny模型的工件类别与位姿估计方法 第 1 页 专利 基于YOLOv4-tiny模型的工件类别与位姿估计方法 第 2 页 专利 基于YOLOv4-tiny模型的工件类别与位姿估计方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:43:14上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。