全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210397447.1 (22)申请日 2022.04.15 (71)申请人 浙江工业大 学 地址 310014 浙江省杭州市下城区潮王路 18号 (72)发明人 单沛婷 陈婷 杨骝 张宇杰  陈奕骁 张雨萌 陈依梦 杨旭升  (74)专利代理 机构 杭州求是专利事务所有限公 司 33200 专利代理师 邱启旺 (51)Int.Cl. G06V 20/10(2022.01) G06N 3/08(2006.01) G06N 3/04(2006.01) G06V 10/764(2022.01)G06V 10/44(2022.01) G06V 10/82(2022.01) (54)发明名称 一种基于垃圾目标检测的图像识别改进方 法 (57)摘要 本发明公开了一种基于垃圾目标检测的图 像识别改进方法, 所述方法将垃圾数据集经标记 光斑区域、 归一化处理后作为样本数据集; 然后 构建并训练针对光斑的目标检测模 型, 得到光斑 区域特征; 再对光斑区域特征取补, 得到图片像 素权重矩阵; 然后构建并训练垃圾分类模型; 最 后将待测图像输入训练好的垃圾 分类模型, 将待 测图像中所有像素的像素值与图片像素权重矩 阵相乘输入训练好的垃圾分类模 型, 得到分类结 果。 权利要求书1页 说明书6页 附图3页 CN 115115932 A 2022.09.27 CN 115115932 A 1.基于垃圾目标检测的图像识别改进方法, 其特 征在于, 所述方法具体包括以下步骤: S1, 将垃圾数据集经 标记光斑区域、 归一 化处理后作为样本数据集; S2, 构建并训练针对光斑的目标检测模型, 将样本数据集输入针对光斑的目标检测模 型中, 得到图像中的光斑区域特 征; S3, 对光斑区域特 征取补, 得到图片像素权 重矩阵; S4, 构建并训练垃圾分类模型; S5, 将待测图像输入训练好的垃圾分类模型, 将待测图像中所有像素的像素值与图片 像素权重矩阵相乘输入训练好的垃圾分类模型, 得到分类结果。 2.根据权利要求1所述的基于垃圾目标检测的图像识别改进方法, 其特征在于, 所述垃 圾数据集中的图像包括废纸箱、 玻璃、 非金属、 纸、 塑料、 干电池、 充电宝、 剩 饭剩菜、 水果果 皮、 烟蒂。 3.根据权利要求1所述的基于垃圾目标检测的图像识别改进方法, 其特征在于, 针对光 斑的目标检测模型为监督模型, 其标签是标记的光斑区域的光斑区域标签。 本实施例中, 包 括特征提取器和置信度生成器两部 分, 其中特征提取器采用5个卷积层, 光斑置信度生 成器 采用2个反卷积层构成的网络, 激活函数采用Relu函数。 4.根据权利要求1所述的基于垃圾目标检测的图像识别改进方法, 其特征在于, 训练针 对光斑的目标检测模 型具体为: 将垃圾数据集中的每张图片作为标签, 设置训练批次, 采用 预热学习率策略, 优化器采用Adam进 行优化, 损失函数采用峰值信噪比(PSNR)的形式, 利用 验证集进行验证, 直至模型的准确率达 到预设的标准或损失函数收敛完成训练。 5.根据权利要求1所述的基于垃圾目标检测的图像识别改进方法, 其特征在于, 对光斑 区域特征取补的公式如下: Wmodel=I‑W 其中I表示所有元素均为1的矩阵, W为光斑区域特征, 得到的Wmodel则为图片像素权重矩 阵。 6.根据权利要求1所述的基于垃圾目标检测的图像识别改进方法, 其特征在于, 垃圾分 类模型为监督模型, 包括特征提取器和分类器两部分, 其中特征提取器采用5个卷积层, 分 类器采用2个全连接层构成的网络 。 7.根据权利要求1所述的基于垃圾目标检测的图像识别改进方法, 其特征在于, 训练垃 圾分类模型 的过程为: 将垃圾数据集划分为训练集和测试集, 使用训练集对垃圾分类模型 进行训练, 将每张图片依次输入到模型中, 并计算图片像素权重矩阵, 将所有图片的RGB值 都和对应的图片像素权重矩阵相乘后再输入到模型中, 以达到削弱光斑影响的目的; 设定 训练批次, 在训练阶段采用预热学习率策略, 优化器采用Adam进 行优化, 损失函数采用交叉 熵的形式; 通过验证集验证模型识别准确 率, 直至模型 的准确率达到预设的标准或损失函 数收敛完成训练。 8.一种电子设备, 包括存储器和 处理器, 其特征在于, 所述存储器与所述处理器耦接; 其中, 所述存储器用于存储程序数据, 所述处理器用于执行所述程序数据以实现上述权利 要求1‑7任一项所述的基于垃圾目标检测的图像识别改进方法。 9.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述程序被处理器 执行时实现如权利要求1 ‑7中任一所述的基于垃圾目标检测的图像识别改进方法。权 利 要 求 书 1/1 页 2 CN 115115932 A 2一种基于垃圾目标 检测的图像识别改进方 法 技术领域 [0001]本发明涉及深度学习模型的图像识别环境鲁棒性差的问题, 提出了一种基于目标 检测的深度学习模型图像识别改进方法。 背景技术 [0002]深度学习模型拥有强大的学习样本数据集内在函数规律和 分析抽象化特征的能 力, 近年来在很多领域辅助人们做出决策并给很多复杂的识别以及分类问题提供了解决方 案。 深度学习在生物信息学、 图形图像识别、 语音识别、 无人驾驶汽车、 艺术创作、 情感识别、 自然语言处理、 银行、 监狱、 生涯评估和刑事司法判决等领域都起到了很好的效果。 并且随 着相关科研工作人员的不断努力, 深度学习模型 的效率不断提高, 近年来 随着卷积神经网 络的提出, 依托于深度神经网络的图像识别技 术更是被抬上了一个新的高度。 [0003]传统的垃圾分类都需要人为进行辨识, 近年来, 科研人员将深度学习模型的图像 分类技术引入垃圾分类的应用场景。 但是 由于开发环境和真实应用场景存在较大差别, 因 此相关算法的迁移效果并不理想。 鉴于重新采集数据成本高, 其余客观条件无法改变的情 况, 发明一种可以使得模型能够从现有实验室场景成功迁移到 真实应用场景的方法显得十 分必要。 [0004]例如, 当实验室光照条件良好, 但是真实应用场景通常不具备良好的照明条件, 因 此当使用在实验室场景下制造的数据集训练垃圾分类模型, 将会在真实应用场景下产生准 确率降低的问题, 本示例中将以光照为例, 发明一种 可以针对特殊情况 的深度学习模型图 像识别的改进方法。 发明内容 [0005]为了解决深度学习模型图像识别现有的应用场景迁移后效果较差的问题, 本发明 提供了一种基于目标检测的深度学习模型图像识别改进方法, 依托于场景主要差别, 实现 削弱特殊特征, 实现应用场景迁移后, 深度学习模 型图像识别正确率的改进, 以缓解模型在 应用场景和数据集有一定 差别的情况 下, 模型识别准确率较差的问题。 [0006]为实现上述技术目的, 本发明的方案为: 本发明实施例的第一方面提供了基于垃 圾目标检测的图像识别改进方法, 所述方法具体包括以下步骤: [0007]S1, 将垃圾数据集经 标记光斑区域、 归一 化处理后作为样本数据集; [0008]S2, 构建并训练针对光斑 的目标检测模型, 将样本数据集输入针对光斑 的目标检 测模型中, 得到图像中的光斑区域特 征; [0009]S3, 对光斑区域特 征取补, 得到图片像素权 重矩阵; [0010]S4, 构建并训练垃圾分类模型; [0011]S5, 将待测图像输入训练好的垃圾分类模型, 将待测图像中所有像素的像素值与 图片像素权 重矩阵相乘输入训练好的垃圾分类模型, 得到分类结果。 [0012]进一步地, 所述垃圾数据集中的图像包括废纸箱、 玻璃、 非金属、 纸、 塑料、 干电池、说 明 书 1/6 页 3 CN 115115932 A 3

PDF文档 专利 一种基于垃圾目标检测的图像识别改进方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于垃圾目标检测的图像识别改进方法 第 1 页 专利 一种基于垃圾目标检测的图像识别改进方法 第 2 页 专利 一种基于垃圾目标检测的图像识别改进方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:11:06上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。