全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210158191.9 (22)申请日 2022.02.21 (71)申请人 平安科技 (深圳) 有限公司 地址 518000 广东省深圳市福田区福田街 道福安社区益田路5033号平 安金融中 心23楼 (72)发明人 郑喜民 翟尤 舒畅 陈又新  (74)专利代理 机构 深圳市明日今典知识产权代 理事务所(普通 合伙) 44343 专利代理师 王杰辉 曹勇 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/776(2022.01) G06V 10/44(2022.01) G06V 10/50(2022.01)G06V 10/32(2022.01) G06V 10/24(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 数据增强处理方法、 装置、 计算机设备及存 储介质 (57)摘要 本申请为人工智能技术的神经网络技术领 域, 提供了一种数据增强处理方法、 装置、 计算机 设备及存储介质, 其中, 该方法包括: 将数据集划 分为多个子数据集, 为每个子数据集选取不同的 数据增强策略, 依照每个子数据集的第一数据增 强策略分别对相应的子数据集进行数据增强处 理, 得到目标子数据集; 将每个目标子数据集分 别输入预设的神经网络模型进行训练, 将多个训 练结果进行相互比对, 筛选出训练效果最优的目 标训练结果; 确定目标训练结果对应的目标数据 增强策略, 获取总数据集, 调用目标数据增强策 略对总数据集中的所有数据进行数据增强处理, 得到目标数据集, 以选择最优数据增强策略对总 数据集进行数据增强处理, 提高了数据增强处理 的整体效果。 权利要求书2页 说明书11页 附图3页 CN 114549932 A 2022.05.27 CN 114549932 A 1.一种数据增强处 理方法, 其特 征在于, 包括: 获取数据集, 将所述数据集划分为至少两个子数据集; 为每个所述子数据集选取不同的数据增强策略, 得到每个所述子数据集的第 一数据增 强策略; 依照每个所述子数据集的第一数据增强策略分别对相应的子数据集进行数据增强处 理, 得到每 个所述子数据集增强处 理后的目标子数据集; 将每个所述目标子数据集分别输入预设的神经网络模型进行训练, 得到多个训练结 果; 将所述多个训练结果进行相互比对, 从所述多个训练结果中筛选出训练效果最优的训 练结果, 得到目标训练结果; 确定所述目标训练结果对应的第一数据增强策略, 得到目标 数据增强策略; 获取总数据集, 调用所述目标数据增强策略对所述总数据集中的所有数据进行数据增 强处理, 得到目标 数据集。 2.根据权利要求1所述的方法, 其特征在于, 所述为每个所述子数据集选取不同的数据 增强策略, 包括: 当确定所述子数据集包括样本图片, 并确定所述样本图片中的目标物的尺寸比例大于 预设尺寸比例时, 则为所述样本图片的数据集选取第一数据增强策略; 其中, 所述第 一数据增强策略为对所述样本图片按照小于预设缩放比例的缩放比例进 行缩小、 随机水平翻转、 随机竖直翻转、 随机调整图片亮度与对比度、 按照小于预设角度的 角度进行旋转或随机调整所述目标物的颜色中的任意至少一种策略。 3.根据权利要求2所述的方法, 其特征在于, 所述确定所述样本图片中的目标物的尺寸 比例, 包括: 统计所述目标物在所述样本图片中的所有像素点数量, 得到第一像素点数量; 统计所述样本图片的所有像素点数量, 得到总像素点数量; 将所述第一像素点数量除以所述总像素点数量之后, 得到所述目标物的尺寸比例。 4.根据权利要求2所述的方法, 其特征在于, 所述按照小于预设角度的角度进行旋转, 包括: 确定所述样本图片原有的图像框; 将所述样本图片在原有的所述图像框中按照所述角度进行转动, 得到第一样本图片; 将所述第一样本图片中的空白区域 填补黑色的像素值, 得到转动 后的目标样本图片。 5.根据权利要求2所述的方法, 其特 征在于, 所述随机调整图片亮度与对比度, 包括: 计算所述样本图片中所有像素点的平均值, 得到像素均值; 将所述样本图片中每个像素点的像素值分别减去所述像素均值, 得到每个所述像素点 的像素差值; 将每个所述像素点的像素差值乘以预设对比度系数, 并分别与所述像素均值相加后, 得到每个所述像素点的第一像素值; 将每个所述像素点的第 一像素值乘以预设亮度系数后, 得到每个所述像素点的目标像 素值, 将由所述目标像素值构成的样本图片作为随机调整图片亮度与对比度后的目标样本 图片。权 利 要 求 书 1/2 页 2 CN 114549932 A 26.根据权利要求2所述的方法, 其特征在于, 所述对所述样本图片按照小于预设缩放比 例的缩放比例进行缩小, 包括: 基于双线性插值算法, 将所述样本 图片按照小于预设缩放比例的缩放比例进行缩小, 得到缩小后的目标样本图片。 7.根据权利要求1所述的方法, 其特征在于, 所述将所述多个训练结果进行相互比对, 从所述多个训练结果中筛 选出训练效果 最优的训练结果, 得到目标训练结果, 包括: 基于预设的损失函数, 根据每个所述训练结果对应计算所述神经网络模型在每个所述 目标子数据集训练后的损失值, 得到每 个所述训练结果的损失值; 从所有所述训练结果的损失值中筛 选出损失值 最小的训练结果, 得到目标训练结果。 8.一种数据增强处 理装置, 其特 征在于, 包括: 获取模块, 用于获取 数据集, 将所述数据集划分为至少两个子数据集; 选取模块, 用于为每个所述子数据集选取不同的数据增强策略, 得到每个所述子数据 集的第一数据增强策略; 数据增强处理模块, 用于依照每个所述子数据集的第 一数据增强策略分别对相应的子 数据集进行 数据增强处 理, 得到每 个所述子数据集增强处 理后的目标子数据集; 训练模块, 用于将每个所述目标子数据集分别输入预设的神经网络模型进行训练, 得 到多个训练结果; 筛选模块, 用于将所述多个训练结果进行相互比对, 从所述多个训练结果中筛选出训 练效果最优的训练结果, 得到目标训练结果; 确定模块, 用于确定所述目标训练结果对应的第一数据增强策略, 得到目标数据增强 策略; 调用模块, 用于获取总数据集, 调用所述目标数据增强策略对所述总数据集中的所有 数据进行 数据增强处 理, 得到目标 数据集。 9.一种计算机设备, 其特 征在于, 包括: 处理器; 存储器; 其中, 所述存储器存储有计算机程序, 所述处理器执行所述计算机程序时实现权利要 求1至7任一项所述的数据增强处 理方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有计算机 程序, 该计算机程序被处 理器执行时实现权利要求1 ‑7任一项所述的数据增强处 理方法。权 利 要 求 书 2/2 页 3 CN 114549932 A 3

PDF文档 专利 数据增强处理方法、装置、计算机设备及存储介质

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据增强处理方法、装置、计算机设备及存储介质 第 1 页 专利 数据增强处理方法、装置、计算机设备及存储介质 第 2 页 专利 数据增强处理方法、装置、计算机设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:12:04上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。