全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210680125.8 (22)申请日 2022.06.16 (71)申请人 腾讯科技 (深圳) 有限公司 地址 518000 广东省深圳市南 山区高新区 科技中一路腾讯大厦3 5层 (72)发明人 韩佳明 任玉强 鄢科  (74)专利代理 机构 深圳市联鼎知识产权代理有 限公司 4 4232 专利代理师 陈涛 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/764(2022.01) G06V 10/44(2022.01) G06V 10/82(2022.01) G06V 10/77(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 目标检测方法、 装置、 计算机可读介质及电 子设备 (57)摘要 本申请的实施例提供了一种目标检测方法、 装置、 计算机 可读介质及电子设备, 该方法包括: 将图像样本集中的目标图像样本输入至原始目 标检测模型中, 在原始目标检测模 型中提取出与 目标图像样 本对应的区域特征, 并生成对应的目 标编码向量; 根据实例对比损失函数优化原始目 标检测模型, 得到最终目标检测模型, 其中, 所述 实例对比损失函数与同类距离正相关, 并与异类 距离负相关; 将待检测图像输入 所述最终目标检 测模型, 得到所述最终目标检测模 型输出的目标 检测结果, 所述目标检测结果包括检测框坐标及 目标所属的已知类别或未知类别。 本申请实施例 提高了目标检测模型的精度。 本申请实施例可应 用于云技术、 人工智能、 智慧交通、 辅助驾驶等各 种场景。 权利要求书2页 说明书15页 附图9页 CN 115115906 A 2022.09.27 CN 115115906 A 1.一种目标检测方法, 其特 征在于, 所述方法包括: 将从图像样本集的图像样本中选出的目标图像样本输入至原始目标检测模型中, 以在 所述原始目标检测模型中提取出与所述目标图像样本对应的区域特征, 并生成与所述区域 特征对应的目标编码向量, 所述图像样本集包括多个图像样本, 所述图像样本包括属于已 知类别的目标, 所述原 始目标检测模型存 储有与多个已知类别分别对应的编码向量; 根据实例对比损失函数优化所述原始目标检测模型, 得到最终 目标检测模型, 其中, 所 述实例对比损失函数与同类距离正相关, 并与异类距离负相关, 所述同类距离是所述 目标 编码向量和所述原始目标检测模型中指定编码向量之 间的距离, 所述异类距离是所述目标 编码向量和所述原始目标检测模型中非指 定编码向量之 间的距离, 所述指 定编码向量是与 所述目标编码向量对应的已知类别相同的编码向量; 将待检测图像输入所述最终 目标检测模型, 得到所述最终 目标检测模型输出的目标检 测结果, 所述目标检测结果包括用于标注目标区域的位置的检测框坐标及所述目标区域所 包含的目标 所属的已知类别或未知类别。 2.根据权利要求1所述的目标检测方法, 其特征在于, 所述在所述原始目标检测模型中 提取出与所述目标图像样本对应的区域特 征, 包括: 在所述原始目标检测模型中提取出与所述目标图像样本对应的特征图, 并根据 所述特 征图确定出用于指示所述目标图像样本中目标的位置的目标检测框; 基于所述目标检测框在所述特 征图中提取 出区域特 征。 3.根据权利要求1所述的目标检测方法, 其特征在于, 在将从图像样本集的多个图像样 本中选出的目标图像样本 输入至原 始目标检测模型中之前, 所述方法还 包括: 将图像样本集中的多个图像样本输入至所述原始目标检测模型中, 以生成与每个图像 样本对应的编码向量, 并在所述原 始目标检测模型中存 储所述编码向量。 4.根据权利要求3所述的目标检测方法, 其特征在于, 所述将图像样本集中的多个图像 样本输入至所述原始目标检测模型中, 以生成与每个图像样本对应的编码向量, 并在所述 原始目标检测模型中存 储所述编码向量, 包括: 将图像样本集中的多个图像样本分批次输入至所述原始目标检测模型中, 以生成与每 个批次的多个图像样本分别对应的编码向量; 根据预定指标对每个批次的图像样本对应的编码向量进行筛选, 并在所述原始目标检 测模型中存 储筛选出的编码向量。 5.根据权利要求4所述的目标检测方法, 其特征在于, 所述根据 预定指标对每个批次的 图像样本对应的编码向量进行筛选, 并在所述原始目标检测模型中存储筛选出的编码向 量, 包括: 在每个批次的图像样本对应的编码向量中筛选出对应的预定指标大于第一预定指标 阈值的编 码向量, 作为初筛编码向量, 其中, 所述目标编 码向量对应的预定指标大于所述第 一预定指标阈值; 在所述初筛编码向量中筛选出对应的预定指标大于第 二预定指标阈值的编码向量, 作 为二筛编 码向量, 并在所述原始目标检测模型中存储所述二筛编码向量, 其中, 所述第二预 定指标阈值大于所述第一预定指标阈值。 6.根据权利要求1 ‑5任意一项所述的目标检测方法, 其特征在于, 所述根据实例对比损权 利 要 求 书 1/2 页 2 CN 115115906 A 2失函数优化所述原 始目标检测模型, 得到最终目标检测模型, 包括: 根据实例对比损失函数和深度置信损失函数联合优化所述原始目标检测模型, 得到最 终目标检测模型, 其中, 所述深度置信损失函数用于根据所述 目标图像样本的 已知类别拟 合迪利克雷分布的参数, 所述迪利克雷分布的参数是根据所述原始目标检测模型的输出结 果生成的。 7.根据权利要求6所述的目标检测方法, 其特征在于, 所述目标检测结果还包括所述目 标属于已知类别或未知类别的概 率。 8.根据权利要求7所述的目标检测方法, 其特征在于, 所述深度置信损失函数位于所述 原始目标检测模型的深度置信学习模块中, 所述将待检测图像输入所述最终目标检测模 型, 得到所述 最终目标检测模型输出的目标检测结果, 包括: 将待检测图像输入所述最终 目标检测模型, 得到所述最终 目标检测模型的所述深度置 信学习模块输出的概 率。 9.根据权利要求1 ‑5任意一项所述的目标检测方法, 其特征在于, 所述原始目标检测模 型存储的与各已知类别分别对应的编码向量的数量相同。 10.一种目标检测装置, 其特 征在于, 所述装置包括: 输入和提取单元, 用于将 从图像样本集的图像样本 中选出的目标图像样本输入至原始 目标检测模型中, 以在所述原始目标检测模型中提取出与所述目标图像样本对应的区域特 征, 并生成与所述区域特征对应的目标编码向量, 所述图像样本集包括多个图像样本, 所述 图像样本包括属于已知类别的目标, 所述原始目标检测模型存储有与多个已知类别分别对 应的编码向量; 模型优化单元, 用于根据实例对比损 失函数优化所述原始目标检测模型, 得到最终目 标检测模型, 其中, 所述实例对比损失函数与同类距离正相关, 并与异类距离负相关, 所述 同类距离是所述目标编 码向量和所述原始目标检测模型中指定编 码向量之 间的距离, 所述 异类距离是所述目标编 码向量和所述原始目标检测模型中非指 定编码向量之间的距离, 所 述指定编码向量是与所述目标编码向量对应的已知类别相同的编码向量; 检测单元, 用于将待检测图像输入所述最终目标检测模型, 得到所述最终目标检测模 型输出的目标检测结果, 所述目标检测结果包括用于标注目标区域的位置的检测框坐标及 所述目标区域所包 含的目标 所属的已知类别或未知类别。 11.一种计算机可读介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序被处 理器执行时实现如权利要求1至9中任一项所述的目标检测方法。 12.一种电子设备, 其特 征在于, 包括: 一个或多个处 理器; 存储装置, 用于存储一个或多个程序, 当所述一个或多个程序被所述一个或多个处理 器执行时, 使得所述一个或多个处理器实现如权利要求1至9中任一项所述的目标检测方 法。 13.一种计算机程序产品, 其特征在于, 所述计算机程序产品包括计算机指令, 所述计 算机指令存储在计算机可读存储介质中, 计算机设备的处理器从所述计算机可读存储介质 读取所述计算机指令, 所述处理器执行所述计算机指令, 使得所述计算机设备执行如权利 要求1至9中任一项所述的目标检测方法。权 利 要 求 书 2/2 页 3 CN 115115906 A 3

PDF文档 专利 目标检测方法、装置、计算机可读介质及电子设备

文档预览
中文文档 27 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 目标检测方法、装置、计算机可读介质及电子设备 第 1 页 专利 目标检测方法、装置、计算机可读介质及电子设备 第 2 页 专利 目标检测方法、装置、计算机可读介质及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:43:16上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。