全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210675949.6 (22)申请日 2022.06.15 (71)申请人 平安科技 (深圳) 有限公司 地址 518000 广东省深圳市福田街道福安 社区益田路5 033号平安金融 中心23楼 (72)发明人 谯轶轩  (74)专利代理 机构 北京中强智尚知识产权代理 有限公司 1 1448 专利代理师 付伟丽 (51)Int.Cl. G06V 10/44(2022.01) G06V 10/77(2022.01) (54)发明名称 图片特征的提取方法、 装置、 计算机设备及 可读存储介质 (57)摘要 本申请公开了一种图片特征的提取方法、 装 置、 计算机设备及可读存储介质, 涉及计算机技 术领域, 减弱特征学习中对负样本的需求, 降低 学习和内存带来的压力, 提高效率, 提升特征提 取的准确率和性能。 所述方法包括: 获取待进行 图片特征提取的目标图片, 对目标图片进行增强 处理, 得到第一视角图片和第二视角图片; 确定 第一视角图片的第一特征向量、 第二视角图片的 第二特征向量, 对第一特征向量和第二特征向量 进行特征 投影, 采用特征投影后的第一特征向量 和特征投影后的第二特征向量, 生成损失函数 值; 基于损失函数值进行图片特征的表示学习, 得到特征提取模 型; 将目标图片输入至特征提取 模型, 获取特征提取模型输出的向量作为目标图 片的图片特 征向量。 权利要求书3页 说明书14页 附图4页 CN 114926658 A 2022.08.19 CN 114926658 A 1.一种图片特 征的提取 方法, 其特 征在于, 包括: 获取待进行图片特征提取的目标图片, 对所述目标图片进行增强处理, 得到第一视角 图片和第二视角图片; 确定所述第一视角图片的第一特征向量、 所述第二视角图片的第二特征向量, 对所述 第一特征向量和所述第二特征向量进 行特征投影, 采用特征投影后的所述第一特征向量和 特征投影后的所述第二特 征向量, 生成损失函数值; 基于所述损失函数值进行图片特 征的表示学习, 得到特 征提取模型; 将所述目标图片输入至所述特征提取模型, 获取所述特征提取模型输出的向量作为所 述目标图片的图片特 征向量。 2.根据权利要求1所述的方法, 其特征在于, 所述获取待进行图片特征提取的目标图 片, 对所述目标图片进行增强处 理, 得到第一视角图片和第二视角图片, 包括: 获取输入的待进行图片特征提取的所述目标图片, 在目标图片中确定基准边, 其中, 所 述基准边是所述目标图片的一图片边界, 所述基准边的长度小于等于所述目标图片中除所 述基准边外的其 他图片边界的长度; 在所述目标图片中裁剪边长等于所述基准边的长度的两个区域图片, 将所述两个区域 图片中任一区域图片作为所述第一视角图片, 将所述两个区域图片中除所述第一视角图片 外的另一区域图片作为所述第二视角图片。 3.根据权利要求1所述的方法, 其特征在于, 所述确定所述第 一视角图片的第 一特征向 量、 第二视角图片的第二特征向量, 对 所述第一特征向量和 第二特征向量进行特征投影, 采 用特征投影后的所述第一特征向量和特征投影后的所述第二特征向量, 生成损失函数值, 包括: 获取主视角编码器, 确定预设编码维度, 基于所述主视角编码器对所述第一视角图片 进行编码处 理, 得到维度与所述预设编码维度一 致的所述第一特 征向量; 确定辅视角编码器, 基于所述辅视角编码器对所述第二视角图片进行编码处理, 得到 维度与所述预设编码维度一 致的所述第二特 征向量; 获取维度为预设投影维度的主视角投影矩阵、 辅视角投影矩阵, 采用所述主视角投影 矩阵对所述第一特征向量进行特征投影, 采用所述辅视角投影矩阵对所述第二特征向量进 行特征投影, 得到特 征投影后的所述第一特 征向量、 特 征投影后的所述第二特 征向量; 对特征投影后的所述第一特 征向量进行非线性变化, 得到非线性变化向量; 在特征投影后的所述第 二特征向量中, 分别为所述非线性变化向量包括的多个元素中 的每个元素确定处于相同位置的元素, 得到所述每个元素 的对应位元素, 对所述每个元素 执行以下处理: 计算所述元素与对应位元素的差值, 对所述差值进行平方计算, 得到平方 值; 获取所述每个元素的平方值, 得到所述多个元素的多个平方值, 计算所述多个平方值 的和值, 以及将所述和值作为所述损失函数值。 4.根据权利要求3所述的方法, 其特征在于, 所述采用所述主视角投影矩阵对所述第 一 特征向量进行特征投影, 采用所述辅视角投影矩阵对所述第二特征向量进行特征投影, 得 到特征投影后的所述第一特 征向量、 特 征投影后的所述第二特 征向量, 包括: 采用矩阵乘法, 对所述主视角投影矩阵和所述第一特征向量进行计算, 得到维度等于权 利 要 求 书 1/3 页 2 CN 114926658 A 2所述预设投影维度的向量作为特 征投影后的所述第一特 征向量; 采用矩阵乘法, 对所述辅视角投影矩阵和所述第二特征向量进行计算, 得到维度等于 所述预设投影维度的向量作为特 征投影后的所述第二特 征向量。 5.根据权利要求3所述的方法, 其特征在于, 所述对特征投影后的所述第 一特征向量进 行非线性变化, 得到非线性变化向量, 包括: 获取维度为第 一预设变换维度的第 一预设变换矩阵, 采用矩阵乘法对所述第 一预设变 换矩阵和特征投影后的所述第一特征向量进 行计算, 得到维度等于所述第一预设变换维度 的向量作为第一中间向量; 对所述第 一中间向量进行归一化处理, 将所述第 一中间向量转换为均值为0且方差为1 的标准正态分布作为第二中间向量; 获取预设的非线性激活函数, 将所述第 二中间向量带入到所述非线性激活函数进行计 算, 将计算得到的向量作为第三中间向量; 获取维度为第 二预设变换维度的第 二预设变换矩阵, 采用矩阵乘法对所述第 二预设变 化矩阵和所述第三中间向量进 行计算, 将得到的向量作为所述非线性变化向量, 其中, 所述 非线性变化向量的维度与特 征投影后的所述第一特 征向量的维度一 致。 6.根据权利要求1所述的方法, 其特征在于, 所述基于所述损失函数值进行图片特征的 表示学习, 得到特 征提取模型, 包括: 读取主视角编码器当前的编码器参数作为第 一历史编码器参数, 读取辅视角编码器当 前的编码器参数作为第二历史编码器参数; 回传所述损 失函数值, 采用所述损 失函数值对所述主视角编码器、 主视角投影矩阵进 行更新; 获取延迟更新因子, 采用所述延迟更新因子对所述第 一历史编码器参数和第 二历史编 码器参数进行计算, 得到编码器更新数值, 以及采用所述延迟更新因子对所述主视角投影 矩阵和辅 视角投影矩阵进行计算, 得到待更新投影矩阵; 将所述编码器更新数值设置在所述辅视角编码器中, 将所述辅视角投影矩阵更新为所 述待更新投影矩阵; 重新对所述目标图片进行增强处理, 重新对增强处理后得到的新的第 一视角图片和新 的第二视角图片, 以及基于更新后的所述主视角编 码器对所述新的第一视角图片进行特征 提取, 基于更新后的所述主视角投影矩阵对所述新的第一视角图片进行特征投影, 并基于 更新后的所述辅视角编 码器对所述新的第二视角图片进行特征提取, 基于更新后的所述辅 视角投影矩阵对所述新的第二视角图片进行特征投影, 重新生成新的损失函数值, 以及按 照所述新的损失函数对所述主视角编码器、 所述主视角投影矩阵、 所述辅视角编码器和所 述辅视角投影矩阵进行 更新, 直至生成的损失函数值达 到阈值, 得到所述特 征提取模型。 7.根据权利要求1所述的方法, 其特征在于, 所述将所述目标图片输入至所述特征提取 模型, 获取 所述特征提取模型输出的向量作为所述目标图片的图片特 征向量, 包括: 将所述目标图片输入至所述特征提取模型, 基于所述特征提取模型中的主视角编码器 对所述目标图片进行编码处 理, 得到初始图片特 征向量; 基于所述特征提取模型中的主视角投影矩阵对所述初始图片特征向量进行特征投影 处理, 得到特征投影后的所述初始图片特征向量, 以及将特征投影后的所述初始图片特征权 利 要 求 书 2/3 页 3 CN 114926658 A 3

PDF文档 专利 图片特征的提取方法、装置、计算机设备及可读存储介质

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图片特征的提取方法、装置、计算机设备及可读存储介质 第 1 页 专利 图片特征的提取方法、装置、计算机设备及可读存储介质 第 2 页 专利 图片特征的提取方法、装置、计算机设备及可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:43:19上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。