全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211341654.1 (22)申请日 2022.10.31 (71)申请人 之江实验室 地址 311121 浙江省杭州市余杭区之江实 验室南湖总部 (72)发明人 程乐超 郭恒康 宋杰  (74)专利代理 机构 北京志霖恒远知识产权代理 有限公司 1 1435 专利代理师 戴莉 (51)Int.Cl. G06V 40/10(2022.01) G06V 40/20(2022.01) G06V 10/82(2022.01) G06V 10/774(2022.01) G06V 10/762(2022.01)G06V 10/74(2022.01) (54)发明名称 一种多码率的行人识别视觉特征编码压缩 方法和装置 (57)摘要 本发明一种多码率的行人识别视觉特征编 码压缩方法和装置, 所述方法包括下列步骤: 1) 行人视觉特征提取; 2) 行人视觉特征压缩编码; 3) 视觉特征编码解压重建; 4) 行人重识别。 通过 在智能安保系统的终端设备部署步骤1) 、 2) , 在 智能安保服务的中心设备部署步骤3) 、 4) , 同时 利用网络作为传输媒介从终端设备传输特定码 率的内容到服务的中心设备, 可以实现智能安保 系统中的行人重识别任务, 提高安保工作的效 率, 提高识别精度, 减少人工需求。 权利要求书2页 说明书6页 附图4页 CN 115471875 A 2022.12.13 CN 115471875 A 1.一种多码率的行人识别视觉特征编码压缩方法, 其特征在于: 所述方法具体包括以 下步骤: S1、 获取数据集; 所述数据集包括训练集和测试集; 所述训练集包括具有行人的图片和 对应的行 人编号; 所述测试集包括具有行 人的图片; 将数据集送入端到端神经网路; S2、 端到端神经网络对数据集中的图片进行数据增强处理, 再将数据增强处理后的图 片经过卷积神经网络, 得到1024维向量; S3、 将1024维 向量进行编码压缩, 将其分别输入预先设定中间输出编码为32/64/128维 的3种自编码器中; 分别得到 32/64/128维的3种编码向量并进行设备间的传输; S4、 对接收到32/64/128维的编码向量送入到自编码器的解码器中, 重构出1024维 向量 的行人特征向量数据; S5、 对步骤S4中重构出的1024维向量的行人特征向量数据进行归一化处理得到特征向 量; S6、 对于训练集, 采用三元组损失函数和中心损失函数作 为损失函数, 根据S4得到1024 维向量的行 人特征向量数据和S5得到的特 征向量, 训练端到端神经网络; S7、 对于测试集, 结合端到端神经网络, 进行余弦相似度的计算, 得到的余弦相似度最 高的k个即视为同一行 人。 2.如权利要求1所述的一种 多码率的行人识别视觉特征编码压缩方法, 其特征在于: 步 骤S2中对数据集中的图片进 行数据增强处理具体方式包括光照增广、 随机擦除、 随机裁剪、 随机翻转中的一种或多种。 3.如权利要求1所述的一种 多码率的行人识别视觉特征编码压缩方法, 其特征在于, 步 骤S2中将数据增强处 理后的图片经 过卷积神经网络, 得到1024维向量的具体操作如下: S21、 先通过 卷积神经网络中的卷积层保留图片的特 征; S22、 再通过 卷积神经网络中的卷积层池化层进行 数据降维; S23、 最后通过全连接层将图片特 征映射成1024维的向量。 4.如权利要求1所述的一种 多码率的行人识别视觉特征编码压缩方法, 其特征在于: 步 骤S3中还包括如下操作: 将32/64/128维 的编码向量转换成半浮点数类型并以64/128/256 字节的二进制编码进行设备间的传输; 步骤S4还包括如下操作: 将64/128/256字节的二进 制编码转换成32/ 64/128维的编码向量。 5.如权利要求1所述的一种 多码率的行人识别视觉特征编码压缩方法, 其特征在于: 所 述步骤S6具体包括如下步骤: S61、 将训练集中某位行人的一个特征向量记为锚示例; 将该行人的另一个特征向量记 为正样本; 将另一行人 的一个特征向量记为负样本; 计算正样本与锚示例之间的距离以及 负样本与锚示例之间的距离的差, 即为 三元组损失函数的结果; S62、 将训练集中某位行人的特征向量进行平均值计算得到该行人的聚类 中心; 计算该 行人的特征向量与该 行人聚类中心的欧式距离的平均值, 即为中心损失函数的结果。 6.如权利要求1所述的一种 多码率的行人识别视觉特征编码压缩方法, 其特征在于: 所 述步骤S7具体包括如下步骤: S71、 对于测试集, 结合端到端神经网络, 获取测试集中所有图片对应的特征向量, 形成 行人检索库;权 利 要 求 书 1/2 页 2 CN 115471875 A 2S72、 针对某一需要检索的行人, 在通过端到端神经网络后, 进行余弦相似度的计算, 即 计算得到的特征向量与行人检索库中的特征向量的向量夹角余弦值, 得到的余弦相似度最 高的k个即视为同一行 人。 7.一种多码率的行人识别视觉特征编码压缩装置, 其特征在于: 包括存储器和一个或 多个处理器, 所述存储器中存储有可执行代码, 所述一个或多个处理器执行所述可执行代 码时, 用于实现权利要求1 ‑6任一项所述的一种多码率的行 人识别视 觉特征编码压缩方法。 8.一种计算机可读存储介质, 其特征在于: 其上存储有程序, 该程序被处理器执行时, 实现权利要求1 ‑6任一项所述的一种多码率的行 人识别视 觉特征编码压缩方法。权 利 要 求 书 2/2 页 3 CN 115471875 A 3

PDF文档 专利 一种多码率的行人识别视觉特征编码压缩方法和装置

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种多码率的行人识别视觉特征编码压缩方法和装置 第 1 页 专利 一种多码率的行人识别视觉特征编码压缩方法和装置 第 2 页 专利 一种多码率的行人识别视觉特征编码压缩方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:26:47上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。