全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210520490.2 (22)申请日 2022.05.12 (71)申请人 西北工业大 学 地址 710072 陕西省西安市友谊西路127号 (72)发明人 王琦 王宇泽 韩滔 李学龙  (74)专利代理 机构 西安凯多 思知识产权代理事 务所(普通 合伙) 61290 专利代理师 范倩 (51)Int.Cl. G06V 20/52(2022.01) G06V 10/82(2022.01) G06V 10/28(2022.01) G06V 10/44(2022.01) (54)发明名称 密集场景 下的人群 检测方法 (57)摘要 本申请公开了一种密集场景下的人群检测 方法。 该密集场景下的人群检测方法包括: 将RGB 图像输入到主干网络中以提取得到特征图; 对所 述特征图进行处理以得到置信度图; 对所述置信 度图进行处理以得到二值图, 并利用所述二值图 处理得到 人群定位和计数信息; 对 所述特征图进 行处理以得到尺寸图; 利用所述二值图和所述尺 寸图解算得到每个检测框的大小及位置, 其中, 每个连通域的中心点为人头部定位点, 所述连通 域的个数为所述RGB图像中人的个数。 本申请可 以解决群密集场景 下人群检测困难的问题。 权利要求书2页 说明书7页 附图1页 CN 114998826 A 2022.09.02 CN 114998826 A 1.一种密集场景 下的人群 检测方法, 其特 征在于, 包括: 步骤S1: 将RGB图像输入到主干网络中以提取 得到特征图; 步骤S2: 对所述特 征图进行处 理以得到 置信度图; 步骤S3: 对所述置信度图进行处理以得到二值图, 并利用所述二值图处理得到人群定 位和计数信息; 步骤S4: 对所述特 征图进行处 理以得到尺寸图; 步骤S5: 利用所述二值图和所述尺寸图解算得到每个检测框的大小及位置, 其中, 每个 连通域的中心点 为人头部定位点, 所述连通 域的个数为所述RGB图像中人的个数。 2.根据权利要求1所述的密集场景下的人群检测方法, 其特征在于, 在所述步骤S1中, 所述主干网络包括VG G‑16或者HRNet。 3.根据权利要求1所述的密集场景下的人群检测方法, 其特征在于, 在所述步骤S1中, 所述主干网络提取 得到的特 征图满足关系式: F=Φ(I; θe) 其中,F为所述特征图, Φ为 关于特征提取器的函数, θe为所述特征提取器所处神经网络 的权重, I为所述RGB图像, I∈RH×W×3, R为实数, c为所述特征图的通道数, H和W 分别为所述RGB图像的高和宽 。 4.根据权利要求3所述的密集场景 下的人群 检测方法, 其特 征在于, 所述 步骤S2包括: 步骤S21: 通过1 ×1的卷积层将所述特 征图的通道数变为720; 步骤S22: 通过2×2, 步长为2的反卷积层将所述特 征图的大小变成(H /2,w/2); 步骤S23: 通过3 ×3的卷积层将所述特 征图的通道数降为32; 步骤S24: 通过反卷积层将所述特 征图的尺寸变为(H,W); 步骤S25: 通过1 ×1的卷积层输出 单通道的所述置信度图, 所述置信度图满足关系式: C= ψ(F; θc) 其中, C为所述置信度图, C∈RH×W, ψ为关于置信度预测器的函数, θc为所述置信度预测 器所处神经网络的权 重。 5.根据权利要求1所述的密集场景 下的人群 检测方法, 其特 征在于, 所述 步骤S3包括: 步骤S31: 将所述特 征图和所述置信度图通过点积运 算得到一个新特 征图; 步骤S32: 将得到的所述 新特征图送入阈值学习器学习到一个阈值图; 步骤S33: 根据得到所述阈值图和所述置信度图得到所述 二值图; 步骤S34: 通过 所述二值图得到所述人群 计数和定位的结果。 6.根据权利要求5所述的密集场景下的人群检测方法, 其特征在于, 所述新的特征图满 足关系式: 其中, Ffilter为所述新特征图, R为实数, c为所述特征图的通道数, H和W 分别为所述RGB图像的高和宽, 表示点积运算, D为下采样运 算, C为所述置信度图。 7.根据权利要求6所述的密集场景下的人群检测方法, 其特征在于, 所述阈值图满足关权 利 要 求 书 1/2 页 2 CN 114998826 A 2系式: T=Φ1(Ffilter; θt) 其中, T为所述阈值图, T∈RH×W, Φ1为关于阈值学习器的函数, θt为所述阈值学习器所 处神经网络的权 重。 8.根据权利要求6所述的密集场景下的人群检测方法, 其特征在于, 所述二值图满足关 系式: 其中, Bij为所述二值图, η为关于所述阈值图和所述置信度图的函数, C为所述置信度 图, T为所述阈值图。 9.根据权利要求1所述的密集场景 下的人群 检测方法, 其特 征在于, 所述 步骤S4包括: 步骤S41: 将所述特 征图依次送入4个残差块中, 将所述特 征图的通道数变为32; 步骤S44: 通过两个反卷积层得到一张和所述RGB图像一样大的所述尺度图, 所述尺度 图, 满足关系式: s=X(F; θs) 其中, S为所述尺度图, S∈RH×W, R为实数, H和W分别为所述RGB图像的高和宽, X为关于尺 度图预测器的函数, F为所述特 征图, θs为所述尺度图预测器所处神经网络的权 重。 10.根据权利要求1所述的密集场景下的人群检测方法, 其特征在于, 在所述步骤S5 中, 所述二值图中的每个连通域表示一个目标, 对于第k个目标, 其中心点的位置为Pk=(xk, yk), 该中心点最初的大小为(wk,hk), 通过所述中心 点和所述最初的大小解算得到所述连通 域的宽和对角线之间的角度, 公式如下: 其中, 为所述连通域对角线长度的一半, α为所述连通域宽和对角线 之间的角度, 最终的检测框的对角线长度的一半σ ′k由所述尺度图S确定, 其中, σ ′k=S(xk, yk), 然后通过角度α 得到最终检测框的宽和高, 其中, w′k为最终检测框的宽, h ′k为最终检测框的高。权 利 要 求 书 2/2 页 3 CN 114998826 A 3

PDF文档 专利 密集场景下的人群检测方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 密集场景下的人群检测方法 第 1 页 专利 密集场景下的人群检测方法 第 2 页 专利 密集场景下的人群检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:10:40上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。