全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210153141.1 (22)申请日 2022.02.18 (71)申请人 北京工业大 学 地址 100124 北京市朝阳区平乐园10 0号 (72)发明人 王丹 姚志 付利华  (74)专利代理 机构 北京思海天达知识产权代理 有限公司 1 1203 专利代理师 刘萍 (51)Int.Cl. G06V 40/16(2022.01) G06V 10/44(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 一种基于注意力机制的人脸识别方法 (57)摘要 一种基于注意力机制的人脸识别方法, 属于 计算机软件 领域。 针对现有的主流的人脸识别方 法参数量大、 资源占用多、 运行效率较低的问题, 首先构建了一个低参数量的卷积神经网络来保 证保证计算过程的高效和低资源消耗。 然后加入 注意力机制捕获提取其中的跨通道信息, 以优化 卷积神经网络的整体性能。 同时, 注意力的引入 并不增添多少额外的性能损失和资源消耗。 本发 明可以在保证高效、 快速的进行人脸特征提取的 基础上, 进一步提升人脸识别的准确率, 提升整 体效率。 权利要求书2页 说明书4页 附图4页 CN 114550252 A 2022.05.27 CN 114550252 A 1.一种基于注意力机制的人脸识别方法, 其特 征在于, 包括以下步骤: 步骤1.将输入图像数据进预处理: 将输出图像的每个像素点的RGB通道的数据映射分 布到(‑1,1)区间, 然后分别处 理训练集和验证集; 步骤2.构建网络: 构建基于注意力机制的卷积神经网络, 其中使用了深度可分离卷积 来对人脸图像信息进行处理, 然后使用注意力机制进一步增加关键特征信息的获取, 提升 最终准确率; 步骤3.训练模型: 将步骤1中处 理好的数据输入步骤2中构建的网络进行训练; 步骤4.将测试集中的图像数据输入到模型中, 提取到人脸特征向量, 然后计算得到人 脸识别结果; 步骤2具体为: 输入的人脸图像数据的维度为1 12x112x3; 该网络分为几个主 要的网络层L1~L7; 1)L1: 包含一个普通卷积层, 其 中卷积核数目为3、 过滤器个数为64, 步长为1; 主要用来 对输入图像数据进行快速的降维, 保留其中的关键信息, 使得该层最终输出 的数据维度为 (56,56,64); 2)L2: 包含一个深度可分离卷积层, 用来将1)中产生的数据进行特征的提取, 输出数据 维度为(56,56,64), 与输入数据维度保持不变; 然后添加注意力机制对输出数据提取跨通 道的特征信息; 3)L3: 该部分包括5个bottleneck, 是神经网络的主体结构部分; bottleneck的结构包 含两个普通卷积层和一个深度可分离卷积层, 且普通卷积层的卷积核 数目都为 1, 深度可分 离卷积层的卷积核数目则为3, 并在每个bottleneck尾部加入注意力机制; 该部分中, bottleneck1的过滤器个数为64, 步长为2; bottleneck2的过滤器个数为128, 步长为2; bottleneck3的过滤器个数为128, 步长为1; bottleneck4的过滤器个数为128, 步长为2; bottleneck5的过滤器个数为128, 步长为1; 2)中的数据通过该层后, 最终获得输出的数据 维度为(7,7,128); 4)L4: depthwise2也包含一个深度可分离卷积层, 用来对3)中产生的数据做最后的特 征提取, 过滤器个数为512, 卷积核大小为(7,7), 步长为1; , 并同样在尾部加入注 意力机制, 进一步捕获关键通道特 征; 最终输出的数据维度为(7,7,512); 5)L5: conv_block2, 使用过滤器个数为128、 卷积核大小为(1,1)、 步长为1的普通卷积 层来对4)的输出 数据进行降维操作, 而无需加入注意力机制, 最终输出维度为(1,1,128); 其中, 注意力机制的实现过程具体表述 为: 定义输入数据的维度为(H,W,C), 将输入进行全局平均池化层后得到维度 为(1,1,C)的 数据, 然后通过一个卷积核大小为5的一维卷积层进行通道特征信息捕捉, 并在通过 sigmoid函数进行激活后得到维度仍然为(1,1,C)的通道特征; 将计算出的C个通道特征加 权分配到此层并联的C个过 滤器上; 步骤3具体为: 使用Adcos作 为损失函数层, 对构 建的网络所输出的数据计算损失, 并使 用梯度下降更新网络参数; 使用收敛速度快的SGD优化器, 初始学习率为0.1, 批次大小为 128; 通过早停法优化网络, 当 网络在验证集上的损失不再下降的时候, 停止训练, 保存训练 结果。 2.根据权利要求1所述的一种基于注意力机制的人脸识别方法, 其特 征在于,权 利 要 求 书 1/2 页 2 CN 114550252 A 2步骤1具体为: 首先将输入图像中每个像素位置的RGB三种通道的数值都先减去127.5 然后再除以128, 规约在( ‑1,1)区间; 然后将数据集分为训练集和验证集两 部分。权 利 要 求 书 2/2 页 3 CN 114550252 A 3

PDF文档 专利 一种基于注意力机制的人脸识别方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于注意力机制的人脸识别方法 第 1 页 专利 一种基于注意力机制的人脸识别方法 第 2 页 专利 一种基于注意力机制的人脸识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:12:06上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。