全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211131518.X (22)申请日 2022.09.16 (71)申请人 安徽大学 地址 230601 安徽省合肥市蜀山区安徽大 学磬苑校区 (72)发明人 任璐 李浩 宋坤 赵冬  (74)专利代理 机构 南京众联专利代理有限公司 32206 专利代理师 杜静静 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/774(2022.01) G06V 10/82(2022.01) G06V 10/24(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 一种基于自适应池化方式的图像分类方法 (57)摘要 本发明公开了一种基于自适应池化方式的 图像分类方法, 将当前池化层的输入 特征图按照 池化层所给定的卷积核尺寸、 步长和填充的大 小, 使用滑动窗口的方式分别展 开为n个区域, 每 个区域分别对应有一个α值, 采用自适应的方 式, 将特征图对应的n个区域经过采样后得到一 系列t分布, 再将其经过仿射变换后, 结合 当前的 α值, 动态地去调整α值的大小, 进而就控制自 适应池化动态的去改变输出特征点的选择, 再将 池化后的特征值折叠起来, 就得到使用了不同程 度的池化方式所对应的输出特征图。 通过本发 明, 解决了传统图像分类中只能使用最大池化或 者平均池化所带来的保留的信息不够准确等问 题, 从而能更好的利用的数据的实际情况, 提高 了模型分类的准确率。 权利要求书2页 说明书6页 附图2页 CN 115424076 A 2022.12.02 CN 115424076 A 1.一种基于自适应池化方式的图像分类方法, 其特 征在于, 所述方法包括以下步骤: 步骤1: 获取 数据集并定义模型, 初始化自适应池化层的α 值; 步骤2: 定义优化器、 损失函数和学习率衰减策略, 设定超参数大小, 包括学习率、 迭代 次数、 批大小、 控制 α 更新的λ和 ξ; 步骤3: 将训练集送入 模型, 开始迭代训练, 迭代次数设为epoc h; 步骤3‑1: 神经网络前向传播, 当经过第i层池化层时, 将当前第i层的输入特征图通过 给定的卷积核尺 寸K[0]×K[1]、 填充大小P和步长大小S, 使用滑动窗口的操作, 提取出滑动的 n个局部区域块, 记为I=[X1,X2,...,Xn,], 其中, 每个局部区域块的大小为K[0]×K[1], 其中 一个区域内的特 征值记为Xi={x1,x2,...,xT}, T=K[0]×K[1]; 步骤3‑2: 若epoch=1, 则n个局部区域块使用初始化后的α 值, 否则 使用上轮迭代后的α 值; 步骤3‑3: n个局部区域块, 每个局部区域块特征值为Xi={x1,x2,...,xT}, 通过均值、 方 差和自由度计算得到n个与之对应的t分布, 将其经过仿射变换得到预调整值α ′, 由α和两个 超参数 λ、 ξ进行 更新α 大小; 步骤3‑4: n个局部区域块, 每个局部区域块特征值为Xi={x1,x2,...,xT}, 结合更新后的 α 值, 经过自适应池化方式后得到池化后的特征值bi, bi可以由α 值控制选择出Xi中的任意一 个特征值, 最后该自适应方式的输出为B=[b1,b2,...,bn,]; 步骤3‑5: 将该自适应输出B =[b1,b2,...,bn,], 经由滑动窗口的逆操作, 折叠后 还原回 特征图的张量形式, 得到该层池化层的输出 特征图; 步骤4: 前向传播结束后, 经由分类器对模型输出的特征进行分类, 计算损失并反向传 播, 直至迭代结束。 2.根据权利要求1所述的基于自适应池化方式的图像分类方法, 其特征在于, 在步骤3 ‑ 1中, 第i层的输入特征图的大小为[N,C,W,H], 其中N为batch  size的大小, C为特征图的通 道数, W和H为特征图的尺寸; 根据卷积核尺寸K[0]×K[1]、 填充大小P和步长大小S, 每个通道 上的特征图大小, 经由滑动窗口 的方式得到n个K[0]×K[1]大小的局部区域 块, 其中: 其中, i∈{0,1}, 且spatialsiez[0]=W,spatialsiez[1]=H; 每个通道上形成的n个局部 区域块分别对应有一个α 值。 3.根据权利要求1所述的基于自适应池化方式的图像分类方法, 其特征在于, 在步骤3 ‑ 4中, 所述的自适应池化方法为: 其中, 每个局部区域块的特征值为X={x1,x2,...,xT}, T=K[0]×K[1], b( α )为该局部区 域块池化后的结果, α 为控制区域内自适应池化 程度的参数, 并赋有初始值。 4.根据权利要求1所述的基于自适应池化方式的图像分类方法, 其特征在于, 在步骤3 ‑ 3中, 在神经网络第一轮结束之后, 对于池化层的输入特征图, 展开为n个局部区域块, 每个 局部区域块得到与之对应的t分布, 通过对其均值 μ、 方差σ 及自由度n进 行仿射变换后, 得到权 利 要 求 书 1/2 页 2 CN 115424076 A 2新的预调整值α ′。 5.根据权利要求1或4所述的基于自适应池化方式的图像分类方法, 其特征在于, 在步 骤3‑3中, 能动态调整α 值, 关键在于获得预调整值α ′, α′由均值 μ、 方差σ 及自由度n进行仿射 变换后获得, 仿射变换的方式通过线性插值的方法得到: 在一个确定的自由度n时, 有: α′=w11α′11+w12α′12+w21α′21+w22α′22, 其中, 且σ1、 σ2、 μ1、 μ2、 α′11、 α′12、 α′21、 α′22为根据训练数据反复实 验所得到的结果。 6.根据权利要求1所述的基于自适应池化方式的图像分类方法, 其特征在于, 在步骤3 ‑ 3中, 经由仿射变换后得到的预调整值α ′, 需要经过两个超参数λ和 ξ控制最终进行α 值的更 新, 更新控制方式为: α = λ α +ξ α ′, 其中, λ, ξ∈[0,1], 且 λ +ξ =1。 7.根据权利要求1所述的基于自适应池化方式的图像分类方法, 其特征在于, 在步骤3 ‑ 5中, 将每个局部区域块进行池化后, 将池化后的结果按照逆向展开的方式, 将所有局部区 域块的特征点, 按照展开时的空间位置 关系, 重新折叠回特征图的张量形式, 该形式也即是 自适应池化层最终的输出 结果。 8.根据权利要求3所述的基于自适应池化方式的图像分类方法, 其特征在于, 在步骤1 中, α 在网络初始进行训练时设有初始值, 根据所述的自适应池化方法, 其有如下性质: 因此当初始值为趋于0或无穷大时, 初始化的池化方式近似于平均池化或最大值池化 的方式, 当随着不断动态调整α值时, 池化的输出选择也会在不断发生改变, 通过控制α 的 值, 从而可以选择区域内任意的一个特 征点进行输出。 9.根据权利要求6所述的基于自适应池化方式的图像分类方法, 其特征在于, 在步骤3 ‑ 3中, 更新α 时存在两种特殊形式: (1)当λ=0, ξ= 1时, 即将 仿射变换后得到的预调整值α ′直 接作为新的α 值; (2)当λ= 1, ξ=0时, 即整个模 型都只使用 α 的初始值进 行训练和测试, 不进 行α 的动态更新: 若α 的初始 值趋于0时, 表示模 型中一直使用均值池化的方式; 若α 的初始值 趋于正无穷时, 表示模型中一 直使用最大值池化的方式。 10.根据权利要求5所述的基于自适应池化方式的图像分类方法, 其特征在于, 在步骤 3‑3中, 自由度n由当前池化层所 给定的卷积核尺寸大小决定, 即: n=K[0]×K[1], 其中K[0]×K[1]为池化层的卷积核尺寸。权 利 要 求 书 2/2 页 3 CN 115424076 A 3

PDF文档 专利 一种基于自适应池化方式的图像分类方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于自适应池化方式的图像分类方法 第 1 页 专利 一种基于自适应池化方式的图像分类方法 第 2 页 专利 一种基于自适应池化方式的图像分类方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:58:33上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。