(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211131518.X
(22)申请日 2022.09.16
(71)申请人 安徽大学
地址 230601 安徽省合肥市蜀山区安徽大
学磬苑校区
(72)发明人 任璐 李浩 宋坤 赵冬
(74)专利代理 机构 南京众联专利代理有限公司
32206
专利代理师 杜静静
(51)Int.Cl.
G06V 10/764(2022.01)
G06V 10/774(2022.01)
G06V 10/82(2022.01)
G06V 10/24(2022.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
一种基于自适应池化方式的图像分类方法
(57)摘要
本发明公开了一种基于自适应池化方式的
图像分类方法, 将当前池化层的输入 特征图按照
池化层所给定的卷积核尺寸、 步长和填充的大
小, 使用滑动窗口的方式分别展 开为n个区域, 每
个区域分别对应有一个α值, 采用自适应的方
式, 将特征图对应的n个区域经过采样后得到一
系列t分布, 再将其经过仿射变换后, 结合 当前的
α值, 动态地去调整α值的大小, 进而就控制自
适应池化动态的去改变输出特征点的选择, 再将
池化后的特征值折叠起来, 就得到使用了不同程
度的池化方式所对应的输出特征图。 通过本发
明, 解决了传统图像分类中只能使用最大池化或
者平均池化所带来的保留的信息不够准确等问
题, 从而能更好的利用的数据的实际情况, 提高
了模型分类的准确率。
权利要求书2页 说明书6页 附图2页
CN 115424076 A
2022.12.02
CN 115424076 A
1.一种基于自适应池化方式的图像分类方法, 其特 征在于, 所述方法包括以下步骤:
步骤1: 获取 数据集并定义模型, 初始化自适应池化层的α 值;
步骤2: 定义优化器、 损失函数和学习率衰减策略, 设定超参数大小, 包括学习率、 迭代
次数、 批大小、 控制 α 更新的λ和 ξ;
步骤3: 将训练集送入 模型, 开始迭代训练, 迭代次数设为epoc h;
步骤3‑1: 神经网络前向传播, 当经过第i层池化层时, 将当前第i层的输入特征图通过
给定的卷积核尺 寸K[0]×K[1]、 填充大小P和步长大小S, 使用滑动窗口的操作, 提取出滑动的
n个局部区域块, 记为I=[X1,X2,...,Xn,], 其中, 每个局部区域块的大小为K[0]×K[1], 其中
一个区域内的特 征值记为Xi={x1,x2,...,xT}, T=K[0]×K[1];
步骤3‑2: 若epoch=1, 则n个局部区域块使用初始化后的α 值, 否则 使用上轮迭代后的α
值;
步骤3‑3: n个局部区域块, 每个局部区域块特征值为Xi={x1,x2,...,xT}, 通过均值、 方
差和自由度计算得到n个与之对应的t分布, 将其经过仿射变换得到预调整值α ′, 由α和两个
超参数 λ、 ξ进行 更新α 大小;
步骤3‑4: n个局部区域块, 每个局部区域块特征值为Xi={x1,x2,...,xT}, 结合更新后的
α 值, 经过自适应池化方式后得到池化后的特征值bi, bi可以由α 值控制选择出Xi中的任意一
个特征值, 最后该自适应方式的输出为B=[b1,b2,...,bn,];
步骤3‑5: 将该自适应输出B =[b1,b2,...,bn,], 经由滑动窗口的逆操作, 折叠后 还原回
特征图的张量形式, 得到该层池化层的输出 特征图;
步骤4: 前向传播结束后, 经由分类器对模型输出的特征进行分类, 计算损失并反向传
播, 直至迭代结束。
2.根据权利要求1所述的基于自适应池化方式的图像分类方法, 其特征在于, 在步骤3 ‑
1中, 第i层的输入特征图的大小为[N,C,W,H], 其中N为batch size的大小, C为特征图的通
道数, W和H为特征图的尺寸; 根据卷积核尺寸K[0]×K[1]、 填充大小P和步长大小S, 每个通道
上的特征图大小, 经由滑动窗口 的方式得到n个K[0]×K[1]大小的局部区域 块, 其中:
其中, i∈{0,1}, 且spatialsiez[0]=W,spatialsiez[1]=H; 每个通道上形成的n个局部
区域块分别对应有一个α 值。
3.根据权利要求1所述的基于自适应池化方式的图像分类方法, 其特征在于, 在步骤3 ‑
4中, 所述的自适应池化方法为:
其中, 每个局部区域块的特征值为X={x1,x2,...,xT}, T=K[0]×K[1], b( α )为该局部区
域块池化后的结果, α 为控制区域内自适应池化 程度的参数, 并赋有初始值。
4.根据权利要求1所述的基于自适应池化方式的图像分类方法, 其特征在于, 在步骤3 ‑
3中, 在神经网络第一轮结束之后, 对于池化层的输入特征图, 展开为n个局部区域块, 每个
局部区域块得到与之对应的t分布, 通过对其均值 μ、 方差σ 及自由度n进 行仿射变换后, 得到权 利 要 求 书 1/2 页
2
CN 115424076 A
2新的预调整值α ′。
5.根据权利要求1或4所述的基于自适应池化方式的图像分类方法, 其特征在于, 在步
骤3‑3中, 能动态调整α 值, 关键在于获得预调整值α ′, α′由均值 μ、 方差σ 及自由度n进行仿射
变换后获得, 仿射变换的方式通过线性插值的方法得到:
在一个确定的自由度n时, 有:
α′=w11α′11+w12α′12+w21α′21+w22α′22,
其中,
且σ1、 σ2、 μ1、 μ2、 α′11、 α′12、 α′21、 α′22为根据训练数据反复实
验所得到的结果。
6.根据权利要求1所述的基于自适应池化方式的图像分类方法, 其特征在于, 在步骤3 ‑
3中, 经由仿射变换后得到的预调整值α ′, 需要经过两个超参数λ和 ξ控制最终进行α 值的更
新, 更新控制方式为:
α = λ α +ξ α ′,
其中, λ, ξ∈[0,1], 且 λ +ξ =1。
7.根据权利要求1所述的基于自适应池化方式的图像分类方法, 其特征在于, 在步骤3 ‑
5中, 将每个局部区域块进行池化后, 将池化后的结果按照逆向展开的方式, 将所有局部区
域块的特征点, 按照展开时的空间位置 关系, 重新折叠回特征图的张量形式, 该形式也即是
自适应池化层最终的输出 结果。
8.根据权利要求3所述的基于自适应池化方式的图像分类方法, 其特征在于, 在步骤1
中, α 在网络初始进行训练时设有初始值, 根据所述的自适应池化方法, 其有如下性质:
因此当初始值为趋于0或无穷大时, 初始化的池化方式近似于平均池化或最大值池化
的方式, 当随着不断动态调整α值时, 池化的输出选择也会在不断发生改变, 通过控制α 的
值, 从而可以选择区域内任意的一个特 征点进行输出。
9.根据权利要求6所述的基于自适应池化方式的图像分类方法, 其特征在于, 在步骤3 ‑
3中, 更新α 时存在两种特殊形式: (1)当λ=0, ξ= 1时, 即将 仿射变换后得到的预调整值α ′直
接作为新的α 值; (2)当λ= 1, ξ=0时, 即整个模 型都只使用 α 的初始值进 行训练和测试, 不进
行α 的动态更新: 若α 的初始 值趋于0时, 表示模 型中一直使用均值池化的方式; 若α 的初始值
趋于正无穷时, 表示模型中一 直使用最大值池化的方式。
10.根据权利要求5所述的基于自适应池化方式的图像分类方法, 其特征在于, 在步骤
3‑3中, 自由度n由当前池化层所 给定的卷积核尺寸大小决定, 即:
n=K[0]×K[1],
其中K[0]×K[1]为池化层的卷积核尺寸。权 利 要 求 书 2/2 页
3
CN 115424076 A
3
专利 一种基于自适应池化方式的图像分类方法
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-24 00:58:33上传分享