专利一种基于自适应池化方式的图像分类方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211131518.X (22)申请日 2022.09.16 (71)申请人安徽大学地址 230601 安徽省合肥市蜀山区安徽大学磬苑校区 (72)发明人任璐　李浩　宋坤　赵冬　 (74)专利代理机构南京众联专利代理有限公司 32206 专利代理师杜静静 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/774(2022.01) G06V 10/82(2022.01) G06V 10/24(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称一种基于自适应池化方式的图像分类方法 (57)摘要本发明公开了一种基于自适应池化方式的图像分类方法，将当前池化层的输入特征图按照池化层所给定的卷积核尺寸、步长和填充的大小，使用滑动窗口的方式分别展开为n个区域，每个区域分别对应有一个α值，采用自适应的方式，将特征图对应的n个区域经过采样后得到一系列t分布，再将其经过仿射变换后，结合当前的 α值，动态地去调整α值的大小，进而就控制自适应池化动态的去改变输出特征点的选择，再将池化后的特征值折叠起来，就得到使用了不同程度的池化方式所对应的输出特征图。通过本发明，解决了传统图像分类中只能使用最大池化或者平均池化所带来的保留的信息不够准确等问题，从而能更好的利用的数据的实际情况，提高了模型分类的准确率。权利要求书2页说明书6页附图2页 CN 115424076 A 2022.12.02 CN 115424076 A 1.一种基于自适应池化方式的图像分类方法，其特征在于，所述方法包括以下步骤：步骤1：获取数据集并定义模型，初始化自适应池化层的α 值；步骤2：定义优化器、损失函数和学习率衰减策略，设定超参数大小，包括学习率、迭代次数、批大小、控制 α 更新的λ和 ξ；步骤3：将训练集送入模型，开始迭代训练，迭代次数设为epoc h；步骤3‑1：神经网络前向传播，当经过第i层池化层时，将当前第i层的输入特征图通过给定的卷积核尺寸K[0]×K[1]、填充大小P和步长大小S，使用滑动窗口的操作，提取出滑动的 n个局部区域块，记为I＝[X1,X2,...,Xn,]，其中，每个局部区域块的大小为K[0]×K[1]，其中一个区域内的特征值记为Xi＝{x1,x2,...,xT}， T＝K[0]×K[1]；步骤3‑2：若epoch＝1，则n个局部区域块使用初始化后的α 值，否则使用上轮迭代后的α 值；步骤3‑3： n个局部区域块，每个局部区域块特征值为Xi＝{x1,x2,...,xT}，通过均值、方差和自由度计算得到n个与之对应的t分布，将其经过仿射变换得到预调整值α ′，由α和两个超参数 λ、 ξ进行更新α 大小；步骤3‑4： n个局部区域块，每个局部区域块特征值为Xi＝{x1,x2,...,xT}，结合更新后的 α 值，经过自适应池化方式后得到池化后的特征值bi， bi可以由α 值控制选择出Xi中的任意一个特征值，最后该自适应方式的输出为B＝[b1,b2,...,bn,]；步骤3‑5：将该自适应输出B ＝[b1,b2,...,bn,]，经由滑动窗口的逆操作，折叠后还原回特征图的张量形式，得到该层池化层的输出特征图；步骤4：前向传播结束后，经由分类器对模型输出的特征进行分类，计算损失并反向传播，直至迭代结束。 2.根据权利要求1所述的基于自适应池化方式的图像分类方法，其特征在于，在步骤3 ‑ 1中，第i层的输入特征图的大小为[N,C,W,H]，其中N为batch size的大小， C为特征图的通道数， W和H为特征图的尺寸；根据卷积核尺寸K[0]×K[1]、填充大小P和步长大小S，每个通道上的特征图大小，经由滑动窗口的方式得到n个K[0]×K[1]大小的局部区域块，其中：其中， i∈{0,1}，且spatialsiez[0]＝W,spatialsiez[1]＝H；每个通道上形成的n个局部区域块分别对应有一个α 值。 3.根据权利要求1所述的基于自适应池化方式的图像分类方法，其特征在于，在步骤3 ‑ 4中，所述的自适应池化方法为：其中，每个局部区域块的特征值为X＝{x1,x2,...,xT}， T＝K[0]×K[1]， b( α )为该局部区域块池化后的结果， α 为控制区域内自适应池化程度的参数，并赋有初始值。 4.根据权利要求1所述的基于自适应池化方式的图像分类方法，其特征在于，在步骤3 ‑ 3中，在神经网络第一轮结束之后，对于池化层的输入特征图，展开为n个局部区域块，每个局部区域块得到与之对应的t分布，通过对其均值 μ、方差σ 及自由度n进行仿射变换后，得到权　利　要　求　书 1/2 页 2 CN 115424076 A 2新的预调整值α ′。 5.根据权利要求1或4所述的基于自适应池化方式的图像分类方法，其特征在于，在步骤3‑3中，能动态调整α 值，关键在于获得预调整值α ′， α′由均值 μ、方差σ 及自由度n进行仿射变换后获得，仿射变换的方式通过线性插值的方法得到：在一个确定的自由度n时，有： α′＝w11α′11+w12α′12+w21α′21+w22α′22，其中，且σ1、 σ2、 μ1、 μ2、 α′11、 α′12、 α′21、 α′22为根据训练数据反复实验所得到的结果。 6.根据权利要求1所述的基于自适应池化方式的图像分类方法，其特征在于，在步骤3 ‑ 3中，经由仿射变换后得到的预调整值α ′，需要经过两个超参数λ和 ξ控制最终进行α 值的更新，更新控制方式为： α ＝ λ α +ξ α ′，其中， λ， ξ∈[0,1]，且 λ +ξ ＝1。 7.根据权利要求1所述的基于自适应池化方式的图像分类方法，其特征在于，在步骤3 ‑ 5中，将每个局部区域块进行池化后，将池化后的结果按照逆向展开的方式，将所有局部区域块的特征点，按照展开时的空间位置关系，重新折叠回特征图的张量形式，该形式也即是自适应池化层最终的输出结果。 8.根据权利要求3所述的基于自适应池化方式的图像分类方法，其特征在于，在步骤1 中， α 在网络初始进行训练时设有初始值，根据所述的自适应池化方法，其有如下性质：因此当初始值为趋于0或无穷大时，初始化的池化方式近似于平均池化或最大值池化的方式，当随着不断动态调整α值时，池化的输出选择也会在不断发生改变，通过控制α 的值，从而可以选择区域内任意的一个特征点进行输出。 9.根据权利要求6所述的基于自适应池化方式的图像分类方法，其特征在于，在步骤3 ‑ 3中，更新α 时存在两种特殊形式： (1)当λ＝0， ξ＝ 1时，即将仿射变换后得到的预调整值α ′直接作为新的α 值； (2)当λ＝ 1， ξ＝0时，即整个模型都只使用 α 的初始值进行训练和测试，不进行α 的动态更新：若α 的初始值趋于0时，表示模型中一直使用均值池化的方式；若α 的初始值趋于正无穷时，表示模型中一直使用最大值池化的方式。 10.根据权利要求5所述的基于自适应池化方式的图像分类方法，其特征在于，在步骤 3‑3中，自由度n由当前池化层所给定的卷积核尺寸大小决定，即： n＝K[0]×K[1]，其中K[0]×K[1]为池化层的卷积核尺寸。权　利　要　求　书 2/2 页 3 CN 115424076 A 3

专利 一种基于自适应池化方式的图像分类方法

专利一种基于自适应池化方式的图像分类方法