专利一种基于联邦遗传编程的符号回归方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210366425.9 (22)申请日 2022.04.08 (71)申请人华南理工大学地址 510640 广东省广州市天河区五山路 381号 (72)发明人钟竞辉　董俊兰　陈伟能　 (74)专利代理机构广州粤高专利商标代理有限公司 44102 专利代理师江裕强 (51)Int.Cl. G06F 21/62(2013.01) G06N 3/12(2006.01) (54)发明名称一种基于联邦遗传编程的符号回归方法 (57)摘要本发明公开了一种基于联邦遗传编程的符号回归方法。所述方法包括以下步骤：创建多线程，确定接入服务器的客户端数量，确保客户端访问服务器成功；随机初始化种群；多个客户端并行的进行种群的适应度计算，判断适应值是否达到终止条件，是则退出，否则执行服务器适应度聚合；根据均值漂移聚合机制进行适应度聚合，得到聚合的适应度值F；根据聚合的适应度值 F选择个体的过程，被选择的个体在之后会作为父系，通过遗传算子繁育下一代程序个体；基因以一定的概率随机改变为新值；每个基因与突变载体交叉，生成一个种群，返回判断适应值是否达到终止条件。本发明的符号回归方法能够充分利用数据信息，与传统的基因编程算法相比，效果更好。权利要求书3页说明书6页附图3页 CN 114840873 A 2022.08.02 CN 114840873 A 1.一种基于联邦遗传编程的符号回归方法，其特征在于，包括以下步骤： S1：初始化：创建多线程，确定接入服务器的客户端数量，确保客户端访问服务器成功；随机初始化种群，种群大小为 NP； S2：客户端适应度计算：多个客户端并行的进行种群的适应度计算，判断适应值是否达到终止条件，是则退出，否则执行步骤S3； S3：服务器适应度聚合：根据均值漂移(Mean shift)聚合机制进行适应度聚合，得到聚合的种群适应度F； S4：基因选择：根据聚合的种群适应度F选择个体的过程，被选择的个体在之后会作为父系，通过遗传算子繁育下一代程序个体； S5：基因突变：基因以一定的概率随机改变为新值； S6：基因交叉：每个基因与突变载体交叉，生成一个种群，返回步骤S2。 2.根据权利要求1所述的一种基于联邦遗传编程的符号回归方法，其特征在于，步骤S1 中，构建一个用于符号回归的符号回归系统，符号回归系统包括多个客户端和一个中心服务器即服务端，服务端发送种群给客户端，客户端根据自身的数据计算出适应度返回给服务端，双方传递的都不是原始数据，解决了隐私环境下数据不共享的问题。 3.根据权利要求2所述的一种基于联邦遗传编程的符号回归方法，其特征在于，步骤S1 中，启动服务器和多个客户端；服务器实时监控是否有申请接入的服务器端或者需要断开的已连接的客户端，当一个新的客户端请求访问时，服务器立即响应客户端的接入；当所有客户端成功连接后，在服务器上进行种群初始化；服务器中，服务器确认连接的客户端的IP 和端口，然后统一将初始种群发送给客户端；服务器中的种群初始化是指生成NP个随机染色体，形成初始种群，具体表示如下： X＝{Xi|Xi＝[xi,1,xi,2,...,xi,L],i＝1,2,...,NP} (1) 其中， Xi是代表第i个染色体的向量， i是种群中染色体的索引， xi,j是第i个染色体Xi的第j个元素， L是染色体的长度， NP代表种群大小；每个染色体包括一个主程序和多个子函数，主程序和子函数都由头部和尾部的基因表达式组成；客户端中，在启动前确认需要连接的服务器的IP地址和端口号，在成功连接服务器后，等待服务器发送种群进行适应度计算。 4.根据权利要求1所述的一种基于联邦遗传编程的符号回归方法，其特征在于，步骤S2 中，客户端获取种群后，种群中的每条染色体编码为与染色体长度相等的表达式；假定所有客户端的数据集如下表示： D＝{D1,...,Dk,...,DK} (2) 其中， Dk表示连接服务器的第k台客户端的数据， k＝1～K， K为连接服务器的客户端的数量；经过染色体编码和计算得到整个种群适应度f，表示如下：其中， NP表示种群大小， fk(Xi)表示种群中第i条染色体在第k台客户端计算出来的适应权　利　要　求　书 1/3 页 2 CN 114840873 A 2度值， i＝1～NP。 5.根据权利要求1所述的一种基于联邦遗传编程的符号回归方法，其特征在于，步骤S3 中，采用均值漂移聚合机制，每个染色体根据每个客户端的重要性聚合多个适应度，均值漂移聚合机制算法具体如下： S3.1：初始化聚合的种群适应度F＝0，获取随机中心点x； S3.2：输入核带宽h、聚合终止距离sd,、整个种群适应度f和客户端权重W＝[w1,w2,..., wk]； S3.3：计算整个种群适应度f到随机中心点x的所有距离，然后找到核带宽h范围内的所有点，称为集合M； S3.4：计算随机中心点x到集合M中每一点的向量，将所有向量相加得到 Mh(x)； S3.5：随机中心点x沿着Mh(x)的方向移动，中心点变成x'＝x+| |Mh(x)||； S3.6：循环步骤S3.3 ‑步骤S3.5，直到满足|Mh(x)||＜sd，执行步骤S3.7； S3.7：输出聚合的种群适应度F；均值漂移聚合机制算法中的核带宽h是高斯核函数的重要参数，取值不同聚合效果不一样；客户端的权重W根据客户端数据量占所有客户端数据总量的百分比计算。 6.根据权利要求5所述的一种基于联邦遗传编程的符号回归方法，其特征在于， Mh(x)具体计算公式如下：其中， xi表示种群中第i条染色体， wk表示第k台客户端的权重，表示高斯核函数。 7.根据权利要求1所述的一种基于联邦遗传编程的符号回归方法，其特征在于，步骤S4 中，基于步骤S3中获得的聚合的种群适应度F＝{fc(X1),...,fc(Xi),...,fc(XNP)}，选择后代来替代父代的染色体，形成一个新的群体，具体如下：其中， f(Ui)表示父代染色体Ui的适应度，父代染色体表示上一轮训练的染色体， fc(Xi) 表示第i条染色体Xi聚合的适应度值。 8.根据权利要求1所述的一种基于联邦遗传编程的符号回归方法，其特征在于，步骤S5 中，基于传统DE突变方案 “DE/current ‑to‑best/1”，染色体中的基因以某个概率随机改变为新值，具体如下： Yi＝Xi+β(Xbest‑Xi)+β {Xr1‑Xr2} (5) 其中， Yi表示种群中第i条染色体Xi的突变载体， Xbest是种群中最好的个体， Xr1、 Xr2和Xi 分别为三个不同的个体， Xr1和Xr2从种群中随机选取； β 为缩放因子，取值为rand(0,1)。 9.根据权利要求1所述的一种基于联邦遗传编程的符号回归方法，其特征在于，步骤S6权　利　要　求　书 2/3 页 3 CN 114840873 A 3

专利 一种基于联邦遗传编程的符号回归方法

专利一种基于联邦遗传编程的符号回归方法