(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210366425.9
(22)申请日 2022.04.08
(71)申请人 华南理工大 学
地址 510640 广东省广州市天河区五山路
381号
(72)发明人 钟竞辉 董俊兰 陈伟能
(74)专利代理 机构 广州粤高专利商标代理有限
公司 44102
专利代理师 江裕强
(51)Int.Cl.
G06F 21/62(2013.01)
G06N 3/12(2006.01)
(54)发明名称
一种基于联邦遗传编程的符号回归方法
(57)摘要
本发明公开了一种基于联邦遗传编程的符
号回归方法。 所述方法包括以下步骤: 创建多线
程, 确定接入服务器的客户端数量, 确保客户端
访问服务器成功; 随机初始化种群; 多个客户端
并行的进行种群的适应度计算, 判断适应值是否
达到终止条件, 是则退出, 否则执行服务器适应
度聚合; 根据均值漂移聚合机制进行适应度聚
合, 得到聚合的适应度值F; 根据聚合的适应度值
F选择个体的过程, 被选择的个体在之后会作为
父系, 通过遗传算子繁育下一代程序个体; 基因
以一定的概率随机改变为新值; 每个基因与突变
载体交叉, 生成一个种群, 返回判断适应值是否
达到终止 条件。 本发明的符号回归 方法能够充分
利用数据信息, 与传统的基因编程算法相比, 效
果更好。
权利要求书3页 说明书6页 附图3页
CN 114840873 A
2022.08.02
CN 114840873 A
1.一种基于联邦 遗传编程的符号回归方法, 其特 征在于, 包括以下步骤:
S1: 初始化: 创建多线程, 确定接入服务器的客户端数量, 确保客户端访问服务器成功;
随机初始化种群, 种群大小为 NP;
S2: 客户端适应度计算: 多个客户端并行的进行种群的适应度计算, 判断适应值是否达
到终止条件, 是则退 出, 否则执 行步骤S3;
S3: 服务器适应度聚合: 根据均值漂移(Mean shift)聚合机制进行适应度聚合, 得到聚
合的种群适应度F;
S4: 基因选择: 根据聚合的种群适应度F选择个体的过程, 被选择的个体在之后会作为
父系, 通过遗传算子 繁育下一代程序个 体;
S5: 基因突变: 基因以一定的概 率随机改变为 新值;
S6: 基因交叉: 每个基因与突变载体交叉, 生成一个种群, 返回步骤S2。
2.根据权利要求1所述的一种基于联邦遗传编程的符号 回归方法, 其特征在于, 步骤S1
中, 构建一个用于符号回归的符号回归系统, 符号回归系统包括多个客户端和一个中心服
务器即服务端, 服务端发送种群给客户端, 客户端根据自身的数据计算出适应度返回给服
务端, 双方传递的都不是原 始数据, 解决了隐私环境下 数据不共享的问题。
3.根据权利要求2所述的一种基于联邦遗传编程的符号 回归方法, 其特征在于, 步骤S1
中, 启动服务器和多个客户端; 服务器实时监控是否有 申请接入的服务器端或者需要断开
的已连接的客户端, 当一个新的客户端请求访问时, 服务器立即响应客户端的接入; 当所有
客户端成功连接后, 在服务器上进 行种群初始 化; 服务器中, 服务器确认连接的客户端的IP
和端口, 然后统一将初始种群发送给客户端;
服务器中的种群初始化是指生成NP个随机染色体, 形成初始种群, 具体表示如下:
X={Xi|Xi=[xi,1,xi,2,...,xi,L],i=1,2,...,NP} (1)
其中, Xi是代表第i个染色体的向量, i是种群中染色体的索引, xi,j是第i个染色体Xi的
第j个元素, L是染色体的长度, NP代表种群大小; 每个染色体包括一个主程序和多个子函
数, 主程序和子函数都由头 部和尾部的基因表达式组成;
客户端中, 在启动前确认需要连接的服务器的IP地址和端口号, 在成功连接服务器后,
等待服务器发送种群进行适应度计算。
4.根据权利要求1所述的一种基于联邦遗传编程的符号 回归方法, 其特征在于, 步骤S2
中, 客户端获取种群后, 种群中的每条染色体编码为与染色体长度相等的表达式; 假定所有
客户端的数据集如下表示:
D={D1,...,Dk,...,DK} (2)
其中, Dk表示连接服务器的第k台客户端的数据, k=1~K, K为连接服务器的客户端的数
量; 经过染色体编码和计算得到整个种群适应度f, 表示如下:
其中, NP表示种群大小, fk(Xi)表示种群中第i条染色体在第k台客户端计算出来的适应权 利 要 求 书 1/3 页
2
CN 114840873 A
2度值, i=1~NP。
5.根据权利要求1所述的一种基于联邦遗传编程的符号 回归方法, 其特征在于, 步骤S3
中, 采用均值漂移聚合机制, 每个染色体根据每个客户端的重要性聚合多个适应度, 均值漂
移聚合机制算法具体如下:
S3.1: 初始化聚合的种群适应度F=0, 获取随机中心点x;
S3.2: 输入核带宽h、 聚合终止距离sd,、 整个种群适应度f和客户端权重W=[w1,w2,...,
wk];
S3.3: 计算整个种群适应度f到随机中心点x的所有距离, 然后找到核带宽h范围内的所
有点, 称为 集合M;
S3.4: 计算随机中心点x到集 合M中每一 点的向量, 将所有向量相加得到 Mh(x);
S3.5: 随机中心点x沿着Mh(x)的方向移动, 中心点变成x'=x+| |Mh(x)||;
S3.6: 循环步骤S3.3 ‑步骤S3.5, 直到满足|Mh(x)||<sd, 执行步骤S3.7;
S3.7: 输出聚合的种群适应度F;
均值漂移聚合机制算法中的核带宽h是高斯核函数的重要参数, 取值不同聚合效果不
一样; 客户端的权 重W根据客户端数据量占所有客户端数据总量的百分比计算。
6.根据权利要 求5所述的一种基于联邦遗传编程的符号回归方法, 其特征在于, Mh(x)具
体计算公式如下:
其中, xi表示种群中第i条染色体, wk表示第k台客户端的权重,
表示高斯核
函数。
7.根据权利要求1所述的一种基于联邦遗传编程的符号 回归方法, 其特征在于, 步骤S4
中, 基于步骤S3中获得的聚合的种 群适应度F={fc(X1),...,fc(Xi),...,fc(XNP)}, 选择后
代来替代父代的染色体, 形成一个新的群 体, 具体如下:
其中, f(Ui)表示父代染色体Ui的适应度, 父代染色体表示上一轮训练的染色体, fc(Xi)
表示第i条染色体Xi聚合的适应度值。
8.根据权利要求1所述的一种基于联邦遗传编程的符号 回归方法, 其特征在于, 步骤S5
中, 基于传统DE突变方案 “DE/current ‑to‑best/1”, 染色体中的基因以某个概率随机改变
为新值, 具体如下:
Yi=Xi+β(Xbest‑Xi)+β {Xr1‑Xr2} (5)
其中, Yi表示种群中第i条染色体Xi的突变载体, Xbest是种群中最好的个体, Xr1、 Xr2和Xi
分别为三个不同的个 体, Xr1和Xr2从种群中随机 选取; β 为缩放因子, 取值 为rand(0,1)。
9.根据权利要求1所述的一种基于联邦遗传编程的符号 回归方法, 其特征在于, 步骤S6权 利 要 求 书 2/3 页
3
CN 114840873 A
3
专利 一种基于联邦遗传编程的符号回归方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-07 12:39:42上传分享