全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210366425.9 (22)申请日 2022.04.08 (71)申请人 华南理工大 学 地址 510640 广东省广州市天河区五山路 381号 (72)发明人 钟竞辉 董俊兰 陈伟能  (74)专利代理 机构 广州粤高专利商标代理有限 公司 44102 专利代理师 江裕强 (51)Int.Cl. G06F 21/62(2013.01) G06N 3/12(2006.01) (54)发明名称 一种基于联邦遗传编程的符号回归方法 (57)摘要 本发明公开了一种基于联邦遗传编程的符 号回归方法。 所述方法包括以下步骤: 创建多线 程, 确定接入服务器的客户端数量, 确保客户端 访问服务器成功; 随机初始化种群; 多个客户端 并行的进行种群的适应度计算, 判断适应值是否 达到终止条件, 是则退出, 否则执行服务器适应 度聚合; 根据均值漂移聚合机制进行适应度聚 合, 得到聚合的适应度值F; 根据聚合的适应度值 F选择个体的过程, 被选择的个体在之后会作为 父系, 通过遗传算子繁育下一代程序个体; 基因 以一定的概率随机改变为新值; 每个基因与突变 载体交叉, 生成一个种群, 返回判断适应值是否 达到终止 条件。 本发明的符号回归 方法能够充分 利用数据信息, 与传统的基因编程算法相比, 效 果更好。 权利要求书3页 说明书6页 附图3页 CN 114840873 A 2022.08.02 CN 114840873 A 1.一种基于联邦 遗传编程的符号回归方法, 其特 征在于, 包括以下步骤: S1: 初始化: 创建多线程, 确定接入服务器的客户端数量, 确保客户端访问服务器成功; 随机初始化种群, 种群大小为 NP; S2: 客户端适应度计算: 多个客户端并行的进行种群的适应度计算, 判断适应值是否达 到终止条件, 是则退 出, 否则执 行步骤S3; S3: 服务器适应度聚合: 根据均值漂移(Mean  shift)聚合机制进行适应度聚合, 得到聚 合的种群适应度F; S4: 基因选择: 根据聚合的种群适应度F选择个体的过程, 被选择的个体在之后会作为 父系, 通过遗传算子 繁育下一代程序个 体; S5: 基因突变: 基因以一定的概 率随机改变为 新值; S6: 基因交叉: 每个基因与突变载体交叉, 生成一个种群, 返回步骤S2。 2.根据权利要求1所述的一种基于联邦遗传编程的符号 回归方法, 其特征在于, 步骤S1 中, 构建一个用于符号回归的符号回归系统, 符号回归系统包括多个客户端和一个中心服 务器即服务端, 服务端发送种群给客户端, 客户端根据自身的数据计算出适应度返回给服 务端, 双方传递的都不是原 始数据, 解决了隐私环境下 数据不共享的问题。 3.根据权利要求2所述的一种基于联邦遗传编程的符号 回归方法, 其特征在于, 步骤S1 中, 启动服务器和多个客户端; 服务器实时监控是否有 申请接入的服务器端或者需要断开 的已连接的客户端, 当一个新的客户端请求访问时, 服务器立即响应客户端的接入; 当所有 客户端成功连接后, 在服务器上进 行种群初始 化; 服务器中, 服务器确认连接的客户端的IP 和端口, 然后统一将初始种群发送给客户端; 服务器中的种群初始化是指生成NP个随机染色体, 形成初始种群, 具体表示如下: X={Xi|Xi=[xi,1,xi,2,...,xi,L],i=1,2,...,NP}     (1) 其中, Xi是代表第i个染色体的向量, i是种群中染色体的索引, xi,j是第i个染色体Xi的 第j个元素, L是染色体的长度, NP代表种群大小; 每个染色体包括一个主程序和多个子函 数, 主程序和子函数都由头 部和尾部的基因表达式组成; 客户端中, 在启动前确认需要连接的服务器的IP地址和端口号, 在成功连接服务器后, 等待服务器发送种群进行适应度计算。 4.根据权利要求1所述的一种基于联邦遗传编程的符号 回归方法, 其特征在于, 步骤S2 中, 客户端获取种群后, 种群中的每条染色体编码为与染色体长度相等的表达式; 假定所有 客户端的数据集如下表示: D={D1,...,Dk,...,DK}                   (2) 其中, Dk表示连接服务器的第k台客户端的数据, k=1~K, K为连接服务器的客户端的数 量; 经过染色体编码和计算得到整个种群适应度f, 表示如下: 其中, NP表示种群大小, fk(Xi)表示种群中第i条染色体在第k台客户端计算出来的适应权 利 要 求 书 1/3 页 2 CN 114840873 A 2度值, i=1~NP。 5.根据权利要求1所述的一种基于联邦遗传编程的符号 回归方法, 其特征在于, 步骤S3 中, 采用均值漂移聚合机制, 每个染色体根据每个客户端的重要性聚合多个适应度, 均值漂 移聚合机制算法具体如下: S3.1: 初始化聚合的种群适应度F=0, 获取随机中心点x; S3.2: 输入核带宽h、 聚合终止距离sd,、 整个种群适应度f和客户端权重W=[w1,w2,..., wk]; S3.3: 计算整个种群适应度f到随机中心点x的所有距离, 然后找到核带宽h范围内的所 有点, 称为 集合M; S3.4: 计算随机中心点x到集 合M中每一 点的向量, 将所有向量相加得到 Mh(x); S3.5: 随机中心点x沿着Mh(x)的方向移动, 中心点变成x'=x+| |Mh(x)||; S3.6: 循环步骤S3.3 ‑步骤S3.5, 直到满足|Mh(x)||<sd, 执行步骤S3.7; S3.7: 输出聚合的种群适应度F; 均值漂移聚合机制算法中的核带宽h是高斯核函数的重要参数, 取值不同聚合效果不 一样; 客户端的权 重W根据客户端数据量占所有客户端数据总量的百分比计算。 6.根据权利要 求5所述的一种基于联邦遗传编程的符号回归方法, 其特征在于, Mh(x)具 体计算公式如下: 其中, xi表示种群中第i条染色体, wk表示第k台客户端的权重, 表示高斯核 函数。 7.根据权利要求1所述的一种基于联邦遗传编程的符号 回归方法, 其特征在于, 步骤S4 中, 基于步骤S3中获得的聚合的种 群适应度F={fc(X1),...,fc(Xi),...,fc(XNP)}, 选择后 代来替代父代的染色体, 形成一个新的群 体, 具体如下: 其中, f(Ui)表示父代染色体Ui的适应度, 父代染色体表示上一轮训练的染色体, fc(Xi) 表示第i条染色体Xi聚合的适应度值。 8.根据权利要求1所述的一种基于联邦遗传编程的符号 回归方法, 其特征在于, 步骤S5 中, 基于传统DE突变方案 “DE/current ‑to‑best/1”, 染色体中的基因以某个概率随机改变 为新值, 具体如下: Yi=Xi+β(Xbest‑Xi)+β {Xr1‑Xr2}       (5) 其中, Yi表示种群中第i条染色体Xi的突变载体, Xbest是种群中最好的个体, Xr1、 Xr2和Xi 分别为三个不同的个 体, Xr1和Xr2从种群中随机 选取; β 为缩放因子, 取值 为rand(0,1)。 9.根据权利要求1所述的一种基于联邦遗传编程的符号 回归方法, 其特征在于, 步骤S6权 利 要 求 书 2/3 页 3 CN 114840873 A 3

PDF文档 专利 一种基于联邦遗传编程的符号回归方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于联邦遗传编程的符号回归方法 第 1 页 专利 一种基于联邦遗传编程的符号回归方法 第 2 页 专利 一种基于联邦遗传编程的符号回归方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-07 12:39:42上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。