全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210988137.7 (22)申请日 2022.08.17 (71)申请人 支付宝 (杭州) 信息技 术有限公司 地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人 郑龙飞 王力  (74)专利代理 机构 北京亿腾知识产权代理事务 所(普通合伙) 11309 专利代理师 陈霁 周良玉 (51)Int.Cl. G06N 3/08(2006.01) G06N 3/04(2006.01) G06N 20/00(2019.01) G06F 21/62(2013.01) G06F 21/60(2013.01)H04L 9/00(2022.01) H04L 9/40(2022.01) (54)发明名称 联合更新模型的方法及装置 (57)摘要 本说明书实施例提供一种两方联合更新模 型的方法及装置, 在纵向联邦学习架构下, 标签 持有方生成同态加密的密钥对, 其中的第一密钥 可以公开给另 一方, 第二密钥在本地持有, 非标 签持有方可以生成乱序算法。 标签持有方对本地 特征的局部处理结果以密 态形式提供给第二方, 由非标签持有方将本地特征的局部处理结果与 标签持有方提供的局部处理结果进行密态乱序 融合。 非标签持有方将密 态乱序融合结果提供给 标签持有方, 由标签持有 方基于第二密钥的解密 在明文状态下完成预测并确定模 型损失。 基于模 型损失的梯度反向传播, 标签持有方得到乱序融 合结果的梯度, 该梯度可由非标签持有方恢复顺 序并稀疏化后用于各方局部模型待定参数 更新。 权利要求书4页 说明书14页 附图3页 CN 115358387 A 2022.11.18 CN 115358387 A 1.一种两方联合更新模型的方法, 用于第 一方和第 二方联合训练模型, 其中, 第 一方持 有训练样本的第一特征以及标签数据, 第二方持有训练样本的第二特征, 所述模型包括设 于第一方的第一局部模型MA和第三模型ML、 设于第二方的第二局 部模型MB, 第一局 部模型 MA、 第二局部模型MB分别用于处理第一特征、 第二特征得到预定维数的张量作为相应的中 间结果; 在当前更新周期, 第一方和第二方对应有当前批次排列顺序一致的n个训练样本, 所述方法由第一方 执行, 包括: 利用第一局部模型MA处理所述n个训练样本对应的第一特征XA, 得到n个预定维数的张 量构成的中间 张量HA; 通过本地持有的非对称密钥 对中的第一密钥Pk加密中间张量HA, 并将得到的第一密文 张量<HA>提供给第二方, 以供第二方反馈基于所述第一密钥Pk加密的密态乱序融合张量< Hs>, 其中, 所述第一密钥Pk由第一方公开给第二方, 所述密态乱序融合张量<Hs>经由所述 第一密文张量<HA>与中间张量HB基于乱序算法S按训练样本乱序且在第一密钥Pk加密的密 态形式下以叠加融合方式融合得到, 所述中间张量HB由第二方利用第二局部模型MB处理所 述n个训练样本对应的第二特 征XB得到; 利用第三模型ML处理经由所述非对称密钥对中的第二密钥Sk解密所述密态乱序融合 张量<Hs>得到的乱序融合张量Hs, 得到所述模型针对n个训练样本乱序后的n个预测 张量 Ys; 将n个预测张量Ys分别与n条训练样本对应的乱序标签Ys' 进行比较, 从而确定模型损 失, 其中, 所述乱序标签Y s' 经由和第二方基于所述第一密钥Pk、 所述乱序算法S执行安全乱 序得到; 以所述模型损失减小为目标更新第一局部模型MA及第三模型ML中的待定参数, 其中, 第三模型ML中的待定参数由基于所述模型损失确定的梯度进 行更新, 所述第一局部模型MA 中的待定参数基于与第二方进行同态加密的安全计算确定的梯度数据进行 更新。 2.如权利要求1所述的方法, 其中, 所述n个训练样本由第一方和第二方预先按照可唯 一描述训练样本的样本标识经由隐私求交确定 。 3.如权利要求1所述的方法, 其中, 所述乱序算法S为针对当前更新周期生成的乱序矩 阵, 该乱序矩阵用于对不同训练样本的数据排列顺序进行扰乱。 4.如权利要求1所述的方法, 其中, 所述叠加融合方式为加和、 求均值、 加权平均中的一 项。 5.如权利要求1所述的方法, 其中, 通过以下 方式确定所述乱序标签Ys' : 通过所述第一密钥Pk对n条训练样本对应的n条 标签数据进行加密, 得到密文标签< Y>; 向第二方提供密文标签<Y>, 以供第二方反馈经由所述乱序算法S处理密文标签<Y>得 到密文乱序标签< Ys' >; 利用所述第二密钥Sk对密文乱序标签< Ys' >解密得到所述乱序标签Ys' 。 6.如权利要求1所述的方法, 其中, 所述第一局部模型MA中的待定参数通过以下方式更 新: 向第二方提供模型损失针对乱序融合张量Hs的梯度数据Gs, 以供第二方基于所述乱序 算法S的逆运算S‑1将梯度数据Gs按训练样本恢 复顺序为梯度 数据G, 所述梯度 数据G描述模 型损失针对融合张量H的梯度;权 利 要 求 书 1/4 页 2 CN 115358387 A 2基于所述第 一局部模型MA分别关于最末隐层待定参数及输入数据的雅克比矩阵, 与所 述梯度数据G的稀疏化矩阵Gp进行基于所述第一密钥Pk的同态加密下的安全矩阵乘法, 在 第二方得到最末隐层的待定参数的密态梯度数据以及最末隐层的输入数据的密态梯度数 据; 从第二方接收最末隐层的待定参数的密态梯度数据以及最末隐层的输入数据的密态 梯度数据; 利用所述第 二密钥Sk解密最末隐层的待定参数的密态梯度 数据, 以用于更新最末隐层 的待定参数; 利用所述第二密钥Sk解密最末隐层的输入数据的密态梯度数据, 以基于梯度反向传 播, 确定所述第一局部模型MA中最末隐层以外的其他隐层的待定参数的梯度, 从而更新其 他隐层的待定参数。 7.如权利要求1所述的方法, 其中, 所述第一特征、 第二特征各自包括经由本地业务数 据提取的至少一个业 务特征。 8.一种两方联合更新模型的方法, 用于第 一方和第 二方联合训练模型, 其中, 第 一方持 有训练样本的第一特征以及标签数据, 第二方持有训练样本的第二特征, 所述模型包括设 于第一方的第一局部模型MA和第三模型ML、 设于第二方的第二局 部模型MB, 第一局 部模型 MA、 第二局部模型MB分别用于处理第一特征、 第二特征得到预定维数的张量作为相应的中 间结果; 在当前更新周期, 第一方和第二方对应有当前批次排列顺序一致的n个训练样本, 所述方法由第二方 执行, 包括: 利用第二局部模型MB处理所述n个训练样本对应的第二特征XB, 得到n个预定维数的张 量构成的中间 张量HB; 基于从第一方接收的第一密钥Pk以及第一密文张量<HA>, 确定密态乱序融合张量<Hs> 并反馈给第一方, 其中, 所述密态乱序融合张量<Hs>经由所述第一密文张量<HA>与中间张 量HB基于乱序算法S按训练样本乱序且在第一密钥Pk加密的密态形式下以叠加融合方式融 合得到, 所述第一密钥Pk与第一方持有的第二密钥Sk 为非对称密钥对; 从第一方接收模型损失对乱序融合张量Hs的梯度数据Gs, 其中, 乱序融合张量Hs基于 第二密钥Sk解密密态乱序融合张量<H s>得到, 所述模 型损失经由第一方通过第三模 型ML处 理乱序融合张量Hs的预测结果Ys与n个训练样本的乱序标签Ys' 对比确定; 基于所述乱序算法S的逆运算S‑1将梯度数据Gs按训练样本恢复顺序为梯度数据G, 所述 梯度数据G描述模型损失针对融合张量H的梯度; 利用所述梯度数据G确定所述第二局部模型MB中的各个待定参数分别对应的各个梯 度, 从而利用各个梯度更新所述第二局部模型MB中的各个待定参数。 9.如权利要求8所述的方法, 其中, 所述乱序算法S为针对当前更新周期生成的乱序矩 阵, 该乱序矩阵用于对不同训练样本的数据排列顺序进行扰乱。 10.如权利要求8所述的方法, 其中, 所述叠加融合方式为加和、 求均值、 加权平均中的 一项。 11.如权利要求8所述的方法, 其中, 所述方法还包括, 通过以下方式为第 一方确定所述 乱序标签Ys' : 从第一方接收通过所述第一密钥Pk对n条训练样本对应的n条标签数据进行加密得到权 利 要 求 书 2/4 页 3 CN 115358387 A 3

PDF文档 专利 联合更新模型的方法及装置

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 联合更新模型的方法及装置 第 1 页 专利 联合更新模型的方法及装置 第 2 页 专利 联合更新模型的方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:27:07上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。