全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210390877.0 (22)申请日 2022.04.14 (71)申请人 西安交通大 学 地址 710048 陕西省西安市碑林区咸宁西 路28号 (72)发明人 谢光武  (74)专利代理 机构 西安睿通知识产权代理事务 所(特殊普通 合伙) 61218 专利代理师 惠文轩 (51)Int.Cl. G06N 20/20(2019.01) G06F 21/64(2013.01) G06F 21/62(2013.01) G06F 21/60(2013.01) G16H 10/60(2018.01)H04L 67/1097(2022.01) (54)发明名称 一种基于区块链医疗数据共享的联邦学习 方法 (57)摘要 本发明涉及数据安全 领域, 具体涉及一种基 于区块链医疗 数据共享的联邦 学习方法。 本发明 基于区块链特性及隐私保护手段, 完成对医疗数 据共享的同时对 联邦学习进行隐私保护, 避免联 邦学习中的医疗数据泄 露问题。 权利要求书1页 说明书4页 附图2页 CN 114912631 A 2022.08.16 CN 114912631 A 1.一种基于区块链医疗数据共享的联邦学习方法, 其特 征在于, 包括以下步骤: 步骤1, 建立区块链网络; 步骤2, 模型所有者将机器学习模型上传到区块链网络的星际文件系统IPFS, 并通过设 置区块链网络中合约层的多个智能合约组成的Orc hestrator对联邦学习流 程进行规划; 步骤3, 数据所有者从区块链网络的星际文件系 统IPFS中获取加密的自己的数据和断 点, 再对加密数据进行解密; 步骤4, 数据所有者使用解密后的数据, 根据Orchestrator规划联邦学习流程对机器学 习模型进行训练, 获得机器学习模型的训练梯度; 步骤5, 数据所有者对获得的训练梯度加上 噪声实现差分隐私, 再将训练梯度发送给安 全聚合器; 步骤6, 区块链网络的分布式不可篡改账本记录机器学习过程中的训练事件; 安全聚合 器为训练记录生成一个nonce并发送给参与训练的医疗机构, 在区块链上记录下该条训练 记录的哈希值hash(K,n once); 步骤7, 安全聚合器对数据 所有者传输的训练梯度进行加密, 并将全部数据所有者传输 的训练梯度进行汇集, 对机器学习模型进行 更新。 2.根据权利要求1所述的基于区块链医疗数据共享的联邦学习方法, 其特征在于, 步骤 1, 具体的, 使用FISCO  BCOS区块链底层平台搭建区块链网络, 以数据拥有者作为区块链网 络节点; 设置星际文件系统IPFS(Inter ‑Planetary  File System)对医疗数据进行链下储 存。 3.根据权利要求1所述的基于区块链医疗数据共享的联邦学习方法, 其特征在于, 步骤 5中的差分隐私, 具体的, 对于一个随机化 算法M, 假如满足下式: Pr[M(x)∈s ]≤eεPr[M(y)∈s ]+δ 且对于所有的 都成立, 那么称这个算法M满足( ε, δ )差分隐私; 其中ε是单 次查询对于隐私预算的消耗; 当外界观测者在从某个数据集中获取结果时, 无法得知某个个体是否被用到, 那么说 明该数据集满足差分隐私。 4.根据权利要求1所述的基于区块链医疗数据共享的联邦学习方法, 其特征在于, 步骤 6中hash(K,nonce)的K, 具体的, 区块链网络设置两个公开的参数, 素数q和它的原根a; 设某 次训练中某个数据拥有者和安全聚合器的私钥分别为pri1,pri2, 双方计算并公开: 则得到 5.根据权利要求1所述的基于区块链医疗数据共享的联邦学习方法, 其特征在于, 步骤 7中安全聚合器对数据所有者传输的训练梯度进行加密, 具体的, 加密方式为工作者选择 worker selection, 即令安全聚合器只随机选择收集到的梯度的一部分来生成输出, 而医 疗机构无从得知自己上传的梯度是否被选中。权 利 要 求 书 1/1 页 2 CN 114912631 A 2一种基于区块链医疗数据 共享的联邦学习方 法 技术领域 [0001]本发明涉及数据安全领域, 具体涉及一种基于区块链医疗数据共享的联邦学习方 法。 背景技术 [0002]近年来的医疗改革中加强了医疗机构的信息化建设, 但在医疗数据互通互认、 数 据的安全性、 透明度和隐私保护等方面 仍存在许多问题与挑战。 [0003]近年来人工智能在医疗领域发展迅速, 在一部分场景下可以起到辅助诊断的作 用。 为了提高机器学习模型的准确度, 需要大量的数据, 所以常常需要跨组织间的数据共 享。 [0004]联邦学习通过(模型所有者)将机器学习模型分发到各个节点(数据所有者)来完 成计算, 而非把各个数据所有者的数据集中起来。 它的分类表现与本地训练相当, 并且由于 包含了更多的数据, 所以拥有了更好的通用性与泛化能力。 然而联邦学习本身不具备隐私 保护能力。 有研究表明, 逆向攻击可以从模型权重和梯度更新中, 重 建具有很高还原性的图 片。 为了在这个过程中保护病 人的隐私, 需要技术手段以同时兼顾数据的隐私性和数据的 有效性。 [0005]区块链能够基于密码学而非信任的形式, 通过去中心化方式整体参与维护一个可 靠数据库。 区块链技 术的兴起 为医疗行业的数据共享 提供了新思路。 发明内容 [0006]针对现有技术中存在的问题, 本发明的目的在于提供一种基于区块链医疗数据共 享的联邦学习方法, 基于区块链特性及隐私保护手段, 完成对医疗数据共享的同时对联邦 学习进行隐私保护, 避免联邦学习中的医疗数据泄 露问题。 [0007]为了达到上述目的, 本发明采用以下技 术方案予以实现。 [0008]一种基于区块链医疗数据共享的联邦学习方法, 包括以下步骤: [0009]步骤1, 建立区块链网络; [0010]步骤2, 模型所有者将机器学习模型上传到区块链网络的星际文件系统IPFS, 并通 过设置区块链网络中合约层的多个智能合约组成的Orchestr ator对联邦学习 流程进行规 划; [0011]步骤3, 数据所有者从区块链网络的星际文件系统IPFS中获取加密的自己的数据 和断点, 再对加密数据进行解密; [0012]步骤4, 数据所有者使用解密后的数据, 根据Orchestrator规划联邦学习流程对机 器学习模型进行训练, 获得机器学习模型的训练梯度; [0013]步骤5, 数据所有者对获得的训练梯度加上噪声实现差分隐私, 再将训练梯度发送 给安全聚合器; [0014]步骤6, 区块链网络的分布式不可篡改账本记录机器学习过程中的训练事件; 安全说 明 书 1/4 页 3 CN 114912631 A 3

PDF文档 专利 一种基于区块链医疗数据共享的联邦学习方法

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于区块链医疗数据共享的联邦学习方法 第 1 页 专利 一种基于区块链医疗数据共享的联邦学习方法 第 2 页 专利 一种基于区块链医疗数据共享的联邦学习方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-07 12:39:38上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。