全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211147195.3 (22)申请日 2022.09.21 (71)申请人 四川大学华西医院 地址 610044 四川省成 都市武侯区国学巷 37号 申请人 四川省监狱管理局 (72)发明人 张伟 殷继兴 韩鑫 何行知  姚佳 李宏伟 文凤 庭承怡  (74)专利代理 机构 北京超凡宏宇专利代理事务 所(特殊普通 合伙) 11463 专利代理师 贾耀斌 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 10/06(2012.01) G06Q 50/18(2012.01)G16H 10/60(2018.01) G16H 50/30(2018.01) G06K 9/62(2022.01) (54)发明名称 服刑人员住院风险预测方法、 装置、 电子设 备及存储介质 (57)摘要 本申请实施例提供了服刑人员住 院风险预 测方法、 装置、 电子设备及存储介质, 属于 数据处 理技术领域。 通过对数据进行插补预处理和关联 预处理, 得到待预测服刑人员的基础信息样本和 就诊信息样 本, 根据编号表对基础信息样本和就 诊信息样本进行关联, 得到训练样本数据; 基于 随机森林算法训练住院风险预测模 型; 将训练样 本数据输入住院风险预测模型中, 通过住院风险 预测模型计算得到待预测服刑人员的住院风险 数据, 本发 明通过对服刑人员的基础信息和就诊 信息进行相应的处理, 提高了数据完成度, 通过 住院风险预测模型对服刑人员的住院风险进行 预测, 有助于降低监狱的财政支出, 提高监狱的 管理效率。 权利要求书2页 说明书8页 附图2页 CN 115222166 A 2022.10.21 CN 115222166 A 1.一种服刑人员住院风险预测方法, 其特 征在于, 所述方法包括: 获取服刑人员的基础信息、 就诊信息和编号表; 对所述基础信息进行插补预处 理, 得到待预测服刑人员的基础信息样本; 对所述就诊信息进行关联 预处理, 得到待预测服刑人员的就诊信息样本; 根据所述编号表对所述待预测服刑人员的基础信息样本和所述待预测服刑人员的就 诊信息样本进行关联, 得到所述待预测服刑人员的训练样本数据; 基于随机森林算法训练住院风险预测模型; 将所述训练样本数据输入所述住院风险预测模型中, 通过所述住院风险预测模型计算 得到所述待预测服刑人员的住院风险数据。 2.根据权利要求1所述的方法, 其特征在于, 所述对所述基础信息进行插补预处理, 得 到待预测服刑人员的基础信息样本, 包括: 根据所述 服刑人员的基础信息计算基础数据均值; 根据所述基础数据均值对所述服刑人员的基础信息进行插补得到所述待预测服刑人 员的完整基础数据; 剔除所述待预测服刑人员的完整基础数据中存在的异常值, 得到所述待预测服刑人员 的有效基础数据; 对所述待预测服刑人员的有效基础数据进行虚拟变量处理, 得到所述待预测服刑人员 的基础信息样本 。 3.根据权利要求1所述的方法, 其特征在于, 所述对所述就诊信息进行关联预处理, 得 到待预测服刑人员的就诊信息样本, 包括: 获取所述就诊信 息的关键字段和疾病编码表, 根据 所述关键字段关联所述就诊信 息和 所述疾病编码表; 剔除所述 就诊信息中存在的缺失值, 得到所述待预测服刑人员的有效就诊信息; 对所述待预测服刑人员的有效就诊信 息进行虚拟变量处理, 得到所述待预测服刑人员 的就诊信息样本 。 4.根据权利要求1所述的方法, 其特征在于, 所述通过所述住院风险预测模型计算得到 所述服刑人员的住院风险数据, 包括: 获取所述住院风险预测模型中的各叶节点的预测数值; 判断所述各叶节点的预测数值是否大于或等于预设住院阈值; 统计所述各叶节点中预测数值大于或等于预设住院阈值的目标叶节点的数量; 根据所述目标叶节点的数量与所述住院风险预测模型中的叶节点总数的比率确定所 述待预测服刑人员的住院风险数据。 5.根据权利要求1所述的方法, 其特征在于, 所述基于随机森林算法训练住院风险预测 模型, 包括: 根据所述训练样本数据建立数据集; 计算所述数据集的基尼不纯度; 基于所述基尼不纯度判断所述数据集的有序程度; 计算所述数据集的分叉深度; 在所述分叉深度达到预设参数后停止对所述数据集分叉, 得到所述住院风险预测模权 利 要 求 书 1/2 页 2 CN 115222166 A 2型。 6.根据权利要求5所述的方法, 其特征在于, 所述根据所述训练样本数据建立数据集, 包括: 基于自助法从所述训练样本数据中抽取n个数据样本; 设置每个所述数据样本的特征数为M, 指定一个小于M的常数m, 随机从M个特征中选取m 个特征, 得到样本数为 N、 特征数为m的数据集。 7.根据权利要求5所述的方法, 其特 征在于, 所述计算所述数据集的基尼不纯度, 包括: 根据以下公式计算所述基尼不纯度: ; 其中, C为数据集中的分类数, p(i)为数据点是第i个分类的概 率。 8.一种服刑人员住院风险预测装置, 其特征在于, 所述服刑人员住院风险预测装置包 括: 获取模块, 用于获取服刑人员的基础信息、 就诊信息和编号表; 处理模块, 用于对所述基础信息进行插补预处理, 得到待预测服刑人员的基础信息样 本; 对所述 就诊信息进行关联 预处理, 得到待预测服刑人员的就诊信息样本; 关联模块, 用于根据 所述编号表对所述待预测服刑人员的基础信 息样本和所述待预测 服刑人员的就诊信息样本进行关联, 得到所述待预测服刑人员的训练样本数据; 训练模块, 用于基于随机森林算法训练住院风险预测模型; 预测模块, 用于将所述训练样本数据输入所述住院风险预测模型中, 通过所述住院风 险预测模型计算得到所述待预测服刑人员的住院风险数据。 9.一种电子设备, 其特征在于, 包括存储器以及处理器, 所述存储器存储有计算机程 序, 所述计算机程序在所述处理器运行时执行权利要求 1至7中任一项 所述的服刑人员住院 风险预测方法。 10.一种计算机可读存储介质, 其特征在于, 其存储有计算机程序, 所述计算机程序在 处理器上运行时执 行权利要求1至7中任一项所述的服刑人员住院风险预测方法。权 利 要 求 书 2/2 页 3 CN 115222166 A 3

PDF文档 专利 服刑人员住院风险预测方法、装置、电子设备及存储介质

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 服刑人员住院风险预测方法、装置、电子设备及存储介质 第 1 页 专利 服刑人员住院风险预测方法、装置、电子设备及存储介质 第 2 页 专利 服刑人员住院风险预测方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:26:17上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。