全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210886072.5 (22)申请日 2022.07.26 (71)申请人 上海孚厘科技有限公司 地址 201900 上海市宝山区石太路439号2 幢502A室 (72)发明人 李潇 岳帅 吴艳  (74)专利代理 机构 深圳市世纪恒程知识产权代 理事务所 4 4287 专利代理师 丁志新 (51)Int.Cl. G06K 9/62(2022.01) G06Q 40/02(2012.01) (54)发明名称 基于风控模型的样本生成方法、 装置、 设备 及存储介质 (57)摘要 本发明属于信贷风控技术领域, 公开了一种 基于风控模型的样本生成方法、 装置、 设备及存 储介质。 该方法包括: 根据当前样本数据, 得到当 前期望数据; 根据当前期望数据, 得到当前高斯 参数数据, 根据当前高斯参数数据, 确定目标高 斯参数数据; 获取评估数据与高斯混合成分数量 之间的对应关系, 根据对应关系, 确定目标高斯 混合成分数量; 根据目标高斯参数数据及目标高 斯混合成分数量, 确定目标高斯混合分布, 根据 目标高斯混合分布, 生成目标样本数据; 根据当 前样本数据及目标样本数据进行风控模型训练, 通过训练得到的风控模型进行用户检测。 通过上 述方式, 避免了筛选样本导致的数据偏差, 解决 了幸存者偏差问题, 提高了风控模型的泛化能 力。 权利要求书2页 说明书11页 附图7页 CN 115310524 A 2022.11.08 CN 115310524 A 1.一种基于风控模型的样本生成方法, 其特征在于, 所述基于风控模型的样本生成方 法包括: 根据当前样本数据, 得到当前期望数据; 根据所述当前期望数据, 得到当前高斯参数数据, 根据所述当前高斯参数数据, 确定目 标高斯参数数据; 获取评估数据与高斯混合成分数量之间的对应关系, 根据所述对应关系, 确定目标高 斯混合成分数量; 根据所述目标高斯参数数据及目标高斯混合成分数量, 确定当前样本数据的目标高斯 混合分布, 根据所述目标高斯混合分布, 生成目标样本数据; 根据所述当前样本数据及目标样本数据进行风控模型训练, 并根据训练得到的风控模 型进行用户检测。 2.如权利要求1所述的方法, 其特征在于, 所述根据当前样本数据, 得到当前期望数据, 包括: 根据当前样本数据, 得到初始均值数据与初始标准差数据; 根据所述初始均值数据与初始标准差数据, 得到初始高斯 参数数据; 获取期望数据与初始高斯 参数数据之间的对应关系; 根据所述初始高斯参数数据以及期望数据与初始高斯参数数据之间的对应关系, 得到 当前期望数据。 3.如权利要求2所述的方法, 其特征在于, 所述根据所述当前期望数据, 得到当前高斯 参数数据, 根据所述当前高斯 参数数据, 确定目标高斯 参数数据, 包括: 获取当前期望数据与高斯 参数数据之间的对应关系; 根据所述当前期望数据以及当前期望数据与高斯参数数据之间的对应关系, 得到当前 高斯参数数据; 在所述当前高斯参数数据满足预设收敛条件时, 根据所述当前高斯参数数据, 确定目 标高斯参数数据, 所述 目标高斯参数数据包括 目标均值数据、 目标标准差数据及目标权重 数据。 4.如权利要求3所述的方法, 其特征在于, 所述根据 所述当前期望数据以及 当前期望数 据与高斯 参数数据之间的对应关系, 得到当前高斯 参数数据之后, 还 包括: 在所述当前高斯参数数据不满足预设收敛条件时, 根据所述当前高斯参数数据, 更新 所述初始高斯 参数数据; 返回执行根据 所述初始高斯参数数据及期望数据与初始高斯参数数据之间的关系, 得 到当前期望数据的步骤。 5.如权利要求1所述的方法, 其特征在于, 所述获取评估数据与高斯混合成分数量之间 的对应关系, 根据所述对应关系, 确定目标高斯混合成分数量, 包括: 获取当前似然函数; 获取似然函数、 高斯混合成分数量与评估数据之间的对应关系; 根据所述当前似然函数以及似然函数、 高斯混合成分数量与评估数据之间的对应关 系, 得到评估数据与高斯混合成分数量之间的对应关系; 在当前评估数据满足预设数据 条件时, 根据当前评估数据以及评估数据与高斯混合成权 利 要 求 书 1/2 页 2 CN 115310524 A 2分数量之间的对应关系, 确定目标高斯混合成分数量。 6.如权利要求5所述的方法, 其特 征在于, 所述获取当前似然函数, 包括: 获取高斯 参数数据、 高斯混合成分数量与高斯混合分布之间的对应关系; 根据所述目标高斯参数数据以及高斯参数数据、 高斯混合成分数量与高斯分布之间的 对应关系, 确定初始高斯混合分布; 根据所述初始高斯混合分布, 得到当前似然函数。 7.如权利要求1至6中任一项所述的方法, 其特征在于, 所述根据所述目标高斯参数数 据及目标高斯混合成分数量, 确定当前样本数据的目标高斯混合分布, 根据所述 目标高斯 混合分布, 生成目标样本数据, 包括: 根据目标参数数据、 目标高斯混合成分数量以及高斯参数数据、 高斯混合成分数量与 高斯混合分布之间的对应关系, 确定当前样本数据的目标高斯混合分布; 获取预设样本数据数量; 根据所述目标高斯混合分布及预设样本数据数量, 生成目标样本数据。 8.一种基于风控模型的样本生成装置, 其特征在于, 所述基于风控模型的样本生成装 置包括: 获取模块, 用于根据当前样本数据, 得到当前期望数据; 所述获取模块, 还用于根据 所述当前期望数据, 得到当前高斯参数数据, 根据所述当前 高斯参数数据, 确定目标高斯 参数数据; 所述获取模块, 还用于获取评估数据与高斯混合成分数量之间的对应关系, 根据所述 对应关系, 确定目标高斯混合成分数量; 生成模块, 用于根据所述目标高斯参数数据及目标高斯混合成分数量, 确定当前样本 数据的目标高斯混合分布, 根据所述目标高斯混合分布, 生成目标样本数据; 训练模块, 用于根据所述当前样本数据及目标样本数据进行风控模型训练, 并根据训 练得到的风控 模型进行用户检测。 9.一种基于风控模型的样本生成设备, 其特征在于, 所述设备包括: 存储器、 处理器及 存储在所述存储器上并可在所述处理器上运行的基于风控模型的样本生成程序, 所述基于 风控模型 的样本生成程序配置为实现如权利要求1至7中任一项所述的基于风控模型 的样 本生成方法的步骤。 10.一种存储介质, 其特征在于, 所述存储介质上存储有基于风控模型的样本生成程 序, 所述基于风控模 型的样本生成程序被处理器执行时实现如权利要求 1至7任一项 所述的 基于风控 模型的样本生成方法的步骤。权 利 要 求 书 2/2 页 3 CN 115310524 A 3

PDF文档 专利 基于风控模型的样本生成方法、装置、设备及存储介质

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于风控模型的样本生成方法、装置、设备及存储介质 第 1 页 专利 基于风控模型的样本生成方法、装置、设备及存储介质 第 2 页 专利 基于风控模型的样本生成方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:16:04上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。