全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211152021.6 (22)申请日 2022.09.21 (71)申请人 中国农业银行股份有限公司 地址 100005 北京市东城区建国门内大街 69号 (72)发明人 谢波 周成阳 蒋洪伟 严欢  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 杨傥月 (51)Int.Cl. G06K 9/62(2022.01) G06Q 10/06(2012.01) (54)发明名称 一种合同违约风险预测模型的训练方法和 相关装置 (57)摘要 本申请公开了一种合同违约风险预测模型 的训练方法和相关装置, 获取训练集, 该训练集 包括至少一条有标签的第一样本数据和至少一 条无标签的第二样本数据。 基于第一样本数据, 通过有监督学习的方式训练得到初始合同违约 风险预测模 型, 并将第二样本数据输入至初始合 同违约风险预测模型中, 得到第二样本数据的伪 标签, 基于具有伪标签的第二样 本数据和第一样 本数据, 通过半监督学习的方式训练得到合同违 约风险预测模 型, 以便基于合同违约风险预测模 型预测合同数据的违约风险。 由此, 通过给无标 签的第二样 本数据附上伪标签, 从而避免了人工 标记, 不仅可以快速得到合同违约风险预测模 型, 还能够降低人工打标的成本 。 权利要求书2页 说明书12页 附图1页 CN 115409127 A 2022.11.29 CN 115409127 A 1.一种合同违约风险预测模型的训练方法, 其特 征在于, 所述方法包括: 获取训练集, 所述训练集包括至少一条有标签的第 一样本数据和至少一条无标签的第 二样本数据, 标签用于标识所述第一样本数据是否具有违约风险; 基于所述第一样本数据, 通过有监督学习的方式训练得到初始合同违约风险预测模 型; 将所述第二样本数据输入至所述初始合同违约 风险预测模型中, 得到所述第 二样本数 据的伪标签; 基于具有所述伪标签的第 二样本数据和所述第 一样本数据, 通过半监督学习的方式训 练得到合同违约风险预测模型, 其中, 在通过所述半监督学习的方式训练的过程中调整所 述伪标签, 所述 合同违约风险预测模型用于预测合同数据的违约风险。 2.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 获取具有违约风险的合同数据的多个合同要素, 所述多个合同要素包括合同名称、 合 同文本、 合同业 务类型、 发文 文号、 发文日期、 制定 机构、 失效性和适用产品中的多种组合。 从所述多个合同要素中筛选出关键合同要素, 所述关键合同要素与 所述合同数据的违 约率间的相关性超过 预设阈值; 基于所述关键合同要素确定样本数据, 所述样本数据包括第 一样本数据和所述第 二样 本数据。 3.根据权利要求1所述的方法, 其特征在于, 所述基于具有所述伪标签的第 二样本数据 和所述第一样本数据, 通过半监 督学习的方式训练得到合同违约风险预测模型, 包括: 确定具有约束的损 失函数, 所述约束包括用于降低复杂度的第一约束、 用于防止陷入 局部最优的第二约束和用于成对约束监 督的第三约束中的一个或多个组合; 基于具有所述伪标签的第 二样本数据和所述第 一样本数据, 通过半监督学习的方式训 练使得所述具有约束的损失损失函数最小, 得到所述 合同违约风险预测模型。 4.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 获取测试集, 所述测试集包括至少一条有标签的第三样本数据; 所述基于具有所述伪标签的第 二样本数据和所述第 一样本数据, 通过半监督学习的方 式训练得到合同违约风险预测模型, 包括: 基于具有所述伪标签的第二样本数据、 所述第一样本数据和所述测试集, 通过半监督 学习的方式训练得到合同违约风险预测模型。 5.根据权利要求 4所述的方法, 其特 征在于, 所述方法还 包括: 获取通过多个集合分别训练得到的多个待选的合同违约 风险预测模型, 所述集合为不 同的测试集和训练集的组合; 通过广义交互验证的方式从所述多个待选的合同违约风险预测模型中确定合同违约 风险预测模型。 6.根据权利要求1 ‑5任意一项所述的方法, 其特 征在于, 所述方法还 包括: 获取待预测的合同数据; 将所述待预测的合同数据输入至所述合同违约 风险预测模型中, 得到所述待预测的合 同数据对应的违约率。 7.一种合同违约风险预测模型的训练装置, 其特征在于, 所述装置包括: 获取单元、 有权 利 要 求 书 1/2 页 2 CN 115409127 A 2监督训练单 元、 第一预测单 元和半监 督训练单 元; 所述获取单元, 用于获取训练集, 所述训练集包括至少一条有标签的第一样本数据和 至少一条 无标签的第二样本数据, 标签用于标识所述第一样本数据是否具有违约风险; 所述有监督训练单元, 用于基于所述第一样本数据, 通过有监督学习的方式训练得到 初始合同违约风险预测模型; 所述第一预测单元, 用于将所述第 二样本数据输入至所述初始合同违约 风险预测模型 中, 得到所述第二样本数据的伪标签; 所述半监督训练单元, 用于基于具有所述伪标签的第二样本数据和所述第一样本数 据, 通过半监督学习的方式训练得到合同违约风险预测模型, 其中, 在通过所述半监督学习 的方式训练的过程中调整 所述伪标签, 所述合同违约风险预测模型用于预测合同数据的违 约风险。 8.一种计算机设备, 其特 征在于, 所述设备包括处 理器以及存 储器: 所述存储器用于存 储程序代码, 并将所述 程序代码传输给 所述处理器; 所述处理器用于根据所述 程序代码中的指令执 行权利要求1 ‑6任意一项所述的方法。 9.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质用于存储计算机 程序, 所述计算机程序用于执 行权利要求1 ‑6任意一项所述的方法。 10.一种计算机程序产品, 其特征在于, 包括计算机程序或指令; 当所述计算机程序或 指令被处 理器执行时, 执行权利要求1 ‑6任意一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115409127 A 3

PDF文档 专利 一种合同违约风险预测模型的训练方法和相关装置

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种合同违约风险预测模型的训练方法和相关装置 第 1 页 专利 一种合同违约风险预测模型的训练方法和相关装置 第 2 页 专利 一种合同违约风险预测模型的训练方法和相关装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:26:16上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。