全网唯一标准王
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202211068228.5 (22)申请日 2022.09.02 (65)同一申请的已公布的文献号 申请公布号 CN 115131139 A (43)申请公布日 2022.09.30 (73)专利权人 创新奇智 (南京) 科技有限公司 地址 211000 江苏省南京市江宁经济技 术 开发区兴智路6号兴智科技园B栋第19 层 (72)发明人 周伟 盖晨阳 林以明 周鹏程  (74)专利代理 机构 北京超凡宏宇专利代理事务 所(特殊普通 合伙) 11463 专利代理师 吕爱霞 (51)Int.Cl. G06Q 40/02(2012.01)G06F 16/22(2019.01) G06F 16/25(2019.01) 审查员 王生旺 (54)发明名称 一种基于结构数据获取目标结果的方法、 装 置、 介质 (57)摘要 本申请实施例提供一种基于结构数据获取 目标结果的方法、 装置、 介质及电子设备, 所述方 法包括: 根据待分析数据得到目标输入特征, 其 中, 所述待分析数据是采用表格存储的结构化数 据, 所述目标输入特征是通过构建的算子对所述 表格进行数据处理自动生 成的特征, 所述数据处 理包括聚合处理和转换处理中的至少一种, 所述 表格用于记录目标企业在经营过程中记录的数 据; 将所述目标输入特征输入目标机器模型, 得 到针对目标参量的目标结果, 其中, 所述目标参 量用于表征与所述目标 企业相关的履约信息。 本 申请实施例的目的在于提供, 通过本申请的一些 实施对特征工程的过程进行了流程优化、 实现了 自动化提取特征。 权利要求书2页 说明书8页 附图3页 CN 115131139 B 2022.11.22 CN 115131139 B 1.一种基于结构数据获取目标 结果的方法, 其特 征在于, 所述方法包括: 根据待分析数据得到目标输入特征, 其中, 所述待分析数据是采用表格存储的结构化 数据, 所述 目标输入特征是通过构建的算子对所述表格进行数据 处理自动生成的特征, 所 述数据处理包括聚合处理和转换处理中的至少一种, 所述表格用于记录目标企业在经营过 程中记录的数据; 将所述目标输入特征输入目标机器模型, 得到针对目标参量的目标结果, 其中, 所述目 标参量用于表征与所述目标企业相关的履约信息; 其中, 所述 根据待分析 数据得到目标输入特 征, 包括: 从多张表格 中得到一张主表, 并获取与所述主表对应的父表和多张子表, 其中, 所述主 表用于存 储和所述目标参 量对应级别的数据; 将多个算子与 所述主表、 所述父表和所述多 张子表中的各张表进行匹配得到初始匹配 结果, 其中, 所述子表和聚合类算子匹配, 所述主表和转换类算子匹配, 所述父表的特征直 接引用; 将所述初始匹配结果中包括的所有算子的参数与对应表的目标字段匹配, 得到目标匹 配结果, 并根据所述目标匹配结果得到初始输入特 征; 对所述初始输入特 征进行处 理得到所述目标输入特 征。 2.如权利要求1所述的方法, 其特征在于, 所述聚合类算子包括: 求和、 求最小值或者求 最大值。 3.如权利要求1所述的方法, 其特征在于, 所述根据待分析数据得到目标输入特征, 包 括: 从历史目标输入特 征中选择至少部分可作为所述目标输入特 征。 4.如权利要求1所述的方法, 其特征在于, 所述对所述初始输入特征进行处理得到所述 目标输入特征, 包括: 根据缺失值、 异常值、 协变量相关性对所述初始输入特征进行筛选得 到所述目标输入特 征。 5.如权利要求1所述的方法, 其特征在于, 所述算子是对有 效指标的加工方式进行抽象 得到的, 所述有效指标是指与所述表格的各字段对应的字段名称, 所述加工方式用于表征 对相应表格的多个字段对应的数据之间可 执行的计算方式。 6.如权利要求1所述的方法, 其特征在于, 所述目标结果包括特征解析表以及特征溯源 图, 其中, 所述特征解析表中的任一特征定义包含生成所述任一特征所需的表名、 对应的字 段名以及特征含义的文字描述, 所述特征溯源图表征生成所述任一特征每次聚合用到的目 标算子以及列名。 7.一种基于结构数据获取目标 结果的装置, 其特 征在于, 所述装置包括: 输入特征获取模块, 被配置为根据待分析数据 得到目标输入特征, 其中, 所述待分析数 据是采用表格存储的结构化数据, 所述目标输入特征是通过构建的算子对 所述表格进 行数 据处理自动生成的特征, 所述数据 处理包括聚合处理和转换处理中的至少一种, 所述表格 用于记录目标企业在经 营过程中记录的数据; 目标结果预测模块, 被配置为将所述目标输入特征输入目标机器模型, 得到针对目标 参量的目标 结果, 其中, 所述目标参 量用于表征与所述目标企业相关的履约信息; 其中,权 利 要 求 书 1/2 页 2 CN 115131139 B 2所述输入特征获取模块还被配置为: 从多张表格中得到一张主表, 并获取与所述主表 对应的父表和多张子表, 其中, 所述主表用于存储和所述目标参量对应级别的数据; 将多个 算子与所述主表、 所述父表和所述多张子表中的各张表进行匹配得到初始匹配结果, 其中, 所述子表和聚合类算子匹配, 所述主表和转换类算子匹配, 所述父表的特征直接引用; 将所 述初始匹配结果中包括的所有算子的参数与对应表的目标字段匹配, 得到目标匹配结果, 并根据所述目标匹配结果得到初始输入特征; 对所述初始输入特征进 行处理得到所述目标 输入特征。 8.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述程序被处理器 执行时可实现权利要求1 ‑6中任意一项权利要求所述的方法。 9.一种电子设备, 包括存储器、 处理器以及存储在所述存储器上并可在所述处理器上 运行的计算机程序, 其中, 所述处理器执行所述程序时可实现权利要求 1‑6中任意一项权利 要求所述的方法。权 利 要 求 书 2/2 页 3 CN 115131139 B 3

PDF文档 专利 一种基于结构数据获取目标结果的方法、装置、介质

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于结构数据获取目标结果的方法、装置、介质 第 1 页 专利 一种基于结构数据获取目标结果的方法、装置、介质 第 2 页 专利 一种基于结构数据获取目标结果的方法、装置、介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:15:36上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。