全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211084821.9 (22)申请日 2022.09.06 (71)申请人 中国银行股份有限公司 地址 100818 北京市西城区复兴门内大街1 号 (72)发明人 刘岳龙 王敏 张文 温启文  张程  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 王洋 (51)Int.Cl. G06F 11/36(2006.01) G06F 16/2455(2019.01) G06F 16/2457(2019.01) G06F 9/445(2018.01)G06Q 40/02(2012.01) (54)发明名称 一种数据裁 剪方法、 装置及设备 (57)摘要 本申请公开了一种数据裁剪方法、 装置及设 备, 可应用于用于人工智 能领域以及金融领域, 获取裁剪目标对应的数据表裁剪规则, 读取所述 数据表裁剪规则生成裁剪作业; 获取作业执行流 程, 根据所述作业执行流程进行数据裁剪, 获取 目标数据。 通过对不同数据表的生产数据进行关 联性, 形成每张数据表及其裁剪索引的对应关 系, 通过读取每张数据表的裁剪索引, 即裁剪规 则, 自动生成每张数据表的裁剪作业, 并通过作 业编排工具, 把目标借用数据裁剪出来。 可灵活 设置所需生成数据规模用于不同场景的测试, 节 省数据传输、 输入导入时间, 减低测试资源的需 求, 提高系统性能和批量执行速度, 可有效缩短 测试周期。 权利要求书2页 说明书10页 附图2页 CN 115328807 A 2022.11.11 CN 115328807 A 1.一种数据裁 剪方法, 其特 征在于, 包括: 获取裁剪目标对应的数据表裁剪规则, 所述数据表裁剪规则用于指示各数据表与裁剪 索引的对应关系; 读取所述数据表裁 剪规则生成裁 剪作业; 获取作业执 行流程, 根据所述作业执 行流程进行数据裁剪, 获取目标 数据。 2.根据权利要求1所述的方法, 其特征在于, 所述获取裁剪目标对应的裁剪规则之前, 还包括: 创建裁剪索引的索引规则, 将所述索引规则分别与业务数据表关联生成数据表裁剪规 则; 所述创建裁 剪索引的索引规则, 包括: 获取客户号裁 剪索引, 所述 客户号裁 剪索引为包括多个需保留客户号的客户号清单; 根据客户号裁剪索引和客户号与账户号关联性、 客户号与借记卡关联性生成索引规 则, 所述索引规则包括客户信息索引规则、 存款账户裁剪索引规则、 贷款账户裁剪索引规则 和借记卡裁 剪索引规则。 3.根据权利要求2所述的方法, 其特征在于, 所述根据客户号裁剪索引和客户号与 账户 号关联性、 客户号与借记卡关联性 生成索引规则包括: 获取提取数据项, 所述提取数据项为账户客户主表的账户号或客户号的类别信息, 所 述账户客户主表包括 客户信息主表、 存款账户主表、 贷款账户主表和借记卡主表; 将各提取数据项分别与所述客户号裁剪索引关联, 分别生成客户信息索引、 存款账户 裁剪索引、 贷款账户裁剪索引和借记卡裁剪索引, 所述客户信息索引优先于存款账户裁剪 索引、 贷款账户裁 剪索引和借记卡裁 剪索引; 将各账户客户主表与各表对应的裁 剪索引关联存 储形成对应的索引规则。 4.根据权利要求3所述的方法, 其特征在于, 所述将所述索引规则分别与业务数据表关 联生成数据表裁 剪规则包括: 获取关联 数据项, 所述关联 数据项为 业务数据表与所述 提取数据项对应的类别 信息; 将各类关联 数据项分别与各类业 务数据表关联, 生成各自对应的业 务裁剪规则。 5.根据权利要求2所述的方法, 其特 征在于, 所述获取客户号裁 剪索引之前, 还 包括: 获取机构号清单, 所述机构号清单为需保留客户所在机构的机构号; 根据所述机构号清单对客户号 集合进行筛 选。 6.根据权利要求1所述的方法, 其特征在于, 所述读取所述裁剪规则生成裁剪作业, 包 括: 获取第一规则, 将获取到的规则作为执行规则, 所述第一规则为所述索引规则或所述 数据表裁 剪规则中的一个; 根据所述执行规则生成公共语句, 获取所述执行规则的数据表名, 根据所述数据表名 生成作业名; 根据所述执 行规则生成提取脚本并写入JCL, 生成裁 剪作业。 7.根据权利要求6所述的方法, 其特 征在于, 所述 生成裁剪作业之后, 还 包括: 响应于当前裁剪目标对应的裁剪规则数量大于1时, 获取第 二规则, 所述第 二规则为所 述裁剪规则中未被获取过的一个, 重复执行所述将获取到的规则作为执行规则直至所述裁权 利 要 求 书 1/2 页 2 CN 115328807 A 2剪规则全部生成对应的裁 剪作业。 8.一种数据裁 剪装置, 其特 征在于, 包括: 数据表裁剪规则获取模块, 用于获取裁剪目标对应的数据表裁剪规则, 所述数据表裁 剪规则用于指示各 数据表与裁 剪索引的对应关系; 裁剪作业生成模块, 用于读取 所述数据表裁 剪规则生成裁 剪作业; 执行流程获取模块, 用于获取作业执行流程, 根据 所述作业执行流程进行数据裁剪, 获 取目标数据。 9.根据权利要求8所述的装置, 其特 征在于, 所述装置还 包括: 索引规则创建模块, 用于创建裁 剪索引的索引规则; 所述索引规则创建模块包括, 客户号裁剪索引获取模块, 用于获取客户号裁剪索引, 所述客户号裁剪索引为包括多 个需保留客户号的客户号清单; 索引规则生成模块, 用于根据客户号裁剪索引和客户号与账户号关联性、 客户号与借 记卡关联性生成索引规则, 所述索引规则包括客户信息索引规则、 存款账户裁剪索引规则、 贷款账户裁 剪索引规则和借记卡裁 剪索引规则。 10.一种计算机设备, 其特 征在于, 包括: 处 理器、 存储器、 系统总线; 所述处理器以及所述存 储器通过 所述系统总线相连; 所述存储器用于存储一个或多个程序, 所述一个或多个程序包括指令, 所述指令当被 所述处理器执行时使所述处 理器执行权利要求1 ‑7任一项所述的数据裁 剪方法。权 利 要 求 书 2/2 页 3 CN 115328807 A 3

PDF文档 专利 一种数据裁剪方法、装置及设备

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种数据裁剪方法、装置及设备 第 1 页 专利 一种数据裁剪方法、装置及设备 第 2 页 专利 一种数据裁剪方法、装置及设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:15:20上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。