全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210968021.7 (22)申请日 2022.08.12 (71)申请人 中国工商银行股份有限公司 地址 100140 北京市西城区复兴门内大街 55号 (72)发明人 闫宇  (74)专利代理 机构 北京同立钧成知识产权代理 有限公司 1 1205 专利代理师 刘慧 臧建明 (51)Int.Cl. G06F 16/22(2019.01) G06F 16/2458(2019.01) G06Q 10/10(2012.01) G06Q 40/02(2012.01) (54)发明名称 数据处理方法、 装置、 设备、 存 储介质及产品 (57)摘要 本申请提供一种数据处理方法、 装置、 设备、 存储介质及产品。 该方法包括: 获取数据湖系统 中与数据表基础信息对应的待识别数据表, 所述 数据表基础信息从元数据管 理系统获取, 所述待 识别数据表包括多个归属区域的数据, 所述数据 湖系统包括多个数据源系统对应的待识别数据 表; 对待识别数据表进行识别, 获得包含各归属 区域的数据总量的数据识别结果; 将所述数据 识 别结果发送至所述数据湖系统, 以供所述数据湖 系统将所述数据识别结果发送至对应的终端。 本 申请的方法, 能够对数据进行自动识别并汇总, 无需用户人工处理数据, 有效地提高效率, 而且 用户更加直观地通过数据识别结果了解不同归 属区域的业 务开展情况。 权利要求书2页 说明书10页 附图4页 CN 115237925 A 2022.10.25 CN 115237925 A 1.一种数据处 理方法, 其特 征在于, 所述方法包括: 获取数据湖系统中与 数据表基础信 息对应的待识别数据表, 所述数据表基础信 息从元 数据管理系统获取, 所述待识别数据表包括多个归属区域的数据, 所述数据湖系统包括多 个数据源系统对应的待识别数据表; 对待识别数据表进行识别, 获得包 含各归属区域的数据总量的数据识别结果; 将所述数据识别结果发送至所述数据湖系统, 以供所述数据湖系统将所述数据识别结 果发送至对应的终端。 2.根据权利要求1所述的方法, 其特 征在于, 所述数据表基础信息包括: 预设归属字段; 所述对待识别数据表进行识别, 获得包含各归属区域的数据总量的数据识别结果, 包 括: 识别所述待识别数据表中与预设归属字段匹配的归属字段; 对匹配的归属字段中同一归属字段的数据进行汇总, 得到同一归属字段的全部数据; 计算同一归属字段的全部数据的数据总量, 获得各归属字段的数据总量, 生成包含各 归属字段的数据总量的数据识别结果。 3.根据权利要求2所述的方法, 其特征在于, 所述生成包含各归属字段的数据总量的数 据识别结果, 包括: 获取预设的归属区域及归属字段的映射关系; 分别将各归属字段与所述映射关系中的归属字段进行匹配; 获取匹配的归属字段对应的归属区域, 生成包含各归属字段及归属区域的数据总量的 数据识别结果。 4.根据权利要求1所述的方法, 其特征在于, 所述获取数据湖系统中与 数据表基础信 息 对应的待识别数据表, 包括: 确定是否满足数据表对应的预设处 理条件; 若是, 则获取满足预设处理条件的数据表的数据表基础信息, 从数据湖系统中获取与 数据表基础信息对应的待识别数据表。 5.根据权利要求4所述的方法, 其特征在于, 所述确定是否满足数据表对应的预设处理 条件, 包括: 获取数据库中各 数据表对应的预设处 理时间; 若当前时间为任一数据表对应的预设处理时间, 则确定满足数据表对应的预设处理条 件; 若当前时间不为任一数据表对应的预设处理时间, 则确定不满足数据表对应的预设处 理条件。 6.根据权利要求1所述的方法, 其特征在于, 所述获取数据湖系统中与 数据表基础信 息 对应的待识别数据表, 包括: 根据数据表基础信息确定所述数据表基础信息对应的数据表是否为待识别数据表; 若是, 则从数据湖系统中获取与数据表基础信息对应的待识别数据表。 7.根据权利要求6所述的方法, 其特征在于, 所述根据数据表基础信 息确定所述数据表 基础信息对应的数据表是否为待识别数据表, 包括: 从所述元数据 管理系统中获取数据表基础信 息对应的登记信 息, 并根据 所述登记信 息权 利 要 求 书 1/2 页 2 CN 115237925 A 2确定数据表基础信息对应的数据是否为入湖数据; 若是, 则根据所述登记信息确定所述数据表的归属区域是否为预设归属区域; 若是, 则确定数据表基础信息对应的数据表为待识别数据表; 若否, 则确定数据表基础信息对应的数据表不 为待识别数据表。 8.根据权利要求1至7任一项所述的方法, 其特征在于, 所述对待识别数据表进行识别 之前, 还包括: 确定待识别数据表中的数据是否加载完成; 若是, 则执 行所述对待识别数据表进行识别的步骤。 9.一种数据处 理装置, 其特 征在于, 所述装置包括: 获取单元, 用于获取数据湖系统中与数据表基础信息对应的待识别数据表, 所述数据 表基础信息从元数据管理系统获取, 所述待识别数据表包括多个归属区域的数据, 所述数 据湖系统包括多个数据源系统对应的待识别数据表; 识别单元, 用于对待识别数据表进行识别, 获得包含各归属区域的数据总量的数据识 别结果; 发送单元, 用于将所述数据识别结果发送至所述数据湖系统, 以供所述数据湖系统将 所述数据识别结果发送至对应的终端。 10.一种电子设备, 包括: 处 理器, 以及与所述处 理器通信连接的存 储器; 所述存储器存储计算机执 行指令; 所述处理器执行所述存储器存储的计算机执行指令, 使得处理器执行如权利要求1至8 任一项所述的方法。 11.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质中存储有计算机 执行指令, 所述计算机执行指 令被处理器执行时用于实现如权利要求 1至8任一项 所述的方 法。 12.一种计算机程序产品, 包括计算机程序, 该计算机程序被处理器执行时实现权利要 求1至8中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115237925 A 3

PDF文档 专利 数据处理方法、装置、设备、存储介质及产品

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据处理方法、装置、设备、存储介质及产品 第 1 页 专利 数据处理方法、装置、设备、存储介质及产品 第 2 页 专利 数据处理方法、装置、设备、存储介质及产品 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:27:03上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。