全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210295162.7 (22)申请日 2022.03.23 (71)申请人 浙江惠瀜网络科技有限公司 地址 311200 浙江省杭州市萧 山区萧山经 济技术开发区明星路371号1801-1室 (72)发明人 周波 林敏 陈蓓珍 蔡浴泓  沈水良  (74)专利代理 机构 北京知果之信知识产权代理 有限公司 1 1541 专利代理师 高科 (51)Int.Cl. G06F 16/25(2019.01) G06F 16/28(2019.01) G06F 9/445(2018.01) G06F 3/0484(2022.01) (54)发明名称 一种基于kettle的数据抽取转换分析与分 发方法、 装置及存 储介质 (57)摘要 本发明提供了一种基于kettle的数据抽取 转换分析与分发方法、 装置及存储介质, 其中基 于kettle的数据抽取转换分析与分发方法包括 步骤: 通过kettle图形化界面编辑包 括数据流逻 辑的kettle文件; 设置指标管理, 配置指标任务, 指标任务包括任务名称、 任务编码、 任务类型、 执 行方式、 kettle转换执行文件、 状态和/或简介信 息; 配置定时任务, 定时执行指标任务; 根据所执 行的定时任务进行ETL数据抽取, 抽取数据源中 的数据; 根据所执行的定时任务, 获取相应的 kettle文件, 将kettle文件上传至kettle执行引 擎; 动态解析kettle文件并执行指标任务; 将分 析和/或处理后的数据进行数据落库。 通过上述 方法, 能够高效快速地将各项数据归集一个系统 并对其进行统一分析后统一 提供服务。 权利要求书2页 说明书7页 附图6页 CN 114647691 A 2022.06.21 CN 114647691 A 1.一种基于ket tle的数据抽取转换分析与分发方法, 其特 征在于, 包括如下步骤: 通过kettle图形化界面编辑包括数据流逻辑的ket tle文件; 设置指标管理, 配置指标任务, 所述指标任务包括任务名称、 任务编码、 任务类型、 执行 方式、 ket tle转换执行文件、 状态和/或简介信息; 配置定时任务, 定时执 行所述指标任务; 根据所执行的所述定时任务进行ETL数据抽取, 抽取 数据源中的数据; 根据所执行的所述定时任务, 获取相应 的所述kettle文件, 将所述kettle文件上传至 kettle执行引擎; 动态解析 所述kettle文件并执 行所述指标任务; 将分析和/或处 理后的数据进行 数据落库。 2.根据权利 要求1所述的基于kettle的数据抽取转换分析与分发方法, 其特征在于, 在 通过kettle图形化界面编辑包括数据流逻辑的ket tle文件之前, 还 包括步骤: 定义基础数据仓库模型, 包括配置事实表、 维度表、 主题管理、 指标管理和/或数据源管 理。 3.根据权利 要求1所述的基于kettle的数据抽取转换分析与分发方法, 其特征在于, 包 括: 使用kettle转换模式编辑所述kettle文件, 所述kettle转换包括若干步骤, 若干所述 步骤之间通过跳来连接 。 4.根据权利 要求1所述的基于kettle的数据抽取转换分析与分发方法, 其特征在于, 其 中设置指标 管理包括: 增加指标并进行相应的说明, 所述说明包括指标名称、 指标类型、 指标编码计算频率、 所属主题、 状态和/或简介信息 。 5.根据权利 要求1所述的基于kettle的数据抽取转换分析与分发方法, 其特征在于, 其 中配置定时任务包括: 配置相关联系人, 所述相关联系人包括 姓名、 邮箱和/或备注; 配置任务分组、 任务名称、 轮询规则、 备注、 执 行地址和/或告警联系人。 6.根据权利 要求1所述的基于kettle的数据抽取转换分析与分发方法, 其特征在于, 所 述kettle执行引擎包括ODS层、 DWD层、 DWS层、 聚合数据层、 多维分析层、 业务模型层和/或数 据集市层。 7.根据权利 要求1所述的基于kettle的数据抽取转换分析与分发方法, 其特征在于, 所 述数据源 包括系统日志、 埋 点数据、 数据库数据和/或文档数据。 8.一种基于ket tle的数据抽取转换分析与分发装置, 其特 征在于, 包括: 存储器; 以及 与所述存 储器连接的处 理器, 所述处 理器被配置成: 通过kettle图形化界面编辑包括数据流逻辑的ket tle文件; 设置指标管理, 配置指标任务, 所述指标任务包括任务名称、 任务编码、 任务类型、 执行 方式、 ket tle转换执行文件、 状态和/或简介信息; 配置定时任务, 定时执 行所述指标任务; 根据所执行的所述定时任务进行ETL数据抽取, 抽取 数据源中的数据;权 利 要 求 书 1/2 页 2 CN 114647691 A 2根据所执行的所述定时任务, 获取相应 的所述kettle文件, 将所述kettle文件上传至 kettle执行引擎; 动态解析 所述kettle文件并执 行所述指标任务; 将分析和/或处 理后的数据进行 数据落库。 9.一种计算机存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序被机器 执行时实现如权利要求1~7中任一项所述的方法的步骤。权 利 要 求 书 2/2 页 3 CN 114647691 A 3

.PDF文档 专利 一种基于kettle的数据抽取转换分析与分发方法、装置及存储介质

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于kettle的数据抽取转换分析与分发方法、装置及存储介质 第 1 页 专利 一种基于kettle的数据抽取转换分析与分发方法、装置及存储介质 第 2 页 专利 一种基于kettle的数据抽取转换分析与分发方法、装置及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:59:23上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。