全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210782369.7 (22)申请日 2022.07.05 (71)申请人 浪潮软件集团有限公司 地址 250100 山东省济南市高新区科航路 2877号 (72)发明人 徐扬 鲍之骁 田祥雨  (74)专利代理 机构 济南信达专利事务所有限公 司 37100 专利代理师 潘悦梅 (51)Int.Cl. G06F 16/27(2019.01) G06F 16/25(2019.01) G06F 16/2455(2019.01) G06F 16/242(2019.01) (54)发明名称 分布式数据库的数据导出整合方法及系统 (57)摘要 本发明公开了分布式数据库的数据导出整 合方法及系统, 属于数据迁移技术领域, 要解决 的技术问题为如何高效的实现分布式数据库的 数据导出和整合, 并保证数据的完整性。 包括如 下步骤: 向SQL引擎输入SQL语句, 指定有导出对 象和存储位置; 对SQL语句进行解析得到语法树, 基于语法树和导出整合请求创建导出计划, 并将 所述导出计划分发至分布式数据库集群的所有 节点, 所述导出计划包括导出数据的数据类型、 导出数据的存储位置、 导出对象列表以及导出的 数据是否需要整合; 分布式数据库集群中各节点 接收到导出计划后, 基于导出计划进行设置, 并 执行导出操作; 分布式数据库集群中所有节点均 执行导出操作后, 对各个节点导出的数据进行整 合。 权利要求书3页 说明书7页 附图2页 CN 115203325 A 2022.10.18 CN 115203325 A 1.一种分布式数据库的数据导出整合方法, 其特征在于用于实现分布式数据库集群中 数据的导出和整合, 包括如下步骤: 向SQL引擎输入SQL语句, 所述SQL语句用于执行导出操作, 指定有导出对象和存储位 置, 所述导出对象为数据库支持的对象, 包括数据库、 模式以及表, 所述存储位置为数据库 支持的存 储位置, 包括网络位置和本地 位置; 对所述SQL语句进行解析得到语法树, 基于语法树和整合导出数据的请求创建导出计 划, 并将所述导出计划分发至分布式数据库集群的所有节点, 所述导出计划包括导出数据 的数据类型、 导出 数据的存 储位置、 导出对象列表以及导出的数据是否需要 整合; 分布式数据库集群中各节点接收到导出计划后, 基于导出计划进行设置, 并执行导出 操作; 分布式数据库集群中所有节点均执 行导出操作后, 对各个节点 导出的数据进行整合。 2.根据权利要求1所述的分布式数据库的数据导出整合方法, 其特征在于对所述SQL语 句进行解析 得到语法树, 基于语法树和整合 导出数据的请求创建导出计划, 包括如下步骤: 通过SQL引擎中解析器对输入 的SQL语句进行解析, 包括进行词法解析、 句 法解析以及 语义解析, 将SQ L语句生成语法树; 通过SQL引擎中优化器由语法树生成逻辑计划, 并将逻辑计划生成具体执行的物理计 划; 将整合导出数据的请求组装于所述物理计划中, 生成导出计划。 3.根据权利要求2所述的分布式数据库的数据导出整合方法, 其特征在于分布式数据 库集群中各节点接收到导出计划 后, 基于导出计划进 行设置, 并执行导出操作, 包括如下步 骤: 基于计划的类型判断当前接受 的计划是否为导出计划, 如果是, 执行下一步, 如果为其 他计划, 执 行其他计划对应的步骤; 分析导出计划, 判断导出的数据是否 需要整合, 如果不需要, 本地执行数据导出并将导 出的数据存储于本地, 如果需要, 判断导出数据的存储位置是否为本地存储, 如果是, 本地 执行数据导出并将导出 的数据存储于本地, 如果否, 执行导出数据并将导出 的数据发送至 指定存储位置; 基于导出计划的分析结果进行设置, 执行数据导出并将导出的数据存储值指定的存储 位置。 4.根据权利要求3所述的分布式数据库的数据导出整合方法, 其特征在于如果存储位 置为本地存储, 且为指定节点下 的指定文件路径, 所述指定节点将导出 的数据复制 于本地 指定文件路径下, 其 他节点将导出的数据发送至所述指定节点下的指定文件路径中。 5.根据权利要求2 ‑4任一项所述的分布式数据库的数据导出整合方法, 其特征在于基 于语法树和导出整合请求创建导出计划时, 进行参数设置, 所述 参数包括: FileFormat, 所述Fi leFormat用于表示 导出数据的数据类型; File, 所述Fi le表示导出数据的存 储位置; Targets, 所述Targets表示 导出的对象列表; Aggregate, 所述Ag gregate表示导出的数据是否需要 整合; 如果整合导出数据的请求中指定需要将导出的数据进行整合, Aggregate参数设置为权 利 要 求 书 1/3 页 2 CN 115203325 A 2true。 6.一种分布式数据库的数据导出整合系统, 其特征在于通过如权利要求1 ‑5任一项所 述的一种分布式数据库的数据导出整合方法实现分布式数据库集群中数据的导出和整合, 所述系统包括: 输入模块, 所述输入模块用于向SQL引擎输入SQL语句, 所述SQL语句用于执行导出操 作, 指定有导出对象和存储位置, 所述导出对 象为数据库支持的对象, 包括数据库、 模式以 及表, 所述存 储位置为数据库支持的存 储位置, 包括网络位置和本地 位置; 计划创建模块, 所述计划创建模块用于对所述SQL语句进行解析得到语法树, 基于语法 树和整合导出数据的请求创建导出计划, 并将所述导出计划分发至 分布式数据库集群的所 有节点, 所述导出计划包括导出数据的数据类型、 导出数据的存储位置、 导出对象列表以及 导出的数据是否需要 整合; 导出执行模块, 所述 导出执行模块用于基于导出计划设置并执 行导出操作; 整合模块, 所述整合模块用于对各个节点 导出的数据进行整合。 7.根据权利要求6所述的分布式数据库的数据导出整合系统, 其特征在于所述计划创 建模块用于通过如下步骤生成导出计划: 调用SQL引擎 中解析器, 通过解析器对输入的SQL语句进行解析, 包括进行词法解析、 句 法解析以及语义 解析, 将SQ L语句生成语法树; 调用SQL引擎中优化器, 通过优化器由语法树生成逻辑计划, 并将逻辑计划生成具体执 行的物理计划; 将整合导出数据的请求组装于所述物理计划中, 生成导出计划。 8.根据权利要求7所述的分布式数据库的数据导出整合系统, 其特征在于所述导出执 行模块用于通过如下步骤基于导出计划设置并执 行导出操作: 基于计划的类型判断当前接收的计划是否为导出计划, 如果是, 执行下一步, 如果为其 他计划, 执 行其他计划对应的步骤; 分析导出计划, 判断导出的数据是否 需要整合, 如果不需要, 本地执行数据导出并将导 出的数据存储于本地, 如果需要, 判断导出数据的存储位置是否为本地存储, 如果是, 本地 执行数据导出并将导出 的数据存储于本地, 如果否, 执行导出数据并将导出 的数据发送至 指定存储位置; 基于导出计划的分析结果进行设置, 执行数据导出并将导出的数据存储值指定的存储 位置。 9.根据权利要求8所述的分布式数据库的数据导出整合系统, 其特征在于如果存储位 置为本地存储, 且为指定节点下 的指定文件路径, 所述指定节点调用导出执行模块将导出 的数据复制于本地指 定文件路径下, 其他节点调用导出执行模块将导出的数据发送至所述 指定节点下的指定文件路径中。 10.根据权利要求7 ‑9任一项所述的分布式数据库的数据导出整合系统, 其特征在于计 划创建模块用于基于语法树和整合导出数据的请求创建导出计划, 并进行参数设置, 所述 参数包括: FileFormat, 所述Fi leFormat用于表示 导出数据的数据类型; File, 所述Fi le表示导出数据的存 储位置;权 利 要 求 书 2/3 页 3 CN 115203325 A 3

PDF文档 专利 分布式数据库的数据导出整合方法及系统

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 分布式数据库的数据导出整合方法及系统 第 1 页 专利 分布式数据库的数据导出整合方法及系统 第 2 页 专利 分布式数据库的数据导出整合方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 01:01:37上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。