全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211043826.7 (22)申请日 2022.08.30 (71)申请人 广州市玄武无线科技股份有限公司 地址 510653 广东省广州市天河区高普路 1021号501室6383号 (72)发明人 林京 梁海棠 吴景行 卢超  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 何卿华 (51)Int.Cl. G06F 16/2458(2019.01) G06F 16/21(2019.01) G06F 16/242(2019.01) G06F 16/2453(2019.01) G06F 16/27(2019.01) (54)发明名称 一种分布式数据存 储及查询系统 (57)摘要 本申请公开了一种分布式数据存储及查询 系统, 包括运行模块包括查询优化器、 查询调度 器和存储优化器; 存储模块包括优化元信息、 列 式存储数据和行式存储数据; 查询优化器内置多 种查询优化引擎, 用于根据优化元信息对传入的 SQL语句进行优化, 并调度执行请求; 查询调度器 用于执行实际的调度请求, 并将调度请求分发列 式存储数据或行式存储数据中进行查询; 存储优 化器用于分析优化元信息, 以平衡查询性能与存 储空间生成最优解, 并执行优化迁移。 本申请提 供了多层优化器, 包括静态分析、 由周期分析、 业 务分析和权重匹配组成的动态 解析, 解决了复杂 多变的企业应用中的查询效率问题; 通过提前迁 移数据, 在保证业务性能的同时, 降低存储成本 和硬件成本 。 权利要求书2页 说明书10页 附图5页 CN 115114354 A 2022.09.27 CN 115114354 A 1.一种分布式数据存 储及查询系统, 其特 征在于, 包括: 运行模块包括查询优化器、 查询调度器和存储优化器; 存储模块包括优化元信 息、 列式 存储数据和行式存 储数据; 其中, 查询优化器内置多种查询优化引擎, 用于根据优化元信息对传入的SQL语句进行优化, 并调度执 行请求; 查询调度器, 用于执行实 际的调度请求, 并将调度请求分发列式存储数据或行式存储 数据中进行查询; 存储优化器, 用于分析优化元信息, 以平衡查询性能与存储空间生成最优解, 并执行优 化迁移。 2.根据权利要求1所述的分布式数据存储及查询系统, 其特征在于, 所述查询优化器包 括: SQL静态分析引擎, 用于将SQL查询语句解析为语法树, 根据语法节点的特性静态预测 执行效率, 生成静态最优解; 历史效率分析引擎, 用于根据历史执行情况和历史执行周期, 预测当前时间下的历史 最优解; 业务类别分析引擎, 用于根据本次执 行的业务类别, 预测执 行同类业 务最优解; 优化器权重引擎, 用于根据SQL静态分析引擎、 历史效率分析引擎及业务类别分析引擎 的预测结果, 按照各引擎的最优权 重确定最优执 行策略。 3.根据权利要求2所述的分布式数据存储及查询系统, 其特征在于, 所述SQL静态分析 引擎, 还用于: 将SQL查询语句解析为语法树, 查询静态解析缓存获得静态解析缓存结构, 包括语法关 键字、 建议存 储类别和对应权 重; 若语法树在静态解析缓存中存在 关键字, 分别获取行、 列权重之和, 将其中较大值对应 的存储类型确定为静态最优解; 若语法树在静态解析缓存中不存在关键字, 确定是否存在聚合语法, 若是则将列存储 类别确定为静态最优解。 4.根据权利要求2所述的分布式数据存储及查询系统, 其特征在于, 所述历史效率分析 引擎, 还用于: 在历史周期范围内查找SQL语句; 所述历史周期范围包括预设的长周期历史和短周期 历史范围; 若SQL语句的当前时间处于历史周期范围内, 则将对应历史周期范围内推荐的存储类 别确定为历史最优解; 若SQL语句的当前时间不处于历史周期范围内, 则忽略历史最优解。 5.根据权利要求2所述的分布式数据存储及查询系统, 其特征在于, 所述业务类别分析 引擎, 还用于: 在业务标签与SQ L语句的关系表中查询SQ L语句, 获得业 务标签; 在业务标签库中查询与所述 业务标签对应的存 储类别, 作为同类业 务最优解。 6.根据权利要求2所述的分布式数据存储及查询系统, 其特征在于, 所述优化器权重引 擎, 还用于:权 利 要 求 书 1/2 页 2 CN 115114354 A 2根据SQL静态分析引擎、 历史效率分析引擎及业务类别分析引擎的预测结果, 分别确定 行、 列存储的权重之和; 将权重值较大的存 储类别作为 最优执行策略。 7.根据权利要求1所述的分布式数据存储及查询系统, 其特征在于, 所述查询调度器, 还用于: 根据查询优化器执 行的调度类别, 在对应的存 储类别中查询语句; 记录当前 执行效率, 并返回给查询优化器以使得查询优化器进行权 重优化。 8.根据权利要求1所述的分布式数据存储及查询系统, 其特征在于, 所述存储优化器, 还用于: 获取预设的长周期范围内的数据迁移时长阈值, 遍历待迁移的长周期范围内的信息; 从遍历结果中解析长周期查询语句, 预测优化时间; 判断优化时间是否达到数据迁移时长阈值; 若是, 则执行优化结果; 若否, 则返回遍历 待迁移的长周期范围内的信息步骤。 9.根据权利要求8所述的分布式数据存储及查询系统, 其特征在于, 所述存储优化器, 还用于: 当执行数据迁移时, 若当前执行存储类别为行存储, 则将列存储的数据全部移除; 若当 前执行存储类别为列存 储, 则将行存 储的数据全部移除。权 利 要 求 书 2/2 页 3 CN 115114354 A 3

PDF文档 专利 一种分布式数据存储及查询系统

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种分布式数据存储及查询系统 第 1 页 专利 一种分布式数据存储及查询系统 第 2 页 专利 一种分布式数据存储及查询系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:34:17上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。