全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210577316.1 (22)申请日 2022.05.25 (71)申请人 广州文远知行 科技有限公司 地址 510000 广东省广州市黄埔区广州国 际生物岛螺旋大道68号合景科盛广场 A栋地上第16层01、 02、 0 3、 04单元 (72)发明人 王红宾 韩旭  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 彭东威 (51)Int.Cl. G06F 16/22(2019.01) G06F 16/23(2019.01) G06F 16/242(2019.01) G06F 16/245(2019.01)G06F 16/248(2019.01) G06F 16/27(2019.01) G06F 16/28(2019.01) G06F 3/06(2006.01) (54)发明名称 数据查询方法、 装置、 存储介质及计算机设 备 (57)摘要 本申请提供的数据查询方法、 装置、 存储介 质及计算机设备, 在数据库中查询数据之前, 该 数据库已预先按照数据查询频次划分为冷数据 区和热数据区, 这样不仅能够 避免将所有的存储 数据存储在同一存储区域导致的索引性能崩溃 的问题, 而且 热数据选用的是存储 数据中近期经 常被查询的数据, 当用户进行数据查询时, 与查 询语句对应的待查询数据中包含热数据的概率 较高, 而热数据区相较于原有的存储区域, 其存 储的数据量较小, 索引性能较优, 从而在一定程 度上缩小数据查询范围, 并有效提高数据查询效 率和查询精度; 而当待查询数据包含冷数据时, 本申请则可以有针对性地将该冷数据从冷数据 区转移到 热数据区后生成热数据, 从而进一步提 升数据查询效率。 权利要求书2页 说明书10页 附图3页 CN 114880329 A 2022.08.09 CN 114880329 A 1.一种数据查询方法, 其特 征在于, 所述方法包括: 接收用户在已建立的数据库中输入的查询语句, 并确定所述查询语句对应的待查询数 据, 所述数据库预先按照数据查询频次划分为冷数据区和热数据区, 所述冷数据区中包括 多个冷数据, 所述热 数据区中包括多个热 数据; 确定所述待查询数据中是否包含第 一数据, 所述第 一数据为存在于所述冷数据区中的 冷数据; 当所述待查询数据中包含第 一数据时, 将所述第 一数据从所述冷数据区转移至所述热 数据区, 生成所述第一数据对应的热 数据, 以对所述热 数据区进行 更新; 在已更新的所述热 数据区中提取 所述待查询数据。 2.根据权利要求1所述的方法, 其特征在于, 所述确定所述查询语句对应的待查询数 据, 包括: 将所述查询语句输入至预先配置的数据预测模型中, 得到所述数据预测模型输出的所 述查询语句对应的待查询数据; 其中, 所述数据预测模型是以训练查询语句为训练样本, 以所述训练样本对应的真实 查询数据为样本标签进行训练得到的。 3.根据权利要求1所述的方法, 其特征在于, 所述冷数据区中的冷数据对应的索引类 型, 与所述热 数据区中的热 数据对应的索引类型不同; 所述确定所述待查询数据中是否包 含第一数据, 包括: 对所述待查询数据中各 数据的索引类型进行分析, 得到分析 结果; 根据所述分析 结果判断所述待查询数据中是否包 含第一数据。 4.根据权利要求1所述的方法, 其特征在于, 所述第一数据包括文件块和第一索引, 所 述第一索引是依据所述冷数据区中的数据索引与文件块之间的映射关系进行配置的; 所述将所述第 一数据从所述冷数据区转移至所述热数据区, 生成所述第 一数据对应的 热数据, 包括: 根据所述第一索引, 在所述冷数据区中提取所述第一索引对应的文件块, 并将所述文 件块转移至所述热 数据区; 根据所述热数据区中的数据索引与文件块之间的映射关系, 对提取到的所述文件块配 置在所述热 数据区的第二索引; 根据提取到的所述文件块, 以及所述第二索引, 生成所述第一数据对应的热 数据。 5.根据权利要求1所述的方法, 其特 征在于, 所述数据库的划分过程, 包括: 获取第一预设历史时段内对已建立的数据库中的存 储数据进行查询的历史查询记录; 根据所述历史查询记录统计各个存 储数据的数据查询频次; 将数据查询频次高于第 一预设频次阈值的存储数据作为热数据, 并构建所述热数据对 应的热数据区; 将数据查询频次不高于第 一预设频次阈值的存储数据作为冷数据, 并构建所述冷数据 对应的冷数据区; 其中, 所述热数据区中的热数据总量在所述存储数据中的占比, 小于所述冷数据区中 的冷数据总量在所述存 储数据中的占比。 6.根据权利要求1 ‑5中任一项所述的方法, 其特 征在于, 所述方法还 包括:权 利 要 求 书 1/2 页 2 CN 114880329 A 2确定所述热 数据区中的各个热 数据在第二预设历史时段内的数据查询频次; 将所述热数据区中数据查询频次不高于第二预设频次阈值的热数据作为第二数据转 移到所述冷数据区, 生成所述第二数据对应的冷数据, 以对所述冷数据区进行 更新。 7.根据权利要求6所述的方法, 其特征在于, 所述第二数据包括文件块和第三索引, 所 述第三索引是依据所述热 数据区中的数据索引与文件块之间的映射关系进行配置的; 所述将所述热数据区中数据查询频次不高于第二预设频次阈值的热数据作为第二数 据转移到所述冷数据区, 生成所述第二数据对应的冷数据, 包括: 根据所述第三索引, 在所述热数据区中提取所述第三索引对应的文件块, 并将所述文 件块转移至所述冷数据区; 根据所述冷数据区中的数据索引与文件块之间的映射关系, 对提取到的所述文件块配 置在所述冷数据区的第四索引; 根据提取到的所述文件块, 以及所述第四索引, 生成所述第二数据对应的冷数据。 8.一种数据查询装置, 其特 征在于, 包括: 数据接收模块, 用于接收用户在已建立的数据库中输入的查询语句, 并确定所述查询 语句对应的待查询数据, 所述数据库预先按照数据查询频次划分为冷数据区和热数据区, 所述冷数据区中包括多个冷数据, 所述热 数据区中包括多个热 数据; 数据确定模块, 用于确定所述待查询数据中是否包含第一数据, 所述第一数据为存在 于所述冷数据区中的冷数据; 数据转移模块, 用于当所述待查询数据中包含第一数据时, 将所述第一数据从所述冷 数据区转移至所述热数据区, 生成所述第一数据对应的热数据, 以对所述热数据区进行更 新; 数据提取模块, 用于在已更新的所述热 数据区中提取 所述待查询数据。 9.一种存储介质, 其特征在于, 包括: 所述存储介质中存储有计算机可读指令, 所述计 算机可读指令被一个或多个处理器执行时, 使得一个或多个处理器执行如权利要求 1至7中 任一项所述数据查询方法的步骤。 10.一种计算机设备, 其特 征在于, 包括: 一个或多个处 理器, 以及存 储器; 所述存储器中存储有计算机可读指令, 所述计算机可读指令被所述一个或多个处理器 执行时, 执行如权利要求1至7中任一项所述数据查询方法的步骤。权 利 要 求 书 2/2 页 3 CN 114880329 A 3

PDF文档 专利 数据查询方法、装置、存储介质及计算机设备

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据查询方法、装置、存储介质及计算机设备 第 1 页 专利 数据查询方法、装置、存储介质及计算机设备 第 2 页 专利 数据查询方法、装置、存储介质及计算机设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:49:42上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。