全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211327289.9 (22)申请日 2022.10.25 (71)申请人 广州点金石信息技 术有限公司 地址 510000 广东省广州市天河区建工路4 号佳都科技大厦2号楼4楼402 (72)发明人 王玲 何海锋 吴海强 曾启彦  廖梓鸿  (74)专利代理 机构 广州佳睿知识产权代理事务 所(普通合伙) 44610 专利代理师 徐燕萍 (51)Int.Cl. G06F 16/2453(2019.01) G06F 16/28(2019.01) G06F 16/242(2019.01) G06F 16/22(2019.01)G06F 16/182(2019.01) (54)发明名称 一种数据查询方法及装置 (57)摘要 本发明实施例涉及一种数据查询方法及装 置。 所述方法通过接收用户的查询请求, 对查询 请求进行解析得到查询语句; 根据查询语句确定 优化规则, 并按照优化规则筛选出数据仓库中的 数据及对应的文件, 对被筛选出的数据进行记 录, 将数据记录转换为N维数据; 根据查询语句确 定降维策略, 并根据降维策略对N维数据进行数 据降维处理, 得到与所述数据记录对应的一维数 据表示; 根据一维数据表示对被筛选出的文件进 行合并, 并构建索引; 基于索引在合并后的文件 中读取查询请求对应的目标数据。 其利用数据跳 过加速查询技术, 在不影 响数据读取速度的情况 下重组数据来 提升查询性能。 权利要求书1页 说明书7页 附图3页 CN 115544074 A 2022.12.30 CN 115544074 A 1.一种数据查询方法, 其特 征在于, 包括: 接收用户的查询 请求, 对查询请求进行解析得到查询语句; 其中, 所述查询语句包含与 优化规则对应的第一关键词, 与降维策略对应的第二关键词; 根据查询语句确定优化规则, 并按照优化规则筛选出数据仓库中的数据及对应的文 件, 对被筛 选出的数据进行记录, 将数据记录转换为 N维数据; 根据查询语句确定降维策略, 并根据降维策略对N维数据进行数据降维处理, 得到与所 述数据记录对应的一维数据表示; 根据一维数据表示对被筛 选出的文件进行合并, 并构建索引; 基于索引在合并后的文件中读取查询请求对应的目标 数据。 2.根据权利要求1所述的方法, 其特 征在于: 所述优化 规则包括谓词下推。 3.根据权利要求1所述的方法, 其特征在于, 所述根据降维策略对N维数据进行数据降 维处理, 得到与所述数据记录对应的一维数据表示, 包括: 基于希尔伯特曲线, 将N维数据转换成与所述数据记录对应的一维数据表示。 4.根据权利要求1所述的方法, 其特征在于, 所述根据降维策略对N维数据进行数据降 维处理, 得到与所述数据记录对应的一维数据表示, 包括: 基于Z‑Order曲线, 将N维数据转换成与所述数据记录对应的一维数据表示。 5.根据权利要求1至4任一项所述的方法, 其特征在于, 所述根据一维数据表示对被筛 选出的文件进行合并, 并构建索引之前, 还 包括: 将所述数据仓库的隔离级别设置为快照隔离 。 6.一种数据查询装置, 其特 征在于, 包括: 解析模块, 用于接收用户的查询请求, 对查询请求进行解析得到查询语句; 其中, 所述 查询语句包 含与优化 规则对应的第一关键词, 与降维策略对应的第二关键词; 优化模块, 用于根据查询语句确定优化规则, 并按照优化规则筛选出数据仓库中的数 据及对应的文件, 对被筛 选出的数据进行记录, 将数据记录转换为 N维数据; 降维模块, 用于根据查询语句确定降维策略, 并根据降维策略对N维数据进行数据降维 处理, 得到与所述数据记录对应的一维数据表示; 处理模块, 用于根据一维数据表示对被筛 选出的文件进行合并, 并构建索引; 查询模块, 用于基于索引在合并后的文件中读取查询请求对应的目标 数据。 7.根据权利要求6所述的装置, 其特征在于: 所述降维模块, 还用于基于希尔伯特曲线, 将N维数据转换成与所述数据记录对应的一维数据表示。 8.根据权利要求6所述的装置, 其特征在于: 所述降维模块, 还用于基于Z ‑Order曲线, 将N维数据转换成与所述数据记录对应的一维数据表示。 9.一种计算机设备, 其特 征在于, 所述计算机设备包括: 一个或多个处 理器; 存储器, 用于存 储一个或多个程序; 当所述一个或多个程序被所述一个或多个处理器执行, 使得所述一个或多个处理器实 现如权利要求1 ‑5中任一项所述的数据查询方法。 10.一种计算机可读存储介质, 其特征在于: 所述计算机可读存储介质上存储计算机程 序, 所述计算机程序被处 理器执行时实现如权利要求1 ‑5中任一项所述的数据查询方法。权 利 要 求 书 1/1 页 2 CN 115544074 A 2一种数据查询方 法及装置 技术领域 [0001]本申请涉及计算机技 术领域, 具体涉及一种数据查询方法及装置 。 背景技术 [0002]在数据仓库中, 数据的读取速度和查询性能是衡量数据仓库 优越性的关键权衡 因 素。 一般情况下, 数量合理的小文件可以通过提高并行性, 加速数据读取, 但小文件数量过 多, 会导致查询性能很差。 在数据读取时, 数据通常基于 分区或者数据到达时间位于同一个 文件内。 对于大多 数查询引擎而言, 频繁查询的数据位于同一位置时, 往往会获得优秀的查 询性能。 但是即便如此, 数据分布的不均衡性仍然会对数据查询性能造成很大影响, 当每个 文件的上界和下界的范围很大时, 仍然需要扫描所有 文件或者所有的分区。 发明内容 [0003]鉴于上述问题, 提出了本发明以便提供一种克服上述问题或者至少部分地解决上 述问题的一种数据查询方法及装置 。 [0004]第一方面, 本发明实施例提供了一种数据查询方法, 所述方法包括以下步骤: [0005]接收用户的查询请求, 对查询请求进行解析得到查询语句; 其中, 所述查询语句包 含与优化 规则对应的第一关键词, 与降维策略对应的第二关键词; [0006]根据查询语句确定优化规则, 并按照优化规则筛选出数据 仓库中的数据及对应的 文件, 对被筛 选出的数据进行记录, 将数据记录转换为 N维数据; [0007]根据查询语句确定降维策略, 并根据降维策略对N维数据进行数据降维处理, 得到 与所述数据记录对应的一维数据表示; [0008]根据一维数据表示对被筛 选出的文件进行合并, 并构建索引; [0009]基于索引在合并后的文件中读取查询请求对应的目标 数据。 [0010]在一种实施方式 中, 所述优化 规则包括谓词下推。 [0011]在一种实施方式中, 所述根据降维策略对N维数据进行数据降维处理, 得到与所述 数据记录对应的一维数据表示, 包括: [0012]基于希尔伯特曲线, 将N维数据转换成与所述数据记录对应的一维数据表示。 [0013]在一种实施方式中, 所述根据降维策略对N维数据进行数据降维处理, 得到与所述 数据记录对应的一维数据表示, 包括: [0014]基于Z‑Order曲线, 将N维数据转换成与所述数据记录对应的一维数据表示。 [0015]在一种实施方式中, 所述根据一维数据表示对被筛选出的文件进行合并, 并构建 索引之前, 还 包括: [0016]将所述数据仓库的隔离级别设置为快照隔离 。 [0017]第二方面, 本发明实施例提供了一种数据查询装置, 所述装置包括: [0018]解析模块, 用于接收用户的查询请求, 对查询请求进行解析得到查询语句; 其中, 所述查询语句包 含与优化 规则对应的第一关键词, 与降维策略对应的第二关键词;说 明 书 1/7 页 3 CN 115544074 A 3

.PDF文档 专利 一种数据查询方法及装置

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种数据查询方法及装置 第 1 页 专利 一种数据查询方法及装置 第 2 页 专利 一种数据查询方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:33:01上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。