全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210641919.3 (22)申请日 2022.06.07 (71)申请人 北京奥星贝斯科技有限公司 地址 100020 北京市朝阳区东 三环中路1号 1幢1单元9层901内02号单 元 (72)发明人 周倜  (74)专利代理 机构 北京博思佳知识产权代理有 限公司 1 1415 专利代理师 李威 (51)Int.Cl. G06F 16/22(2019.01) G06F 16/23(2019.01) (54)发明名称 一种数据拆分方法及装置 (57)摘要 本说明书公开了一种数据拆 分方法及 装置, 可将获取到的待拆 分数据分为若干数据段, 并针 对每个数据段, 根据该数据段中位于各分隔符前 的指定字符的数量, 确定各候选位点, 再根据待 拆分数据中位于该数据段之前的各其他数据段 包含的指定字符的数量, 从各候选位点中, 确定 拆分位点, 最后根据各拆分位点将待拆 分数据进 行拆分。 本方法避免了目前确定出不具有分割意 义的分隔符作为拆 分位点的情况, 提高了拆分的 准确率, 保证 了业务执行效率。 权利要求书2页 说明书12页 附图2页 CN 115033571 A 2022.09.09 CN 115033571 A 1.一种数据拆分方法, 包括: 将获取到的待拆分数据分为若干数据段, 并确定各 数据段包 含的指定 字符的数量; 针对每个数据段, 根据该数据段中位于各分隔符前的指定字符的数量, 确定各候选位 点; 确定所述待拆分数据中位于该数据段之前的各其他数据段包含的指定字符的数量, 作 为第一数量, 并根据所述第一数量, 从所述各候选位 点中, 确定拆分位 点; 根据各拆分位 点, 将所述待拆分数据进行拆分。 2.如权利要求1所述的方法, 所述 候选位点包含第一候选位点和第二 候选位点; 根据该数据段中位于各分隔符前的指定 字符的数量, 确定各候选位 点, 具体包括: 针对每个分隔符, 确定该 数据段中位于该分隔符前的指定 字符的数量, 作为第二数量; 若所述第二数量 为奇数, 将该分隔符的位置作为所述第一 候选位点进行存 储; 若所述第二数量 为偶数, 将该分隔符的位置作为所述第二 候选位点进行存 储。 3.如权利要求1所述的方法, 所述 候选位点包含第一候选位点和第二 候选位点; 根据该数据段中位于各分隔符前的指定 字符的数量, 确定各候选位 点, 具体包括: 针对该数据段中包含的每个分隔符, 确定该数据段中位于该分隔符前的指定字符的数 量, 作为第二数量; 若所述第二数量 为奇数, 根据该分隔符的位置, 将所述第一 候选位点进行更新; 若所述第二数量 为偶数, 根据该分隔符的位置, 将所述第二 候选位点进行更新。 4.如权利要求1所述的方法, 确定所述待拆分数据中位于该数据段之前的各其他数据 段包含的指定字符的数量, 作为第一数量, 并根据所述第一数量, 从所述各候选位点中, 确 定拆分位 点, 具体包括: 确定所述待拆分数据中位于该 数据段之前的各其 他数据段; 根据所述各其 他数据段包 含的指定 字符的数量, 确定第一数量; 针对每个候选位点, 根据所述第一数量, 将该候选位点对应的指定字符的数量进行更 新; 从更新后对应的指定 字符的数量 为偶数的各候选位 点中, 确定拆分位 点。 5.如权利要求1所述的方法, 所述指定 字符包含多种类型; 确定所述待拆分数据中位于该数据段之前的各其他数据段包含的指定字符的数量, 作 为第一数量, 并根据所述第一数量, 从所述各候选位 点中, 确定拆分位 点, 具体包括: 针对每种类型的指定字符, 确定所述待拆分数据中位于该数据段之前的各其他数据段 包含的该类型的指定 字符的数量, 作为该类型对应的第一数量; 针对每个候选位点, 根据各类型分别对应的第一数量, 将该候选位点对应的各类型的 指定字符分别对应的数量进行 更新; 从更新后对应的各类型的指定 字符的数量都为偶数的各候选位 点中, 确定拆分位 点。 6.如权利要求2所述的方法, 根据所述第一数量, 从所述各候选位点中, 确定拆分位点, 具体包括: 若所述第一数量 为奇数, 从各第一 候选位点中, 确定拆分位 点; 若所述第一数量 为偶数, 从各第二 候选位点中, 确定拆分位 点。 7.如权利要求1所述的方法, 确定该数据段中位于各分隔符前的指定字符的数量, 具体权 利 要 求 书 1/2 页 2 CN 115033571 A 2包括: 确定各分隔符前相邻的连续的转义符的数量, 以及各指定字符前相邻的连续的转义符 的数量; 从所述各分隔符中, 筛 选出对应的转 义符的数量 为偶数的各分隔符; 针对筛选出的每个分隔符, 确定该分隔符前对应的转义符的数量为偶数的指定字符的 数量, 作为该 数据段中位于该分隔符前的指定 字符的数量。 8.一种数据拆分装置, 包括: 获取模块, 用于将获取到的待拆分数据分为若干数据段, 并确定各数据段包含的指定 字符的数量; 第一确定模块, 用于针对每个数据段, 根据该数据段中位于各分隔符前的指定字符的 数量, 确定各候选位 点; 第二确定模块, 用于确定所述待拆分数据中位于该数据段之前的各其他数据段包含的 指定字符的数量, 作为第一数量, 并根据所述第一数量, 从所述各候选位点中, 确定拆分位 点; 拆分模块, 用于根据各拆分位 点, 将所述待拆分数据进行拆分。 9.一种计算机可读存储介质, 所述存储介质存储有计算机程序, 所述计算机程序被处 理器执行时实现上述权利要求1~7任一项所述的方法。 10.一种电子设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计算 机程序, 所述处 理器执行所述程序时实现上述权利要求1~7任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115033571 A 3

PDF文档 专利 一种数据拆分方法及装置

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种数据拆分方法及装置 第 1 页 专利 一种数据拆分方法及装置 第 2 页 专利 一种数据拆分方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:49:36上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。