全网唯一标准王
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202211320064.0 (22)申请日 2022.10.26 (65)同一申请的已公布的文献号 申请公布号 CN 115391019 A (43)申请公布日 2022.11.25 (73)专利权人 小米汽车 科技有限公司 地址 100176 北京市大兴区北京经济技 术 开发区科创十街15号院5号楼6层618 室 (72)发明人 于凡  (74)专利代理 机构 北京英创嘉友知识产权代理 事务所(普通 合伙) 11447 专利代理师 代凤霞 (51)Int.Cl. G06F 9/48(2006.01)G06F 9/50(2006.01) G06F 9/54(2006.01) (56)对比文件 CN 113064705 A,2021.07.02 CN 113722055 A,2021.1 1.30 WO 2021259013 A1,2021.12.3 0 王俊峰等.基 于线程池技 术集群接入点的应 用研究. 《微计算机信息》 .20 09,(第24期), 审查员 刘肇荣 (54)发明名称 数据采集方法、 装置、 可读存 储介质与芯片 (57)摘要 本公开涉及一种数据采集方法、 装置、 可读 存储介质与芯片, 涉及计算机技术领域。 该方法 包括: 采用不同的线程, 解析层级树中位于上一 层中的至少一个第一任务, 得到第一解析数据; 通过该第一解析数据, 获取该至少一个第一任务 所需要获取的第一目标数据; 解析该第一目标数 据, 得到下一层中的至少一个第二任务获取第二 目标数据所需的第二解析数据, 该上一层和该下 一层为该层级树中任意相邻的两层; 将该第二解 析数据封装为该至少一个第二任务, 该第二任务 用于回传至消息队列被该不同的线程获取。 使用 本公开提出的数据采集方法, 可以采用多个线程 同时处理多个任务, 提升解析任务获取数据的效 率。 权利要求书2页 说明书9页 附图4页 CN 115391019 B 2022.12.27 CN 115391019 B 1.一种数据采集方法, 其特 征在于, 所述方法包括: 采用不同的线程, 解析层级树中位于上一层中的至少一个第一任务, 得到第一解析数 据; 通过所述第一 解析数据, 获取 所述至少一个第一任务所需要获取的第一目标 数据; 解析所述第 一目标数据, 得到下一层中的至少一个第 二任务获取第 二目标数据 所需的 第二解析数据, 所述上一层和所述下一层为所述层级树中任意相邻的两层; 将所述第二解析数据封装为所述至少一个第 二任务, 所述第 二任务用于回传至消息队 列被所述 不同的线程获取。 2.根据权利要求1所述的方法, 其特征在于, 所述采用不同的线程, 解析层级树中位于 上一层中的至少一个第一任务, 得到第一 解析数据, 包括: 根据多个服 务器的负载, 从所述多个服 务器中确定目标服 务器; 采用所述目标服务器中的线程, 解析层级树中位于所述上一层中的至少一个第一任 务, 得到所述第一 解析数据。 3.根据权利要求2所述的方法, 其特征在于, 所述采用所述目标服务器中的线程, 解析 层级树中位于所述上一层中的至少一个第一任务, 得到所述第一 解析数据, 包括: 确定所述目标服 务器中的空 闲线程; 利用所述空闲线程, 从位于所述消息队列中的至少一个第一任务中, 获取位于所述消 息队列首位的目标任务; 利用所述空 闲线程解析所述目标任务, 得到所述目标任务对应的第一 解析数据。 4.根据权利要求1所述的方法, 其特征在于, 所述通过所述第一解析数据, 获取所述至 少一个第一任务所需要获取的第一目标 数据, 包括: 通过所述第一 解析数据, 获取不同网络或不同硬件中的第一目标 数据。 5.根据权利要求1所述的方法, 其特征在于, 所述将所述第 二解析数据封装为所述至少 一个第二任务, 包括: 将所述第二解析数据、 所述第二任务的类型、 封装所述第二解析数据的重试次数以及 封装所述第二 解析数据的封装时间, 封装为所述第二任务。 6.一种数据采集装置, 其特 征在于, 所述装置包括: 第一任务解析模块, 被配置为采用不同的线程, 解析层级树中位于上一层中的至少一 个第一任务, 得到第一 解析数据; 第一目标数据获取模块, 被配置为通过所述第一解析数据, 获取所述至少一个第一任 务所需要获取的第一目标 数据; 第二解析数据获取模块, 被配置为解析所述第一目标数据, 得到下一层中的至少一个 第二任务 获取第二目标数据所需的第二解析数据, 所述上一层和所述下一层为所述层级树 中任意相邻的两层; 封装模块, 被配置为将所述第二解析数据封装为所述至少一个第二任务, 所述第二任 务用于回传至消息队列被所述 不同的线程获取。 7.根据权利要求6所述的装置, 其特 征在于, 所述第一任务 解析模块包括: 目标服务器确定子模块, 被配置为根据多个服务器的负载, 从所述多个服务器中确定 目标服务器;权 利 要 求 书 1/2 页 2 CN 115391019 B 2第一任务解析子模块, 被配置为采用所述目标服务器中的线程, 解析层级树中位于所 述上一层中的至少一个第一任务, 得到所述第一 解析数据。 8.一种数据采集装置, 其特 征在于, 包括: 第一处理器; 用于存储处理器可执行指令的第一存 储器; 其中, 所述第一处 理器被配置为: 执行所述可执行指令以实现权利要求1~5任一项所述方法的步骤。 9.一种计算机可读存储介质, 其上存储有计算机程序指令, 其特征在于, 该程序指令被 第二处理器执行时实现权利要求1~5中任一项所述方法的步骤。 10.一种芯片, 其特征在于, 包括第三处理器和接口; 所述第三处理器用于读取指令以 执行权利要求1~5中任一项所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 115391019 B 3

PDF文档 专利 数据采集方法、装置、可读存储介质与芯片

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据采集方法、装置、可读存储介质与芯片 第 1 页 专利 数据采集方法、装置、可读存储介质与芯片 第 2 页 专利 数据采集方法、装置、可读存储介质与芯片 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 01:00:30上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。