全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210744056.2 (22)申请日 2022.06.27 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 刘昊骋 徐世界 陈才 许海洋  (74)专利代理 机构 北京英赛 嘉华知识产权代理 有限责任公司 1 1204 专利代理师 王达佐 马晓亚 (51)Int.Cl. G06F 16/2455(2019.01) (54)发明名称 搜索方法和装置、 数据处 理方法和装置 (57)摘要 本公开提供了一种搜索方法和装置, 涉及大 数据技术领域。 具体实现方案为: 从第一目标存 储器中获取多个对应同一数据处理目标的数据 处理条件; 基于所述数据处理条件, 从第二目标 存储器提取相应的测算样本; 采用目标处理器基 于测算样 本和数据处理目标, 计算并排序所有数 据处理条件对应数据处理目标的测算结果, 得到 条件结果序列; 组合条件结果序列中的测算结果 对应的数据处理条件, 得到条件组序列; 基于条 件组序列的测算样本的交集对应的测算结果, 确 定应用条件集, 并将应用条件集存入第一目标存 储器。 该实施方式提高了 应用条件的搜索效率。 权利要求书3页 说明书13页 附图4页 CN 115062062 A 2022.09.16 CN 115062062 A 1.一种搜索方法, 所述方法包括: 从第一目标存 储器中获取多个对应同一数据处 理目标的数据处 理条件; 基于所述数据处 理条件, 从第二目标存 储器提取相应的测算样本; 采用目标处理器基于所述测算样本和所述数据处理目标, 计算并排序 所有数据处理条 件对应所述数据处理目标的测算结果, 得到条件结果序列, 所述条件 结果序列包括: 多个测 算结果以及与各个测算结果相关联的数据处 理条件; 组合所述条件结果序列中的测算结果对应的数据处 理条件, 得到条件组序列; 基于所述条件组序列的测算样本的交集对应的测算结果, 确定应用条件集, 并将所述 应用条件集存 入所述第一目标存 储器。 2.根据权利要求1所述的方法, 其中, 所述数据目标为确定属于预定群体的数据; 所述 方法还包括: 从所述第二 目标存储器获取多种不同个体的数据, 采用所述应用条件集对所 述多种不同个体的数据进行搜索, 得到对应所述预定群体的数据, 并将所述预定群体的数 据存储入所述第二目标存 储器。 3.根据权利要求1所述的方法, 其中, 所述采用目标处理器基于所述测算样本和所述数 据处理目标, 计算并排序所有数据 处理条件对应所述数据 处理目标的测 算结果, 得到条件 结果序列, 包括: 目标处理器在所述数据处理目标包括: 测算结果最大化时, 计算所有数据处理条件对 应所述数据处 理目标的测算结果; 将所有测算结果依次由大到小排序, 得到条件结果序列。 4.根据权利要求1所述的方法, 其中, 所述采用目标处理器基于所述测算样本和所述数 据处理目标, 计算并排序所有数据 处理条件对应所述数据 处理目标的测 算结果, 得到条件 结果序列, 包括: 目标处理器在所述数据处理目标包括: 测算结果最小化时, 计算所有数据处理条件对 应所述数据处 理目标的测算结果; 将所有测算结果依次由小到大排序, 得到条件结果序列。 5.根据权利要求1所述的方法, 其中, 所述组合所述条件结果序列中的测算结果对应的 数据处理条件, 得到条件组序列包括: 针对所述条件结果序列的第 一个测算结果对应的第 一个数据处理条件, 选取所述第 一 数据处理条件之后的设定个数据处 理条件; 将所述第一数据处理条件与 所述选取的数据处理条件进行组合, 以及将所述选取的数 据处理条件进行组合, 得到包括多个条件组的条件组序列。 6.根据权利要求5所述的方法, 其中, 所述组合所述条件结果序列中的测算结果对应的 数据处理条件, 得到条件组序列, 还 包括: 将所有数据处理条件中的至少一个数据处理条件作为条件组, 添加到所述条件组序列 中。 7.根据权利要求1 ‑6之一所述的方法, 其中, 所述基于所述条件组序列的测算样本的交 集对应的测算结果, 确定应用条件集, 包括: 针对所述条件组序列中的各个条件组, 将该条件组中数据处理条件对应的测算样本求 交集, 得到该 条件组的测算样本的交集;权 利 要 求 书 1/3 页 2 CN 115062062 A 2计算所述测算样本的交集对应所述数据处 理目标的测算结果; 响应于所述交集的测算结果符合所述数据处 理目标, 确定该 条件组为应用条件; 对所有的应用条件进行排序, 并从排序后的应用条件中选取设定数目个应用条件, 得 到应用条件集。 8.一种数据处 理方法, 所述方法包括: 获取待测算数据; 基于权利要求1 ‑7中任意一项所述的搜索方法得到的多个数据处理目标对应的应用条 件集, 检测所述待测算数据是否满足所述多个数据处 理目标中的至少一个数据处 理目标; 响应于检测到所述待测算数据满足所述至少一个数据处理目标, 确定所述待测算数据 为目标数据。 9.根据权利要求8所述的方法, 其中, 所述多个数据处理目标包括以下至少一项: 生成 智能报表中的多种群体中各个群体的画像数据、 圈定不同行业中多个个体所属的个体圈、 生成多个风险个 体中不同风险个 体的名单。 10.一种搜索装置, 所述装置包括: 条件获取单元, 被配置成从第 一目标存储器中获取多个对应同一数据处理目标的数据 处理条件; 样本确定单元, 被配置成基于所述数据处理条件, 从第二目标存储器提取相应的测算 样本; 计算单元, 被配置成采用目标处理器基于所述测算样本和所述数据处理目标, 计算并 排序所有数据 处理条件对应所述数据 处理目标的测算结果, 得到条件结果序列, 所述条件 结果序列包括: 多个测算结果以及与各个测算结果相关联的数据处 理条件; 组合单元, 被配置成组合所述条件结果序列中的测算结果对应的数据处理条件, 得到 条件组序列; 条件确定单元, 被配置成基于所述条件组序列的测算样本的交集对应的测算结果, 确 定应用条件集, 并将所述应用条件集存 入所述第一目标存 储器。 11.根据权利要求10所述的装置, 其中, 所述数据目标为确定属于预定群体的数据; 所 述装置还包括: 数据得到单元, 被配置成从所述第二目标存储器获取多种不同个体的数据, 采用所述应用条件集对所述多种不同个体的数据进行搜索, 得到对应所述预定群体的数 据, 并将所述预定群 体的数据存 储入所述第二目标存 储器。 12.根据权利要求10所述的装置, 其中, 所述计算单元进一步被配置成: 目标处理器在 所述数据 处理目标包括: 测 算结果最大化时, 计算所有数据 处理条件对应所述数据 处理目 标的测算结果; 将所有测算结果依次由大到小排序, 得到条件结果序列。 13.根据权利要求10所述的方法, 其中, 所述计算单元进一步被配置成: 目标处理器在 所述数据 处理目标包括: 测 算结果最小化时, 计算所有数据 处理条件对应所述数据 处理目 标的测算结果; 将所有测算结果依次由小到大排序, 得到条件结果序列。 14.根据权利要求10所述的方法, 其中, 所述组合单元进一步被配置成: 针对所述条件 结果序列的第一个测算结果对应的第一个数据处理条件, 选取所述第一数据处理条件 之后 的设定个数据 处理条件; 将所述第一数据 处理条件与所述选取的数据 处理条件进行组合, 以及将所述选取的数据处 理条件进行组合, 得到包括多个条件组的条件组序列。权 利 要 求 书 2/3 页 3 CN 115062062 A 3

.PDF文档 专利 搜索方法和装置、数据处理方法和装置

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 搜索方法和装置、数据处理方法和装置 第 1 页 专利 搜索方法和装置、数据处理方法和装置 第 2 页 专利 搜索方法和装置、数据处理方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 00:14:41上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。