全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210499378.5 (22)申请日 2022.05.09 (71)申请人 深圳依时货拉 拉科技有限公司 地址 518000 广东省深圳市福田区梅林街 道梅丰社区梅华路105号多丽工业区 科技楼3层3 07 (72)发明人 陈佳超  (74)专利代理 机构 深圳瑞天谨诚知识产权代理 有限公司 4 4340 专利代理师 温青玲 (51)Int.Cl. G06F 16/2458(2019.01) G06F 16/2455(2019.01) G06F 11/14(2006.01) G06F 9/54(2006.01) (54)发明名称 处理AB测试的命中分组数据的方法和系统 (57)摘要 本申请涉及一种处理AB测试的命中分组数 据的方法、 装置、 计算机设备和存储介质。 所述方 法包括: 通过业务系统将AB测试SDK分流后的命 中分组数据以高并发异步的形式发给第一Kafka 消息队列管道, 以及每隔第一时长将过去第一时 长内进行AB测试的测试相关信息存入缓存系统, 所述AB测试SDK集成于所述业务系统; 通过数据 处理系统根据目标测试相关信息对目标命中分 组数据进行指定处理, 得到期望分组数据, 并将 所述期望分 组数据以同步形式发送至第二Kafka 消息队列管道。 本申请实施例能够实现及时感知 数据丢失以及恢复丢失的数据, 并且能够同时兼 顾性能高、 高并发的优点。 权利要求书2页 说明书8页 附图2页 CN 114817369 A 2022.07.29 CN 114817369 A 1.一种处 理AB测试的命中分组数据的方法, 其特 征在于, 所述方法包括: 通过业务系统将AB测试SDK分流后的命中分组数据以高并发异步的形式发给第一 Kafka消息队列管道, 以及每隔第一时长将过去第一时长内进行AB测试的测试相关信息存 入缓存系统, 所述AB测试S DK集成于所述 业务系统; 通过数据处理系统根据目标测试相关信 息对目标命中分组数据进行指定处理, 得到期 望分组数据, 并将所述期望分组数据以同步形式发送至第二Kafka消息队列管道; 其中, 所 述数据处理系统是基于Kafka  Stream实现的; 所述目标命中分组数据是所述数据处理系统 从所述第一Kafka消息队列管道拉取对应于目标时间区间的命中分组数据, 所述目标测试 相关信息是所述数据处理系统从所述缓存系统中获取的对应于所述目标时间区间的测试 相关信息 。 2.如权利要求1所述的方法, 其特征在于, 所述目标时间区间的时长等于所述第一时 长; 所述测试相关信息包括分流次数、 分流对象和实验配置信息; 所述指 定处理包括数据数 量验证、 数据恢复和特定数据检测。 3.如权利要求2所述的方法, 其特征在于, 通过所述数据处理系统根据目标测试相关信 息对目标命中分组数据进行指定处 理, 包括: 通过所述数据处 理系统执 行以下操作: 统计所述目标命中分组数据的数据量; 根据所述数据量和所述目标测试相关信息中的分流次数检查所述目标命中分组数据 是否出现数据丢失; 响应于所述目标命中分组数据出现数据丢失, 根据所述目标命中分组数据、 所述目标 测试相关信息中的分流对象和实验配置信息进行数据恢复, 得到恢复的目标命中分组数 据; 对待检测数据进行特定数据检测; 所述待检测数据为所述目标命中分组数据或所述恢 复的目标命中分组数据。 4.如权利要求3所述的方法, 其特征在于, 通过所述数据处理系统根据 所述目标命中分 组数据、 所述 目标测试相关信息中的分流对 象和实验配置信息进行数据恢复, 得到恢复的 目标命中分组数据, 包括: 通过所述数据处理系统对比所述目标命中分组数据和所述目标测试相关信息中的分 流对象, 确定丢失的分流对 象, 根据所述丢失的分流对 象和所述 目标测试相关信息中的实 验配置信息执 行分流处 理, 得到恢复的目标命中分组数据。 5.如权利要求3所述的方法, 其特 征在于, 所述方法还 包括: 通过所述数据处理系统将所述待检测数据中的未成功通过所述特定数据检测的命中 分组数据作为异常数据, 并每隔第二时长将得到的异常数据发送至监控系统, 使得所述监 控系统对接收到的异常数据进行 可视化处 理。 6.如权利要求3所述的方法, 其特征在于, 所述特定数据检测包括敏感数据检测和/或 脏数据检测; 所述异常数据包括第一异常数据和/或第二异常数据; 所述第一异常数据是指所述待检测数据中的未成功通过所述敏感数据检测的命中分 组数据, 所述第二异常数据是指所述待检测数据中的未成功 通过所述脏数据检测的命中分权 利 要 求 书 1/2 页 2 CN 114817369 A 2组数据; 所述方法还包括: 通过所述数据处理系统对所述第一异常数据进行脱敏处理, 和/或, 通过所述数据处 理系统对所述第二异常数据进行剔除; 所述期望分组数据包括所述待检测数据中的成功通过所述特定数据检测的命中分组 数据以及脱敏处 理后的第一异常数据。 7.如权利要求3所述的方法, 其特征在于, 通过所述数据处理系统根据 所述数据量和所 述目标测试相关信息中的分流次数检查所述目标命中分组数据是否出现数据丢失, 包括: 通过所述数据处理系统对比所述数据量和所述目标测试相关信息中的分流次数是否 相同, 若相同, 判定所述目标命中分组数据未出现数据丢失, 若不相同, 判定所述 目标命中 分组数据出现数据丢失。 8.一种处理AB测试的命中分组数据的系统, 其特征在于, 所述系统包括集成了AB测试 SDK的业务系统、 第一Kafka消息队列管道、 缓存系统、 第二Kafka消息队列管道和数据处理 系统; 所述业务系统, 用于将所述AB测试SDK分流后的命中分组数据以高并发异步的形式发 给所述第一Kafka消息队列管道, 以及每隔第一时长将过去第一时长内进行AB测试的测试 相关信息存 入所述缓存系统; 所述数据处理系统, 用于根据目标测试相关信息对目标命中分组数据进行指定处理, 得到期望分组数据, 并将所述期望分组数据以同步形式发送至所述第二Kafka消息队列管 道; 其中, 所述数据处理系统是基于Kafka  Stream实现的; 所述目标命中分组数据是所述数 据处理系统从所述第一Kafka消息队列管道拉取对应于目标时间区间的命中分组数据, 所 述目标测试相关信息是所述数据处理系统从所述缓存系统中获取的对应于所述目标时间 区间的测试相关信息 。 9.一种计算机设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计 算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现权利要求1至7中任一项所 述方法的步骤。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。权 利 要 求 书 2/2 页 3 CN 114817369 A 3

.PDF文档 专利 处理AB测试的命中分组数据的方法和系统

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 处理AB测试的命中分组数据的方法和系统 第 1 页 专利 处理AB测试的命中分组数据的方法和系统 第 2 页 专利 处理AB测试的命中分组数据的方法和系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 00:14:16上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。