全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211387148.6 (22)申请日 2022.11.07 (71)申请人 支付宝 (杭州) 信息技 术有限公司 地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人 赵闻飙 赵文龙 张天翼 马博群  董迹海 徐恪 李琦  (74)专利代理 机构 北京国昊天诚知识产权代理 有限公司 1 1315 专利代理师 朱文杰 (51)Int.Cl. G06Q 40/04(2012.01) G06Q 20/40(2012.01) G06K 9/62(2022.01) (54)发明名称 一种风险群组的检测方法、 装置及设备 (57)摘要 本说明书实施例公开了一种风险群组的检 测方法、 装置及设备, 该方法包括: 接收风险群组 的检测请求, 获取待处理的多个不同用户的目标 数据, 并对多个不同用户的目标数据进行聚类处 理, 得到一个或多个由目标数据构成的用户群 组, 目标数据中包括一种或多种不同的数据特 征; 基于多个不同用户的目标数据, 确定每种数 据特征对应的出现概率, 并基于每个用户群组和 每个用户群组中包含的目标数据, 分别确定每个 用户群组中包含的用户数量和每种数据特征的 数量; 基于每种数据特征对应的出现概率, 以及 每个用户群组中包含的用户数量和每个数据特 征的数量, 确定每个用户群组 中包含的每种数据 特征分布的出现概率, 进而确定存在预设风险的 用户群组。 权利要求书4页 说明书24页 附图8页 CN 115456788 A 2022.12.09 CN 115456788 A 1.一种风险群组的检测方法, 所述方法包括: 接收风险群组的检测请求, 基于所述检测请求获取待处理的多个不同用户的目标数 据, 并对所述多个不同用户的目标数据进行聚类处理, 得到一个或多个由所述目标数据构 成的用户群组, 所述目标 数据中包括 一种或多种不同的数据特 征; 基于所述多个不同用户的目标数据, 确定每种数据特征对应的出现概率, 并基于每个 所述用户群组和每个所述用户群组中包含的目标数据, 分别确定每个所述用户群组中包含 的用户数量和每种数据特 征的数量; 基于每种数据 特征对应的出现概率, 以及每个所述用户群组中包含的用户数量和每个 数据特征的数量, 确定每 个所述用户群组中包 含的每种数据特 征分布的出现概 率; 基于每个所述用户群组中包含的每种数据 特征分布的出现概率, 确定一个或多个所述 用户群组中存在预设风险的用户群组, 输出确定出的存在预设风险的用户群组的相关信 息。 2.根据权利要求1所述的方法, 所述方法还 包括: 对所述多个不同用户的目标数据进行编码处理, 得到每个用户的每种数据特征对应的 编码信息; 所述基于所述多个不同用户的目标 数据, 确定每种数据特 征对应的出现概 率, 包括: 基于每个用户的每种数据特征对应的编码信 息, 确定所述多个不同用户的目标数据中 每种数据特 征对应的出现概 率。 3.根据权利要求2所述的方法, 所述对所述多个不同用户的目标数据进行编码处理, 得 到每个用户的每种数据特 征对应的编码信息, 包括: 通过二值化的二项式特征编码方式分别对所述多个不同用户的目标数据中的每个用 户的每种数据特征进行编码处理, 得到每个用户的每种数据特征对应的二值化的编码信 息, 所述二值化中的二 值互斥。 4.根据权利要求3所述的方法, 所述二值化中的二值分别为0和1, 所述基于每种数据 特 征对应的出现概率, 以及每个所述用户群组中包含的用户数量和每个数据特征 的数量, 确 定每个所述用户群组中包 含的每种数据特 征分布的出现概 率, 包括: 分别将每种数据 特征对应的出现概率, 以及每个所述用户群组中包含的用户数量和每 个数据特征的数量输入到概率质量函数PMF中, 得到每个所述用户群组中包含的每种数据 特征分布的出现概 率。 5.根据权利要求1所述的方法, 所述基于每个所述用户群组中包含的每种数据特征分 布的出现概 率, 确定一个或多个所述用户群组中存在预设风险的用户群组, 包括: 基于每个所述用户群组中包含的每种数据 特征分布的出现概率和预设概率阈值, 确定 每个所述用户群组中出现概 率小于所述预设概 率阈值的数据特 征; 对每个所述用户群组中出现概率小于所述预设概率阈值的数据 特征进行聚合处理, 得 到每个所述用户群组存在预设风险的概 率; 基于每个所述用户群组存在预设风险的概率和预设的风险概率阈值, 确定一个或多个 所述用户群组中存在预设风险的用户群组。 6.根据权利要求1所述的方法, 所述基于每个所述用户群组中包含的每种数据特征分 布的出现概 率, 确定一个或多个所述用户群组中存在预设风险的用户群组, 包括:权 利 要 求 书 1/4 页 2 CN 115456788 A 2根据每个所述用户群组中包含的每种数据 特征分布的出现概率, 对每个所述用户群组 中包含的数据特征的出现概率由小到大进 行排序, 得到每个所述用户群组中排序后的数据 特征; 从每个所述用户群组中排序后的数据特征中选取排列在前的N种数据特征, 其中, N为 大于或等于1的整数; 对从每个所述用户群组中排序后的数据特征中选取的排列在前的N种数据特征进行聚 合处理, 得到每 个所述用户群组存在预设风险的概 率; 基于每个所述用户群组存在预设风险的概率和预设的风险概率阈值, 确定一个或多个 所述用户群组中存在预设风险的用户群组。 7.根据权利要求1所述的方法, 所述预设风险为欺诈风险或非法金融活动。 8.一种风险群组的检测方法, 所述方法包括: 获取待处理的多个不同用户的目标数据, 并对所述多个不同用户的目标数据进行聚类 处理, 得到一个或多个由所述 目标数据构成的用户群组, 所述 目标数据中包括一种或多种 不同的数据特 征; 基于所述多个不同用户的目标数据, 确定每种数据特征对应的出现概率, 并基于每个 所述用户群组和每个所述用户群组中包含的目标数据, 分别确定每个所述用户群组中包含 的用户数量和每种数据特 征的数量; 基于每种数据 特征对应的出现概率, 以及每个所述用户群组中包含的用户数量和每个 数据特征的数量, 确定每 个所述用户群组中包 含的每种数据特 征分布的出现概 率; 基于每个所述用户群组中包含的每种数据 特征分布的出现概率, 确定一个或多个所述 用户群组中存在预设风险的用户群组。 9.一种风险群组的检测装置, 所述装置包括: 数据获取模块, 接收风险群组的检测请求, 基于所述检测请求获取待处理的多个不同 用户的目标数据, 并对所述多个不同用户的目标数据进行聚类处理, 得到一个或多个由所 述目标数据构成的用户群组, 所述目标 数据中包括 一种或多种不同的数据特 征; 数据处理模块, 基于所述多个不同用户的目标数据, 确定每种数据特征对应的出现概 率, 并基于每个所述用户群组和每个所述用户群组中包含的目标数据, 分别确定每个所述 用户群组中包 含的用户数量和每种数据特 征的数量; 概率确定模块, 基于每种数据特征对应的出现概率, 以及每个所述用户群组中包含的 用户数量和每个数据特征的数量, 确定每个所述用户群组中包含的每种数据特征分布的出 现概率; 风险群组确定模块, 基于每个所述用户群组中包含的每种数据特征分布的出现概率, 确定一个或多个所述用户群组中存在预设风险的用户群组, 输出确定出的存在预设风险的 用户群组的相关信息 。 10.一种风险群组的检测装置, 所述装置包括: 数据获取模块, 获取待处理的多个不同用户的目标数据, 并对所述多个不同用户的目 标数据进行聚类处理, 得到一个或多个由所述 目标数据构成的用户群组, 所述目标数据中 包括一种或多种不同的数据特 征; 数据统计模块, 基于所述多个不同用户的目标数据, 确定每种数据特征对应的出现概权 利 要 求 书 2/4 页 3 CN 115456788 A 3

.PDF文档 专利 一种风险群组的检测方法、装置及设备

文档预览
中文文档 37 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共37页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种风险群组的检测方法、装置及设备 第 1 页 专利 一种风险群组的检测方法、装置及设备 第 2 页 专利 一种风险群组的检测方法、装置及设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:41:36上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。