全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210766154.6 (22)申请日 2022.07.01 (71)申请人 国网汇通金财 (北京) 信息科技有限 公司 地址 100094 北京市海淀区北清路68号院 21号楼三层31 1室 (72)发明人 吴立 俞蓓 李鑫 杜宇斌  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 刘翠香 (51)Int.Cl. G06F 16/26(2019.01) G06F 16/28(2019.01) G06F 16/215(2019.01) G06F 16/25(2019.01)G06Q 30/02(2012.01) G06Q 50/06(2012.01) (54)发明名称 一种用户画像构建方法、 装置、 设备和介质 (57)摘要 本申请提供了用户画像构建方法、 装置、 设 备和介质, 方法包括: 从基础数据平台中获取多 个电力用户的画 像源数据; 对多个电力用户的画 像源数据进行预处理, 得到多个电力用户的处理 后画像源数据, 作为多个电力用户的目标源数 据; 对多个电力用户的目标源数据进行分组聚 类, 得到至少一个数据分组; 确定至少一个数据 分组分别对应的用户标签; 根据至少一个数据分 组分别对应的用户标签, 确定多个电力用户分别 对应的用户标签集合, 将多个电力用户分别对应 的用户标签集合作为多个电力用户分别对应的 用户画像。 本申请能从为线下业务的办理过程提 供服务的基础数据平台中获取画 像源数据, 基于 画像源数据能构建出准确且适用于电力营业厅 线下服务模式的用户画像 。 权利要求书2页 说明书14页 附图2页 CN 115062087 A 2022.09.16 CN 115062087 A 1.一种用户画像构建方法, 其特 征在于, 包括: 从基础数据平台中获取多个电力用户的画像源数据, 其中, 所述基础数据平台用于为 线下业务的办理过程提供服务, 所述画像源数据包括对应电力用户的基本信息和缴费信 息; 对所述多个电力用户的画像源数据进行预处理, 得到所述多个电力用户的处理后画像 源数据, 作为所述多个电力用户的目标源数据, 其中, 所述目标源数据用于表征对应电力用 户在办理所述线下业 务时的真实需求; 对所述多个电力用户的目标源数据进行分组聚类, 得到至少一个数据分组, 其中, 任一 数据分组中包括至少一个电力用户的目标源数据; 确定所述至少一个数据分组分别对应的用户标签; 根据所述至少一个数据分组分别对应的用户标签, 确定所述多个电力用户分别对应的 用户标签集合, 将所述多个电力用户分别对应的用户标签集合作为所述多个电力用户分别 对应的用户画像。 2.根据权利要求1所述的用户画像构建方法, 其特征在于, 所述对所述多个电力用户的 画像源数据进行 预处理, 得到所述多个电力用户的处 理后画像源数据, 包括: 对所述多个电力用户的画像源数据进行数据清洗, 得到所述多个电力用户的清洗后源 数据, 其中, 所述数据 清洗用于删除所述画像源数据中的重复值和异常值, 并填充或插值所 述画像源数据中的缺失值; 对所述多个电力用户的清洗后源数据中的数值类数据进行标准化处理, 标准化处理后 的数据作为所述多个电力用户的处 理后画像源数据。 3.根据权利要求1所述的用户画像构建方法, 其特征在于, 任一电力用户的目标源数据 包括动态属性数据和静态属性数据, 所述动态属性数据是指所述缴费信息对应的目标源数 据, 所述静态属性数据是指所述基本信息对应的目标源数据; 所述对所述多个电力用户的目标源数据进行分组聚类, 得到 至少一个数据分组, 包括: 以所述静态属性数据为分组依据, 对所述多个电力用户的目标源数据进行分组聚类, 得到至少一个第一数据分组; 以所述动态属性数据为分组依据, 基于所述动态属性数据对应的预设阈值对所述多个 电力用户的目标源数据进行分组聚类, 得到 至少一个第二数据分组。 4.根据权利要求1所述的用户画像构建方法, 其特征在于, 所述目标源数据包括多个维 度的数据; 所述确定所述至少一个数据分组分别对应的用户标签, 包括: 对所述至少一个数据分组进行各维度 数据的分析再聚类, 得到所述至少一个数据分组 分别对应的用户标签。 5.根据权利要求4所述的用户画像构建方法, 其特征在于, 所述根据所述至少一个数据 分组分别对应的用户标签, 确定所述多个电力用户分别对应的用户标签集 合, 包括: 对于所述至少一个数据分组中的每个数据分组, 将该数据分组对应的用户标签作为该 数据分组对应的每 个电力用户所对应的用户标签; 获取所述多个电力用户的日常生活相关信 息, 并根据所述多个电力用户的日常生活相 关信息, 生成所述多个电力用户分别对应的用户标签;权 利 要 求 书 1/2 页 2 CN 115062087 A 2针对所述多个电力用户中的每个电力用户, 由该电力用户对应的所有用户标签组成该 电力用户对应的用户标签集 合, 以得到所述多个电力用户分别对应的用户标签集 合。 6.根据权利要求1所述的用户画像构建方法, 其特征在于, 所述基本信 息包括以下信 息 中的一个或多个: 对应电力用户的户号、 性别、 姓名、 年龄、 所在地区和电力用户类别; 所述缴费信 息包括以下信 息中的一个或多个: 对应电力用户的缴费渠道、 缴费日期、 缴 费金额和缴费地 点。 7.根据权利要求1所述的用户画像构建方法, 其特 征在于, 还 包括: 使用Hbase数据库存储所述多个电力用户的画像源数据, 和/或, 使用Mysql数据库存储 所述多个电力用户分别对应的用户标签集 合。 8.一种用户画像构建装置, 其特 征在于, 包括: 画像源数据获取模块, 用于从基础数据平台中获取多个电力用户的画像源数据, 其中, 所述基础数据 平台用于为线下业务的办理过程提供服务, 所述画像源数据包括对应电力用 户的基本信息和缴费信息; 预处理模块, 用于对所述多个电力用户的画像源数据进行预处理, 得到所述多个电力 用户的处理后画像源 数据, 作为所述多个电力用户的目标源数据, 其中, 所述目标源数据用 于表征对应电力用户在办理所述线下业 务时的真实需求; 分组聚类模块, 用于对所述多个电力用户的目标源数据进行分组聚类, 得到至少一个 数据分组, 其中, 任一数据分组中包括至少一个电力用户的目标源数据; 用户标签确定模块, 用于确定所述至少一个数据分组分别对应的用户标签; 用户画像构建模块, 用于根据所述至少一个数据分组分别对应的用户标签, 确定所述 多个电力用户分别对应的用户标签集合, 将所述多个电力用户分别对应的用户标签集合作 为所述多个电力用户分别对应的用户画像。 9.一种用户画像构建 设备, 其特 征在于, 包括存 储器和处 理器; 所述存储器, 用于存 储程序; 所述处理器, 用于执行所述程序, 实现如权利要求1~7任一项所述的用户画像构建方 法的各个步骤。 10.一种可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序被处理 器执行时, 实现如权利要求1~7任一项所述的用户画像构建方法的各个步骤。权 利 要 求 书 2/2 页 3 CN 115062087 A 3

PDF文档 专利 一种用户画像构建方法、装置、设备和介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种用户画像构建方法、装置、设备和介质 第 1 页 专利 一种用户画像构建方法、装置、设备和介质 第 2 页 专利 一种用户画像构建方法、装置、设备和介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 01:02:14上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。