全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210857087.9 (22)申请日 2022.07.21 (71)申请人 深圳市小赢信息技 术有限责任公司 地址 518000 广东省深圳市前海深港合作 区前湾一路1号A栋201室 (入驻深圳市 前海商务秘书 有限公司) (72)发明人 马林 吴丹  (74)专利代理 机构 深圳中一联合知识产权代理 有限公司 4 4414 专利代理师 李艳丽 (51)Int.Cl. G06Q 40/02(2012.01) G06F 16/29(2019.01) (54)发明名称 一种地址编码的生成方法、 装置、 电子设备 及存储介质 (57)摘要 本申请适用于数据处理技术领域, 提供了一 种地址编码的生成方法、 装置、 电子设备及存储 介质, 方法包括: 响应于目标地址的编码请求, 生 成目标地址的标准化分级结构; 将所有标准化分 析结构中的第一地址分级导入预设的逻辑回归 模型, 确定第二地址分级的先验概率; 通过基于 高基数经验贝叶斯算法构建的地址评分模型, 确 定第二地址分级的后验概率; 根据先验概率以及 后验概率, 确定第二地址分级的第二地址评分; 基于第二地址评分以及第一地址分级的第一地 址评分, 确定目标地址的地址编码。 采用上述方 法能够弥补样本数较小而导致统计变量的方差 较大的缺陷, 进而提高了计算得到的地址评分与 实际情况的吻合度, 从而提高了管理效率。 权利要求书2页 说明书16页 附图8页 CN 115082226 A 2022.09.20 CN 115082226 A 1.一种地址编码的生成方法, 其特 征在于, 包括: 响应于目标地址的编码请求, 生成所述目标地址的标准化分级结构; 所述标准化分级 结构包括多个地址分级; 将所有标准化分析结构中的第 一地址分级导入预设的逻辑 回归模型, 确定第 二地址分 级的先验概率; 所述第一地址分级为地址划分粒度大于粒度阈值的地址分级; 所述第二地 址分级为 地址划分粒度小于或等于粒度阈值的地址分级; 通过基于高基数经验贝叶斯算法构建的地址评分模型, 确定所述第 二地址分级的后验 概率; 根据所述先验概 率以及所述后验概 率, 确定所述第二 地址分级的第二 地址评分; 基于所述第 二地址评分以及所述第 一地址分级的第 一地址评分, 确定所述目标地址的 地址编码。 2.根据权利要求1所述的生成方法, 其特征在于, 在所述通过基于高基数经验贝叶斯算 法构建的地址 评分模型, 确定所述第二 地址分级的后验概 率之前, 还 包括: 获取用户数据库内多个样本用户的用户特征信 息; 所述用户特征信 息包含所述样本用 户的身份 证信息以及用户评价记录; 根据所述身份证信 息中记录的登记地址所属的所述地址分级, 将所有所述样本用户划 分为多个用户组; 每 个所述用户组对应一个所述 地址分级; 基于所述用户组内所述样本用户的用户评价记录, 确定所述用户组对应的地址分级的 统计特征值; 基于所有所述 地址分级的所述统计特 征值, 构建所述 地址评分模型。 3.根据权利要求2所述的生成方法, 其特征在于, 在所述获取用户数据库内多个样本用 户的用户特 征信息之后, 还 包括: 若所述身份证信 息中存在地址缺失的第 三地址分级, 则在所述身份证信 息中确定地址 划分粒度小于所述第三 地址分级的第四地址分级; 根据所述第四地址分级所属的地址区域, 补充所述第三 地址分级; 根据补充后的所述第三 地址分级以及所述第四地址分级, 生成所述登记地址 。 4.根据权利要求1所述的生成方法, 其特征在于, 在所述将所有标准化分析结构中的第 一地址分级导入预设的逻辑回归 模型, 确定第二 地址分级的先验概 率之前, 还 包括: 将地址划分粒度 大于所述第 二地址分级, 且地址划分粒度最接近的所述第 一地址分级 作为先验地址分级; 获取所述先验地址分级的多个历史评分记录, 以及获取所述第 二地址分级对应的第 三 方数据; 基于高基数经验贝叶斯算法对所有所述历史评分记录以及所述第三方数据进行特征 建模, 生成所述第二 地址分级所述逻辑回归 模型。 5.根据权利要求4所述的生成方法, 其特征在于, 所述根据 所述先验概率以及所述后验 概率, 确定所述第二 地址分级的第二 地址评分, 包括: 确定所有所述历史评分记录中的历史地址属于所述第二 地址分级的第一记录个数; 根据所述记录个数确定所述后验概率的第 一概率权重, 并根据 所述第一概率权重确定 所述先验概 率的第二 概率权重;权 利 要 求 书 1/2 页 2 CN 115082226 A 2基于所述第一 概率权重对所述后验概 率进行加权计算, 得到补正后验概 率; 基于所述第二 概率权重对所述先验概 率进行加权计算, 得到补正先验概 率; 根据所述补正先验概 率以及所述补正后验概 率, 计算所述第二 地址评分。 6.根据权利要求1 ‑5任一项所述的生成方法, 其特征在于, 所述粒度阈值为区级地址分 级; 所述地址分级包括区级地址分级以及街道地址分级; 对应地, 所述根据所述先验概率以及所述后验概率, 确定所述第二地址分级的第二地 址评分, 还包括: 将所述区级地址分级的区级后验概率以及区级先验概率, 计算所述区级地址分级对应 的区级地址 评分; 根据所述区级地址 评分计算所述 街道地址分级的街道先验概 率; 根据所述街道先验概率以及所述街道地址分级的街道后验概率, 计算所述街道地址分 级对应的街道地址 评分。 7.根据权利要求1 ‑5任一项所述的生成方法, 其特征在于, 在所述将所有标准化分析结 构中的第一地址分级导入预设的逻辑回归模型, 确定第二地址分级的先验概率之前, 还包 括: 获取各个所述 地址分级的用户评价记录的第二记录个数; 若任一地址分级的所述第 二记录个数小于预设的高基数阈值, 则将所有所述第 二记录 个数小于所述高基数阈值的所述任一 地址分级, 识别为所述第二 地址分级。 8.一种地址编码的生成装置, 其特 征在于, 包括: 目标地址确定单元, 用于响应于目标地址的编码请求, 生成所述目标地址的标准化分 级结构; 所述标准 化分级结构包括多个地址分级; 先验概率计算单元, 用于将所有标准化分析结构中的第 一地址分级导入预设的逻辑 回 归模型, 确定第二地址分级的先验概率; 所述第一地址分级为地址划分粒度大于粒度阈值 的地址分级; 所述第二 地址分级为 地址划分粒度小于或等于粒度阈值的地址分级; 后验概率计算单元, 用于通过基于高基数经验贝叶斯算法构建的地址评分模型, 确定 所述第二 地址分级的后验概 率; 地址评分单元, 用于根据所述先验概率以及所述后验概率, 确定所述第二地址分级的 第二地址评分; 地址编码单元, 用于基于所述第二地址评分 以及所述第一地址分级的第一地址评分, 确定所述目标地址的地址编码。 9.一种电子设备, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器上 运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求1至7 任一项所述的方法。 10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在 于, 所述计算机程序被处 理器执行时实现如权利要求1至7任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115082226 A 3

PDF文档 专利 一种地址编码的生成方法、装置、电子设备及存储介质

文档预览
中文文档 27 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种地址编码的生成方法、装置、电子设备及存储介质 第 1 页 专利 一种地址编码的生成方法、装置、电子设备及存储介质 第 2 页 专利 一种地址编码的生成方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:16:08上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。