全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210572841.4 (22)申请日 2022.05.25 (71)申请人 中国建设银行股份有限公司 地址 100033 北京市西城区金融大街25号 (72)发明人 丁水清 王晓鹏 杜智铨  (74)专利代理 机构 华进联合专利商标代理有限 公司 44224 专利代理师 黄恕 (51)Int.Cl. G06F 16/22(2019.01) G06F 40/205(2020.01) G06Q 30/02(2012.01) G06F 16/29(2019.01) G06F 21/31(2013.01) G06F 21/64(2013.01)G06F 16/215(2019.01) G06F 16/23(2019.01) G06F 16/28(2019.01) G06F 9/54(2006.01) (54)发明名称 商铺数据处理方法、 装置、 计算机设备和存 储介质 (57)摘要 本申请公开了一种商铺数据处理方法、 装 置、 计算机设备、 存储介质和计算机程序产品, 涉 及大数据数据处理技术领域, 所述方法包括: 获 取待处理的商铺数据表, 所述商铺数据表记录了 商铺标识和各 维度商铺数据的映射关系; 从所述 商铺数据表提取所述商铺标识的第一预设维度 的商铺数据, 从所述商铺数据表 提取所述商铺标 识的第二预设维度的商铺数据; 分别对所述第一 预设维度的商铺数据和所述第二预设维度的商 铺数据进行校验处理; 在校验通过后, 得到所述 商铺标识各维度的商铺数据, 将所述商铺标识各 维度的商铺数据导入数据库。 采用本方法能够提 高商铺数据处 理效率。 权利要求书3页 说明书12页 附图4页 CN 114880328 A 2022.08.09 CN 114880328 A 1.一种商铺数据处 理方法, 其特 征在于, 所述方法包括: 获取待处理的商铺数据表, 所述商铺数据表记录了商铺标识和各维度商铺数据的映射 关系; 从所述商铺数据表提取所述商铺标识的第 一预设维度的商铺数据, 从所述商铺数据表 提取所述商铺标识的第二预设维度的商铺数据; 分别对所述第一预设维度的商铺数据和所述第二预设维度的商铺数据进行 校验处理; 在校验通过后, 得到所述商铺标识各维度的商铺数据, 将所述商铺标识各维度的商铺 数据导入数据库。 2.根据权利要求1所述的方法, 其特征在于, 分别对所述第 一预设维度的商铺数据和所 述第二预设维度的商铺数据进行 校验处理, 包括: 将所述商铺标识的第 一预设维度的商铺数据写入第 一处理队列, 将所述商铺标识的第 二预设维度的商铺数据写入第二处 理队列; 采用异步生产者线程对所述第 一处理队列的所述第 一预设维度的商铺数据, 以及对所 述第二处 理队列的所述第二预设维度的商铺数据进行 校验处理。 3.根据权利要求2所述的方法, 其特征在于, 所述第 一处理队列的优先级大于所述第 二 处理队列的优先级, 所述采用异 步生产者线程对所述第一处理队列的所述第一预设维度的 商铺数据, 以及对所述第二处 理队列的所述第二预设维度的商铺数据进行 校验处理, 包括: 采用异步生产者线程, 对所述第 一处理队列的所述第 一预设维度的商铺数据进行校验 处理, 在所述第一预设维度的商铺数据校验完成后, 对所述第二处理队列的所述第二预设 维度的商铺数据进行 校验处理。 4.根据权利要求2所述的方法, 其特征在于, 处理所述第 一处理队列的异步生产者线程 的数量大于所述处 理所述第二处 理队列的异步 生产者线程的数量。 5.根据权利要求1所述的方法, 其特征在于, 所述第 一预设维度的商铺数据包括经纬度 信息; 对所述商铺标识的经纬度信息进行 校验处理的方式, 包括: 根据所述经纬度信 息调用地图应用, 通过所述地图应用获取所述经纬度信 息所指向的 第一地址; 将所述第一 地址与所述商铺数据表中所述商铺标识的第二 地址进行匹配; 若匹配, 则所述商铺标识的经纬度信息验证通过。 6.根据权利要求1所述的方法, 其特征在于, 所述第一预设维度的商铺数据包括POS信 息, 对所述商铺标识的POS信息进行 校验处理的方式, 包括: 根据所述POS信息, 调用数据库查找所述POS信息是否与数据库中已存储的商铺的POS 信息重复, 若所述POS信息与数据库中已存 储的商铺的POS信息 重复, 则校验不 通过。 7.根据权利要求1所述的方法, 其特征在于, 所述第 一预设维度的商铺数据包括商铺城 市代码, 对所述商铺标识的商铺城市代码进行 校验处理的方式, 包括: 根据所述商铺城市代码查找城市代码表, 确定所述商铺城市代码对应的第一城市; 将所述第一城市与所述商铺数据表中所述商铺标识的第二城市进行匹配; 若匹配, 则所述商铺城市代码校验通过。 8.根据权利要求1所述的方法, 其特征在于, 所述第 二预设维度的商铺数据包括商铺联 系电话、 商铺行业类型、 商铺简介信息、 商铺营业时间以及商铺热门指数中的至少一种;权 利 要 求 书 1/3 页 2 CN 114880328 A 2对所述商铺标识的第二预设维度的商铺数据进行 校验处理的方式, 包括: 获取所述第 二预设维度的商铺数据的校验规则, 根据所述校验规则对所述商铺标识的 第二预设维度的商铺数据进行校验处理, 所述校验规则包括字符类型和字符长度中的至少 一种。 9.一种商铺数据处 理装置, 其特 征在于, 所述装置包括: 商铺数据表获取模块, 用于获取待处理的商铺数据表, 所述商铺数据表记录了商铺标 识和各维度商铺数据的映射关系; 商铺数据提取模块, 用于从所述商铺数据表提取所述商铺标识的第 一预设维度的商铺 数据, 从所述商铺数据表提取 所述商铺标识的第二预设维度的商铺数据; 商铺数据校验模块, 用于分别对所述第 一预设维度的商铺数据和所述第 二预设维度的 商铺数据进行 校验处理; 商铺数据存储模块, 用于在校验通过后, 得到所述商铺标识各维度的商铺数据, 将所述 商铺标识各维度的商铺数据导入数据库。 10.根据权利要求9所述的装置, 其特征在于, 所述商铺数据校验模块, 还用于将所述商 铺标识的第一预设维度的商铺数据写入第一处理队列, 将所述商铺标识的第二预设维度的 商铺数据写入第二处理队列; 采用异步生产者线程对所述第一处理队列的所述第一预设维 度的商铺数据, 以及对所述第二处 理队列的所述第二预设维度的商铺数据进行 校验处理。 11.根据权利要求10所述的装置, 其特征在于, 所述商铺数据校验模块, 还用于采用异 步生产者线程, 对所述第一处理队列的所述第一预设维度的商铺数据进行校验处理, 在所 述第一预设维度的商铺数据校验完成后, 对所述第二处理队列的所述第二预设维度的商铺 数据进行校验处理, 所述第一处理队列的优先级大于所述第二处理队列的优先级, 处理所 述第一处理队列的异步生产者线程的数量大于所述处理所述第二处理队列的异步生产者 线程的数量。 12.根据权利要求9所述的装置, 其特征在于, 所述商铺数据校验模块, 还用于根据 所述 经纬度信息调用地图应用, 通过所述地图应用获取所述经纬度信息所指向的第一地址; 将 所述第一地址与所述商铺数据表中所述商铺标识的第二地址进行匹配; 若匹配, 则所述商 铺标识的经纬度信息验证通过, 所述第一预设维度的商铺数据包括经纬度信息 。 13.根据权利要求9所述的装置, 其特征在于, 所述商铺数据校验模块, 还用于根据 所述 POS信息, 调用数据库查找所述POS信息是否与数据库中已存储的商铺的POS信息重复, 若 所 述POS信息与数据库中已存储的商铺的POS信息重复, 则校验不通过, 所述第一预设维度的 商铺数据包括POS信息 。 14.根据权利要求9所述的装置, 其特征在于, 所述商铺数据校验模块, 还用于根据 所述 商铺城市代码查找城市代码表, 确定所述商铺城市代码对应的第一城市; 将所述第一城市 与所述商铺数据表中所述商铺标识的第二城市进行匹配; 若匹配, 则所述商铺城市代码校 验通过, 所述第一预设维度的商铺数据包括商铺城市代码。 15.根据权利要求9所述的装置, 其特征在于, 所述商铺数据校验模块, 还用于获取所述 第二预设维度的商铺数据的校验规则, 根据所述校验规则对所述商铺标识的第二预设维度 的商铺数据进行校验处理, 所述校验规则包括字符类型和字符长度中的至少一种, 所述第 二预设维度的商铺数据包括商铺联系电话、 商铺行业类型、 商铺简介信息、 商铺营业时间以权 利 要 求 书 2/3 页 3 CN 114880328 A 3

PDF文档 专利 商铺数据处理方法、装置、计算机设备和存储介质

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 商铺数据处理方法、装置、计算机设备和存储介质 第 1 页 专利 商铺数据处理方法、装置、计算机设备和存储介质 第 2 页 专利 商铺数据处理方法、装置、计算机设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:49:42上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。