全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211356607.4 (22)申请日 2022.11.01 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 马小明  (74)专利代理 机构 北京市通商律师事务所 11951 专利代理师 姜莹丽 许念如 (51)Int.Cl. G06V 10/762(2022.01) G06V 10/774(2022.01) G06V 10/74(2022.01) G06V 10/82(2022.01) (54)发明名称 POI信息挖掘方法、 装置、 设备及存 储介质 (57)摘要 本公开提供一种POI信息挖掘方法、 装置、 设 备及存储介质, 涉及人工智能技术领域, 具体涉 及图像处理、 文本处理、 深度学习等技术领域, 可 应用于POI信息检索服务、 门店招牌验真等场景 下。 具体实现方案包 括: 获取POI信息, POI信息包 括目标门店的招牌图像、 目标门店相关的文本; 确定招牌图像与 目标门店的招牌图像之间的相 似度最高的第一预设数量个第一品牌的第一得 分; 确定文本与目标门店相关的文本之间的相似 度最高的第二预设数量个第二品牌的第二得分; 根据第一得分和第二得分, 从第一品牌和第二品 牌中确定POI信息对应的目标品牌。 本公开可以 对品牌的POI信息进行智能化地挖掘, 实现成本 低、 且时效性高, 且能够大大提高POI信息的挖掘 召回率和准确率。 权利要求书4页 说明书13页 附图4页 CN 115512146 A 2022.12.23 CN 115512146 A 1.一种POI信息挖掘方法, 所述方法包括: 获取目标门店的POI信息, 所述POI信息包括所述目标门店的招牌 图像、 所述目标门店 相关的文本; 根据预设的招牌图像库, 确定招牌图像与 所述目标门店的招牌图像之间的相似度最高 的第一预设数量个第一品牌, 并根据所述第一品牌的招牌图像与所述目标门店的招牌图像 之间的相似度, 确定每个所述第一品牌的第一得分, 所述招牌图像库包括至少 两个品牌的 招牌图像; 根据预设的文本库, 确定文本与 所述目标门店相关的文本之间的相似度最高的第 二预 设数量个第二品牌, 并根据所述第二品牌相关的文本与所述目标门店相关的文本之 间的相 似度, 确定每 个所述第二品牌的第二得分, 所述文本库包括至少两个品牌相关的文本; 根据所述第 一得分和所述第 二得分, 确定所述第 一品牌和所述第 二品牌中每个品牌的 融合得分; 根据所述第 一品牌和所述第 二品牌中每个品牌的融合得分, 从所述第 一品牌和所述第 二品牌中确定所述目标门店的POI信息对应的目标品牌。 2.根据权利要求1所述的方法, 所述根据所述第 一得分和所述第 二得分, 确定所述第 一 品牌和所述第二品牌中每 个品牌的融合得分, 包括: 以所述第一得分所占的权重为第一权重、 所述第二得分所占的权重为第二权重, 对所 述第一品牌和所述第二品牌中每个品牌对应的所述第一得分和所述第二得分进行求和, 得 到所述第一品牌和所述第二品牌中每 个品牌的融合得分。 3.根据权利要求2所述的方法, 所述文本库包括至少两个, 每个所述文本库对应包括一 种类型的文本; 所述根据 预设的文本库, 确定文本与所述目标门店相关的文本之间的相似度最高的第 二预设数量个第二品牌, 包括: 分别根据每个所述文本库, 确定文本与 所述目标门店相关的文本之间的相似度最高的 第二预设数量个第二品牌, 得到 至少两种类型的第二预设数量个第二品牌; 所述根据 所述第二品牌相关的文本与所述目标门店相关的文本之间的相似度, 确定每 个所述第二品牌的第二得分, 包括: 对每种类型的所述第 二品牌, 根据 所述第二品牌相关的文本与 所述目标门店相关的文 本之间的相似度, 确定每 个所述第二品牌的第二得分。 4.根据权利要求3所述的方法, 对所述第一品牌和所述第二品牌中每个品牌对应的所 述第一得分和所述第二得分进 行求和时, 不同类型的所述第二品牌对应的所述第二得分所 占的权重不同。 5.根据权利要求3或4所述的方法, 所述类型包括以下至少两种: 评论类型、 推荐类型、 网络类型。 6.根据权利要求1 ‑5任一项所述的方法, 所述根据所述第一品牌的招牌图像与所述目 标门店的招牌图像之间的相似度, 确定每 个所述第一品牌的第一得分, 包括: 根据所述第 一品牌的招牌图像与 所述目标门店的招牌图像之间的相似度, 确定每个所 述第一品牌的相似度得分; 根据所述第 一预设数量个第 一品牌中属于同一品牌的第 一品牌的数量、 以及所述第 一权 利 要 求 书 1/4 页 2 CN 115512146 A 2预设数量, 确定每 个所述第一品牌的一 致性得分; 根据所述第一品牌的相似度得分和一 致性得分, 确定所述第一品牌的第一得分。 7.根据权利要求6所述的方法, 所述根据预设的招牌图像库, 确定招牌图像与 所述目标 门店的招牌图像之间的相似度最高的第一预设数量个第一品牌, 包括: 将所述目标门店的招牌图像输入预设的图像识别模型, 通过所述图像识别模型确定招 牌图像与所述目标门店的招牌图像相似的候选第一品牌、 以及每个所述候选第一品牌的置 信度, 所述图像识别模型 是采用所述招牌图像库训练得到的; 将所述候选第 一品牌的置信度作为相似度, 从所述候选第 一品牌中选择相似度最高的 第一预设数量个第一品牌。 8.根据权利要求1 ‑7任一项所述的方法, 所述根据所述第二品牌相关的文本与所述目 标门店相关的文本之间的相似度, 确定每 个所述第二品牌的第二得分, 包括: 根据所述第 二品牌相关的文本与 所述目标门店相关的文本之间的相似度, 确定每个所 述第二品牌的相似度得分; 根据所述第 二预设数量个第 二品牌中属于同一品牌的第 二品牌的数量、 以及所述第 二 预设数量, 确定每 个所述第二品牌的一 致性得分; 根据所述第二品牌的相似度得分和一 致性得分, 确定所述第二品牌的第二得分。 9.根据权利要求8所述的方法, 所述根据预设的文本库, 确定文本与 所述目标门店相关 的文本之间的相似度最高的第二预设数量个第二品牌, 包括: 将所述目标门店相关的文本输入预设的文本识别模型, 通过所述文本识别模型确定文 本与所述目标门店相关的文本相似的候选第二品牌、 以及每个所述候选第二品牌的置信 度, 所述文本识别模型 是采用所述文本库训练得到的; 将所述候选第 二品牌的置信度作为相似度, 从所述候选第 二品牌中选择相似度最高的 第二预设数量个第二品牌。 10.一种POI信息挖掘装置, 所述装置包括: 获取单元, 用于获取目标门店的P OI信息, 所述POI信息包括所述目标门店的招牌图像、 所述目标门店相关的文本; 图像处理单元, 用于根据预设的招牌图像库, 确定招牌图像与所述目标门店的招牌图 像之间的相似度最高的第一预设数量个第一品牌, 并根据所述第一品牌的招牌图像与所述 目标门店的招 牌图像之间的相似度, 确定每个所述第一品牌的第一得分, 所述招牌图像库 包括至少两个品牌的招牌图像; 文本处理单元, 用于根据预设的文本库, 确定文本与所述目标门店相关的文本之间的 相似度最高的第二预设数量个第二品牌, 并根据所述第二品牌相关的文本与所述目标门店 相关的文本之间的相似度, 确定每个所述第二品牌的第二得分, 所述文本库包括至少 两个 品牌相关的文本; 融合单元, 用于根据所述第一得分和所述第二得分, 确定所述第一品牌和所述第二品 牌中每个品牌的融合得分; 识别单元, 用于根据所述第一品牌和所述第二品牌中每个品牌的融合得分, 从所述第 一品牌和所述第二品牌中确定所述目标门店的POI信息对应的目标品牌。 11.根据权利要求10所述的装置, 所述融合单元, 具体用于以所述第 一得分所占的权重权 利 要 求 书 2/4 页 3 CN 115512146 A 3

PDF文档 专利 POI信息挖掘方法、装置、设备及存储介质

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 POI信息挖掘方法、装置、设备及存储介质 第 1 页 专利 POI信息挖掘方法、装置、设备及存储介质 第 2 页 专利 POI信息挖掘方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:26:47上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。