全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210103612.8 (22)申请日 2022.01.24 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦二层 (72)发明人 雷谦 李鸿宇 万志文 姚后清  (74)专利代理 机构 北京清亦华知识产权代理事 务所(普通 合伙) 11201 代理人 杜月 (51)Int.Cl. G06F 40/30(2020.01) G06K 9/62(2022.01) G06F 16/35(2019.01) G06F 40/216(2020.01) (54)发明名称 热点数据 的处理方法、 装置、 电子设备及存 储介质 (57)摘要 本公开提出了一种热点数据的处理方法、 装 置、 电子设备及存储介质, 涉及计算机技术领域, 尤其涉及数据分析等人工智能技术领域, 具体实 现方案为: 从多个新闻平台中, 获取多个热点数 据, 其中, 每个所述热点数据中包括热点话题及 所述热点话题对应的参考热度值; 确定各热点话 题间的语义相似度; 根据所述各热点话题间的语 义相似度, 对各所述热点话题进行去重, 以确定 目标话题; 根据所述目标话题对应的所述参考热 度值, 生成当前的综合热点话题列表。 由此, 实现 了对不同新闻平台的热点话题的汇总及融合, 方 便用户快速、 全面了解当前的热门话题。 权利要求书3页 说明书12页 附图3页 CN 114417886 A 2022.04.29 CN 114417886 A 1.一种热点数据的处 理方法, 包括: 从多个新闻平台中, 获取多个热点数据, 其中, 每个所述热点数据中包括热点话题及所 述热点话题对应的参 考热度值; 确定各热点话题间的语义相似度; 根据所述各 热点话题间的语义相似度, 对各 所述热点 话题进行去重, 以确定目标话题; 根据所述目标话题对应的所述 参考热度值, 生成当前的综合热点 话题列表。 2.如权利要求1所述的方法, 其中, 所述根据所述各热点话题间的语义相似度, 对各所 述热点话题进行去重, 以确定目标话题, 包括: 响应于任一热点话题与其他热点话题间的语义相似度均小于 阈值, 确定所述任一热点 话题为所述目标话题; 响应于多个热点话题间的语义相似度 大于或等于所述阈值, 确定所述多个热点话题中 的任一个热点 话题为所述目标话题。 3.如权利要求2所述的方法, 其中, 所述热点数据还包括所述热点话题对应的优先级, 所述确定所述多个热点 话题中的任一个热点 话题为所述目标话题, 包括: 确定所述多个热点 话题中优先级最高的热点 话题为所述目标话题。 4.如权利要求1-3任一所述的方法, 其中, 所述热点数据还包括所述热点话题对应的 新闻平台标识, 所述根据所述 目标话题对应的所述参考热度值, 生成当前 的综合热点话题 列表, 包括: 确定所述 新闻平台标识对应的新闻平台与搜索平台间的热度值映射关系; 根据所述目标话题对应的所述参考热度值及所述热度值映射关系, 确定所述目标话题 对应的目标 热度值; 根据所述目标话题对应的所述目标 热度值, 生成所述综合热点 话题列表。 5.如权利要求4所述的方法, 其中, 所述热点数据还包括所述热点话题对应的第 一话题 类型, 所述确定所述 新闻平台标识对应的新闻平台与搜索平台间的热度值映射关系, 包括: 确定所述 新闻平台标识对应的新闻平台与所述搜索平台间的初始热度值映射关系; 确定所述 新闻平台标识关联的话题类型与第一 参数的映射关系; 根据所述目标话题对应的所述第一话题类型, 及所述话题类型与第一参数的映射关 系, 确定所述目标话题对应的第一 参数; 将所述目标话题输入分类模型, 以获取所述目标话题在所述搜索平台上的第 二话题类 型; 根据所述第二话题类型, 以及所述搜索平台关联的话题类型与第二参数的映射关系, 确定所述目标话题对应的第二 参数; 根据所述初始热度值映射关系、 所述第一参数及所述第二参数, 确定所述热度值映射 关系。 6.一种热点数据的处 理装置, 包括: 获取模块, 用于从多个新闻平台中, 获取多个热点数据, 其中, 每个所述热点数据中包 括热点话题及所述热点 话题对应的参 考热度值; 第一确定模块, 用于确定各 热点话题间的语义相似度; 第二确定模块, 用于根据所述各热点话题间的语义相似度, 对各所述热点话题进行去权 利 要 求 书 1/3 页 2 CN 114417886 A 2重, 以确定目标话题; 生成模块, 用于根据所述目标话题对应的所述参考热度值, 生成当前的综合热点话题 列表。 7.如权利要求6所述的装置, 其中, 所述第二确定模块包括: 第一确定单元, 用于响应于任一热点话题与其他热点话题间的语义相似度均小于阈 值, 确定所述任一热点 话题为所述目标话题; 第二确定单元, 用于响应于多个热点话题间的语义相似度大于或等于所述阈值, 确定 所述多个热点 话题中的任一个热点 话题为所述目标话题。 8.如权利要求7所述的装置, 其中, 所述热点数据还包括所述热点话题对应的优先级, 所述第二确定单 元用于: 确定所述多个热点 话题中优先级最高的热点 话题为所述目标话题。 9.如权利要求6-8任一所述的装置, 其中, 所述热点数据还包括所述热点话题对应的 新闻平台标识, 所述 生成模块包括: 第三确定单元, 用于确定所述新闻平台标识对应的新闻平台与搜索平台间的热度值映 射关系; 第四确定单元, 用于根据所述目标话题对应的所述参考热度值及所述热度值映射关 系, 确定所述目标话题对应的目标 热度值; 生成单元, 用于根据所述目标话题对应的所述目标热度值, 生成所述综合热点话题列 表。 10.如权利要求9所述的装置, 其中, 所述热点数据还包括所述热点话题对应的第一话 题类型, 所述第三确定单 元用于: 确定所述 新闻平台标识对应的新闻平台与所述搜索平台间的初始热度值映射关系; 确定所述 新闻平台标识关联的话题类型与第一 参数的映射关系; 根据所述目标话题对应的所述第一话题类型, 及所述话题类型与第一参数的映射关 系, 确定所述目标话题对应的第一 参数; 将所述目标话题输入分类模型, 以获取所述目标话题在所述搜索平台上的第 二话题类 型; 根据所述第二话题类型, 以及所述搜索平台关联的话题类型与第二参数的映射关系, 确定所述目标话题对应的第二 参数; 根据所述初始热度值映射关系、 所述第一参数及所述第二参数, 确定所述热度值映射 关系。 11.一种电子设备, 包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的指令, 所述指令被所述至少一个处 理器执行, 以使所述至少一个处 理器能够执 行权利要求1-5中任一项所述的方法。 12.一种存储有计算机指令的非瞬时计算机可读存储介质, 其中, 所述计算机指令用于 使所述计算机执 行权利要求1-5中任一项所述的方法。 13.一种计算机程序产品, 包括计算机程序, 所述计算机程序在被处理器执行时实现根权 利 要 求 书 2/3 页 3 CN 114417886 A 3

PDF文档 专利 热点数据的处理方法、装置、电子设备及存储介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 热点数据的处理方法、装置、电子设备及存储介质 第 1 页 专利 热点数据的处理方法、装置、电子设备及存储介质 第 2 页 专利 热点数据的处理方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:47上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。