全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210465473.3 (22)申请日 2022.04.29 (71)申请人 浙江大华 技术股份有限公司 地址 310051 浙江省杭州市滨江区滨安路 1187号 (72)发明人 操涛涛 王龙 刘伟棠 陈立力  周明伟  (74)专利代理 机构 杭州华进联浙知识产权代理 有限公司 3 3250 专利代理师 何晓春 (51)Int.Cl. G06F 16/2453(2019.01) G06F 16/2455(2019.01) G06K 9/62(2022.01) (54)发明名称 数据对标 方法、 装置、 电子装置和存 储介质 (57)摘要 本申请涉及一种数据对标方法、 装置、 电子 装置和存储介质。 其中, 该数据对标方法包括: 获 取数据项和多个多维度检索策略; 将数据项输入 到多个多维度检索策略中, 得到数据项在每个多 维度检索策略中的第一检索结果, 其中, 第一检 索结果包括: 多个数据元和多个数据元与数据项 的相似度; 根据每个第一检索结果中的每个数据 元与数据项的相似度, 确定每个数据元的置信 度; 根据每个数据元的置信度, 对数据项进行对 标。 通过本申请, 解决了相关技术中数据元对标 准确率低的问题, 提高了数据元对标准确率。 权利要求书2页 说明书9页 附图2页 CN 114942941 A 2022.08.26 CN 114942941 A 1.一种数据对标 方法, 其特 征在于, 包括: 获取数据项和多个多维度检索策略; 将所述数据项输入到多个所述多维度检索策略中, 得到所述数据项在每个所述多维度 检索策略中的第一检索结果, 其中, 所述第一检索结果包括: 多个数据元, 以及每个所述数 据元与所述数据项的相似度; 根据每个所述第 一检索结果中的每个所述数据元与所述数据项的相似度, 确定每个所 述数据元的置信度; 根据每个所述数据元的置信度, 对所述数据项 进行对标。 2.根据权利要求1所述的数据对标方法, 其特征在于, 所述数据项包括以下至少之一: 所述数据项的名称信息、 所述数据项的注释信息、 所述数据项的数据内容信息; 所述多维度 检索策略包括以下至少之一: 数据元的名称信息、 数据元的注释信息、 数据元的数据内容信 息。 3.根据权利要求1所述的数据对标方法, 其特征在于, 根据每个所述第 一检索结果中的 每个所述数据元与所述数据项的相似度, 确定每 个所述数据元的置信度包括: 根据每个所述第 一检索结果中的每个所述数据元与所述数据项的相似度, 以及每个所 述多维度检索策略的预设权 重, 确定每 个所述第一检索结果中的每 个所述数据元的权 重; 根据每个所述第 一检索结果中的每个所述数据元的权重, 确定每个所述数据 元的置信 度。 4.根据权利要求3所述的数据对标方法, 其特征在于, 根据每个所述第 一检索结果中的 每个所述数据元的权 重, 确定每 个所述数据元的置信度包括: 基于多个所述多维度检索策略的数量、 以及每个所述数据 元在每个检测结果出现的次 数, 确定每 个所述数据元的召回频率; 根据所述数据 元的召回频率和每个所述第 一检索结果中的每个所述数据 元的权重, 确 定每个所述数据元的置信度。 5.根据权利要求3所述的数据对标 方法, 其特 征在于, 所述方法还 包括: 获取带预设标签的数据项; 将所述带预设标签的数据项输入到多个所述多维度检索策略中, 得到所述带预设标签 的数据项在每 个所述多维度检索策略中的第二检索结果, 所述第二检索结果包括: 数据元; 确定每个所述多维度检索策略中的第二检索结果中的数据元携带所述预设标签的数 量; 基于每个所述多维度检索策略中的第二检索结果中的数据元携带所述预设标签的第 一数量和每个所述多维度检索策略中的第二检索结果中的数据元的第二数量, 确定每个所 述多维度检索策略的召回频率; 根据每个所述多维度检索策略的召回频率, 调整每 个所述多维度检索策略的权 重。 6.根据权利要求1所述的数据对标方法, 其特征在于, 根据每个所述数据元的置信度, 对所述数据项 进行对标包括: 将多个所述数据 元的置信度按照从大到小进行排序, 并按照从大到小的顺序选取预设 数量的数据元; 根据所述预设数量的数据元, 对所述数据项 进行对标。权 利 要 求 书 1/2 页 2 CN 114942941 A 27.根据权利要求1所述的数据对标方法, 其特征在于, 根据每个所述第 一检索结果中的 每个所述数据元与所述数据项的相似度, 确定每个所述数据元的置信度之后, 所述方法还 包括: 显示每个所述数据元的置信度。 8.一种数据对标装置, 其特 征在于, 包括: 第一获取模块, 用于获取 数据项和多个多维度检索策略; 第一输入模块, 用于将所述数据项输入到多个所述多维度检索策略中, 得到所述数据 项在每个所述多维度检索策略中的第一检索结果, 其中, 所述第一检索结果包括: 多个数据 元, 以及每 个所述数据元与所述数据项的相似度; 第一确定模块, 用于根据每个所述第 一检索结果中的每个所述数据元与所述数据项的 相似度, 确定每 个所述数据元的置信度; 对标模块, 用于根据每 个所述数据元的置信度, 对所述数据项 进行对标。 9.一种电子装置, 包括存储器和处理器, 其特征在于, 所述存储器中存储有计算机程 序, 所述处理器被设置为运行所述计算机程序以执行权利要求1至7中任一项 所述的数据对 标方法。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现权利要求1至7中任一项所述的数据对标 方法的步骤。权 利 要 求 书 2/2 页 3 CN 114942941 A 3

.PDF文档 专利 数据对标方法、装置、电子装置和存储介质

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据对标方法、装置、电子装置和存储介质 第 1 页 专利 数据对标方法、装置、电子装置和存储介质 第 2 页 专利 数据对标方法、装置、电子装置和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 00:14:58上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。