全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210770677.8 (22)申请日 2022.06.30 (71)申请人 杭州数梦 工场科技有限公司 地址 310024 浙江省杭州市转塘科技经济 区块16号 4幢326室 (72)发明人 郭思源  (74)专利代理 机构 北京博思佳知识产权代理有 限公司 1 1415 专利代理师 王剑 (51)Int.Cl. G06F 16/25(2019.01) G06F 16/29(2019.01) G06F 16/22(2019.01) G06K 9/62(2022.01) (54)发明名称 一种数据表转换方法、 装置、 电子设备及存 储介质 (57)摘要 本申请提供一种数据表转换方法、 装置、 电 子设备及存储介质, 应用于数据治理平台; 所述 方法包括: 根据治理表中的目标字段的字段属性 与源表包含的各个字段的字段属性之间的相似 度, 从所述源表包含的各个字段的字段属性中确 定出与所述目标字段的字段属性匹配的目标字 段属性; 根据所述源表包含的字段的字段属性和 源表包含的字段的字段类型对应的标准字段类 型之间第一对应 关系, 将与所述目标字段属性对 应的标准字段类型确定为与所述目标字段匹配 的目标标准字段类型; 根据所述目标标准字段类 型在所述目的表中映射的字段类型, 将所述治理 表中的所述目标字段存储在所述目的表中。 由 此, 在数据治理场景下可以提高治理表转换为目 的表的效率。 权利要求书2页 说明书14页 附图2页 CN 115129777 A 2022.09.30 CN 115129777 A 1.一种数据表转换方法, 其特征在于, 应用于数据治理平台; 所述数据治理平台用于将 源表转换为治理表, 以及将所述治理表转换为 目的表; 所述数据治理平台存储了所述源表 包含的字段 的字段属 性和所述源表包含的字段 的字段类型对应的标准字段类型之间的第 一对应关系; 所述方法包括: 根据所述治理表中的目标字段的字段属性与所述源表包含的各个字段的字段属性之 间的相似度, 从所述源表包含的各个字段的字段属性中确定出与所述目标字段的字段属性 匹配的目标字段属性; 根据所述第 一对应关系, 将与所述目标字段属性对应的标准字段类型确定为与所述目 标字段匹配的目标 标准字段类型; 根据所述目标标准字段类型在所述目的表中映射的字段类型, 将所述治理表中的所述 目标字段存 储在所述目的表中。 2.根据权利要求1所述的方法, 其特征在于, 所述根据所述治理表中的目标字段的字段 属性与所述源表包含的各个字段的字段属性之 间的相似度, 从所述源表包含的各个字段的 字段属性中确定出与所述目标字段的字段属性匹配的目标字段属性, 包括: 分别计算所述治理表中的目标字段的字段属性与所述源表包含的各个字段的字段属 性之间的相似度; 从所述源表包含的各个字段的字段属性中, 将与 所述目标字段的字段属性之间的相似 度达到第一阈值的字段属性, 确定为与所述目标字段的字段属性匹配的目标字段属性。 3.根据权利要求2所述的方法, 其特征在于, 所述字段属性包括: 字段名称、 和/或字段 注释。 4.根据权利要求1所述的方法, 其特征在于, 所述数据治理平台存储了与各个数据库类 型分别关联的第二对应关系; 所述第二对应关系包括标准字段类型和标准字段类型在所述 目的表中映射的字段类型之间的对应关系; 在根据所述目标标准字段类型在所述目的表中映射的字段类型在所述目的表中映射 的字段类型, 将所述治理表中的所述目标字段存 储在所述目的表中之前, 所述方法还 包括: 根据与所述目的表对应的目的数据库的数据库类型关联的第 二对应关系, 确定所述目 标标准字段类型在所述目的表中映射的字段类型。 5.根据权利要求1所述的方法, 其特征在于, 在根据 所述治理表中的目标字段的字段属 性与所述源表包含的各个字段的字段属性之间的相似度, 从所述源表包含的各个字段的字 段属性中确定出与所述目标字段的字段属性匹配的目标字段属性之前, 所述方法还 包括: 获取由用户预 先配置的所述第一对应关系; 或者, 基于所述源表自动创建所述第一对应关系。 6.根据权利要求5所述的方法, 其特征在于, 所述数据治理平台存储了与各个数据库类 型分别关联的第三对应关系; 所述第三对应关系包括所述源表包含的字段的字段类型和标 准字段类型之间的对应关系; 所述基于所述源表自动创建所述第一对应关系, 包括: 根据与源数据库的数据库类型关联的第 三对应关系, 确定与 所述源表包含的各个字段 的字段类型分别对应的标准字段类型; 根据所述源表包含的各个字段的字段属性、 和与 所述源表包含的各个字段的字段类型权 利 要 求 书 1/2 页 2 CN 115129777 A 2分别对应的标准字段类型, 创建所述第一对应关系。 7.根据权利要求1所述的方法, 其特征在于, 所述源表包含的字段的字段类型至少包括 地理字段类型; 在将所述源表转换为所述治理表的过程中, 将所述源表包含的地理字段类 型的字段以字符串字段类型存 储在所述治理表中。 8.一种数据表转换装置, 其特征在于, 应用于数据治理平台; 所述数据治理平台用于将 源表转换为治理表, 以及将所述治理表转换为 目的表; 所述数据治理平台存储了所述源表 包含的字段 的字段属 性和所述源表包含的字段 的字段类型对应的标准字段类型之间的第 一对应关系; 所述装置包括: 第一确定单元, 用于根据所述治理表中的目标字段的字段属性与所述源表包含的各个 字段的字段属性之 间的相似度, 从所述源表包含的各个字段的字段属性中确定出与所述目 标字段的字段属性匹配的目标字段属性; 第二确定单元, 用于根据所述第一对应关系, 将与所述目标字段属性对应的标准字段 类型确定为与所述目标字段匹配的目标 标准字段类型; 转换单元, 用于根据所述目标标准字段类型在所述目的表中映射的字段类型, 将所述 治理表中的所述目标字段存 储在所述目的表中。 9.一种电子设备, 其特征在于, 包括通信接口、 处理器、 存储器和总线, 所述通信接口、 所述处理器和所述存 储器之间通过总线相互连接; 所述存储器中存储机器可读指令, 所述处理器通过调用所述机器可读指令, 执行权利 要求1至7任一项所述的方法。 10.一种机器可读存储介质, 其特征在于, 所述机器可读存储介质存储有机器可读指 令, 所述机器可读指令在被处 理器调用和执 行时, 实现权利要求1至7任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115129777 A 3

PDF文档 专利 一种数据表转换方法、装置、电子设备及存储介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种数据表转换方法、装置、电子设备及存储介质 第 1 页 专利 一种数据表转换方法、装置、电子设备及存储介质 第 2 页 专利 一种数据表转换方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 01:02:16上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。