全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211388080.3 (22)申请日 2022.11.08 (71)申请人 深圳长江家具有限公司 地址 518000 广东省深圳市龙华区龙华 街 道景龙社区人民路与建设路交汇处长 江中心39层 申请人 深圳平安综合金融服 务有限公司   广东省东莞 市质量监督检测中心 (72)发明人 邱冬 张强 王耀光 朱晓卿  郑晓彬 张超 滕厚雪 金喆  洪云强 江展威 孙倩 黄智华  敬军 林意强 吴林英 邹许红  (74)专利代理 机构 郑州知倍 通知识产权代理事 务所(普通 合伙) 41191 专利代理师 陈佳丽(51)Int.Cl. G06F 16/51(2019.01) G06N 5/02(2006.01) H03M 7/30(2006.01) G06T 9/00(2006.01) G06V 10/40(2022.01) G06V 10/762(2022.01) G06V 10/764(2022.01) G06V 10/77(2022.01) G06V 30/19(2022.01) (54)发明名称 用于离线终端的知识图谱压缩 存储方法 (57)摘要 本发明公开了用于离线终端的知识图谱压 缩存储方法, 涉及数据处理领域。 主要包括: 获取 家居知识图像, 根据家居知识图像得到各节点的 重要程度, 根据家居知识图像得到稀疏向量, 根 据稀疏向量得到起始点和可能终止点, 根据起始 点、 可能只知点和类别序列得到调整后稀疏向 量, 根据稀 疏向量和调整后稀 疏向量得到家居知 识图像、 调整后家居知识图像的识别程度, 根据 所述识别程度和各节点的重要程度得到可能终 止点的压缩损失程度, 根据可能终止点的压缩损 失程度得到起始点的终止点, 将起始点和终止点 得到压缩模块, 根据压缩模块进行压缩存储, 从 而实现在降低家居知识 图像存储数据量的同时 还能不影响对知识图像信息的识别。 权利要求书2页 说明书8页 附图1页 CN 115438205 A 2022.12.06 CN 115438205 A 1.用于离线终端的知识图谱压缩 存储方法, 其特 征在于, 包括: 获取家居知识图谱以及家居知识图像, 每张家居知识图像的每个节点包含多个独立 字; 根据每个节点的所有关联节点得到每个节点的重要性权重; 获得每个家居知识图像的 稀疏向量以及每 个稀疏向量的多个 类别序列; 设置第一序号的值为1, 对于稀疏向量的一个类别序列, 将类别序列中第 一序号位置处 的第一个数据记为 起始点; 根据类别序列以及起始点得到第一压缩 模块, 包括: 根据起始点和类别序列 得到起始点的可能终止点, 获取类别序列中起始点至可能终止 点之间的序列记为第一子序列, 根据第一子序列得到调整后家居知识图像, 根据调整后家 居知识图像得到每个独立字、 无损 独立字的识别程度, 根据每个节点的重要性权重和每个 独立字、 无损独立字的区分程度得到可能终止点的压缩损失影响程度, 根据压缩损失影响 程度进行终止点判定得到终止点; 将 类别序列中起始点与终止点之 间序列划分为第一压缩 模块, 将第一子序列的第一数据作为第一压缩模块的调整数, 将第一序号值加一; 将 类别序 列中第一序号处的数据作为 起始点; 重复执行根据类别序列以及起始点得到第 一压缩模块操作, 直至第 一序号大于类别序 列的长度时停止, 得到每 个类别序列的多个第一压缩 模块; 所有的类别序列的多个第 一压缩模块构 成第一压缩模块集合; 根据第 一压缩模块集合 进行压缩得到 压缩后稀疏向量并进行存 储。 2.根据权利要求1所述的用于离线终端的知识图谱压缩存储方法, 其特征在于, 所述根 据每个节点的所有关联节点得到每 个节点的重要性权 重的方法, 包括: 将每个节点记为第一节点, 将第一节点的关联节点记为第二节点, 将第一节点与第二 节点构成一个节点对, 获取第一节点至第二节点之间的所有的连接路径, 获取每条连接路 径通过边的个数记为每条连接路径的第一个数, 计算每条路径的第一个数的倒数记为每条 路径的第一倒数, 计算第一节点至第二节点所有路径的第一倒数的累加和作为第一节点与 第二节点的关联权 重, 即每个节点对的关联权 重; 将每个节点包含字符的个数作为每个节点的信 息量, 根据每个节点的信 息量和每个节 点对的关联权 重得到每 个节点的重要性权 重。 3.根据权利要求2所述的用于离线终端的知识图谱压缩存储方法, 其特征在于, 所述根 据每个节点的所有关联节点得到每 个节点的重要性权 重的公式为: 其中 表示第 节点与第 个节点构成的节点对的关联权重, 表示第 个节点的信息量, 表示第 节点的节点对的总个数, 表示第 个节点的重要 性权重, 即每个节点的重要 性权 重。 4.根据权利要求1所述的用于离线终端的知识图谱压缩存储方法, 其特征在于, 所述根 据第一子序列得到调整后家居知识图像的方法, 包括: 获取第一子序列所属的稀疏向量记为第 一稀疏向量, 计算第 一子序列中所有数据的均 值, 将均值向上取整得到第一数据, 将第一稀疏向量中的第一子序列上 的数据替换成第一权 利 要 求 书 1/2 页 2 CN 115438205 A 2数据且其他位置的数据保持不变得到调整后稀疏向量, 根据调整后稀疏向量得到调整后家 居知识图像。 5.根据权利要求1所述的用于离线终端的知识图谱压缩存储方法, 其特征在于, 所述根 据调整后家居知识图像得到每 个独立字、 无损独立字的识别程度的方法, 包括: 获取调整后家居知识图像的各节点的多个独立字, 将调整后家居知识图谱任一节点记 为研究节点, 将研究节点中任一独立字记为研究独立字, 在对应的家居知识图像中获取研 究独立字对应位置的字记为研究独立字的无损独立字; 获取标准字集合, 所述标准字集合中包含多个标准字, 将所述无损独立字与各标准字 进行匹配得到多个匹配值, 将所有匹配值按从大到小排列得到匹配值序列, 在 匹配值序列 中获取第一个位置次序的匹配值对应的标准字和第二个位置次序的匹配值对应的标准字 分别记为无损独立字的第一标准字和 第二标准字, 将所述第一标准字的匹配值与的匹配值 的商值记为所述无损独立字的识别程度; 同理计算研究独立字的识别程度, 即每 个独立字的识别程度。 6.根据权利要求1所述的用于离线终端的知识图谱压缩存储方法, 其特征在于, 所述根 据每个节点的重要性权重和每个独立字、 无损独立字的区分程度得到可能终止点的压缩损 失影响程度的方法, 包括: 将每个独立字的无损独立字的识别程度减去独立字的识别程度得到的差值作为每个 独立字的压缩损失影响程度, 所有独立字的压缩损失影响程度的累加和各节点的压缩损失 影响程度, 根据各节点的压缩损失影响程度和各节点的重要性权重得到家居知识图谱的压 缩损失影响程度的计算公式为: 其中 表示家居知识图谱中第 个节点的压缩损失影响程度, 表示家居知识图谱中第 个节点的重要性权重, 表示家居知识图谱中包含 的节点的个数, 表示家居知识图谱 的 压缩损失影响程度。权 利 要 求 书 2/2 页 3 CN 115438205 A 3

PDF文档 专利 用于离线终端的知识图谱压缩存储方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用于离线终端的知识图谱压缩存储方法 第 1 页 专利 用于离线终端的知识图谱压缩存储方法 第 2 页 专利 用于离线终端的知识图谱压缩存储方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:26:52上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。