全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221096180 6.1 (22)申请日 2022.08.11 (66)本国优先权数据 202210890323.7 202 2.07.27 CN (71)申请人 生态环境部信息中心 地址 100029 北京市朝阳区育慧南路1号 (72)发明人 胡昊 陆楠 范丽娜 许雪洁  贾红霞 刘定 孙洁 张璇  马庆华  (74)专利代理 机构 北京远大卓悦知识产权代理 有限公司 1 1369 专利代理师 史霞 (51)Int.Cl. G06F 16/36(2019.01) G06Q 50/26(2012.01) (54)发明名称 污染场地知识图谱的构建方法和装置 (57)摘要 本发明实施例公开了污染场地知识图谱的 构建方法和装置。 所述方法, 包括: 获取污染场地 相关数据; 从所述污染场地相关数据中抽取实 体、 实体属性以及实体间关系, 所述实体至少用 于表示所述污染场地的企业情况、 生产活动情 况、 污染状况和土壤情况; 将所述实体、 实体属性 以及实体间关系向已构建的本体映射, 基于所述 实体以及所述实体间关系, 构建所述污染场地知 识图谱; 其中, 所述已构建的本体包括概念、 概念 属性以及概念间关系, 所述概念至少用于表示所 述污染场地的企业情况、 生产活动情况、 污染状 况和土壤情况。 基于该方法和装置, 其可 以基于 污染场地相关数据构建污染场地知识图谱, 以实 现对于污染场地相关数据的深入挖掘和 高效管 理。 权利要求书2页 说明书11页 附图5页 CN 115525766 A 2022.12.27 CN 115525766 A 1.一种污染场地知识图谱的构建方法, 其特 征在于, 包括: 获取污染场地相关数据; 从所述污染场地相关数据中抽取实体、 实体属性以及实体间关系, 所述实体至少用于 表示所述污染场地的企业情况、 生产活动情况、 污染状况和土壤情况; 将所述实体、 实体属性以及实体间关系向已构建的本体映射, 基于所述实体以及所述 实体间关系, 构建所述污染场地知识图谱; 其中, 所述已构建的本体包括概念、 概念属 性以 及概念间关系, 所述概念至少用于表 示所述污染场地的企业情况、 生产活动 情况、 污染状况 和土壤情况。 2.如权利要求1所述的污染场 地知识图谱的构建方法, 其特征在于, 所述知识图谱为基 于自顶向下的方式构建的, 和/或基于自底向上的方式构建的。 3.如权利要求1所述的污染场 地知识图谱的构建方法, 其特征在于, 所述从所述污染场 地相关数据中抽取实体以及实体间关系, 包括: 将所述污染场地相关数据中的半结构化数据转 化为结构化数据; 从所述污染场地相关数据中的结构化数据以及由所述半结构化数据转化的结构化数 据中抽取 所述实体以及所述实体间关系。 4.如权利要求1所述的污染场 地知识图谱的构建方法, 其特征在于, 所述从所述污染场 地相关数据中抽取实体、 实体属性以及实体间关系, 包括: 基于实体识别模型从所述污染场地相关数据的非结构化数据中抽取 所述实体; 基于模式匹配的方式从所述污染场地相关数据的非结构化数据中抽取实体属性以及 实体间关系。 5.如权利要求1所述的污染场地知识图谱的构建方法, 其特征在于, 所述将所述实体、 实体属性以及实体间关系向已构建的本体映射, 基于所述实体以及所述实体间关系, 构建 所述污染场地知识图谱之前, 所述方法包括: 确定所抽取的实体与实体之间的相似度; 基于预设的相似度判定条件, 将满足所述预设的相似度判定条件的实体识别为同一个 实体, 将不满足所述预设的相似度筛 选条件的实体识别为 不同的实体。 6.如权利要求4所述的污染场 地知识图谱的构建方法, 其特征在于, 所述确定所抽取的 实体与实体之间的相似度, 包括: 根据所抽取的每 个实体属性, 确定任意两个实体之间的属性相似度; 根据任意两个实体之间的属性相似度, 确定任意两个实体之间的相似度。 7.如权利要求1所述的污染场地知识图谱的构建方法, 其特 征在于, 所述方法还 包括: 接收查询指令, 基于所述查询指令在所述知识图谱中查询, 返回与所述查询指令对应 的关联图谱, 其中, 所述查询指 令至少包括目标污染物, 所述关联图谱包括所述目标污染物 相关的企业情况、 生产活动情况、 污染状况和土壤情况。 8.一种污染场地知识图谱的构建装置, 其特 征在于, 包括: 数据获取模块, 用于获取污染场地相关数据; 实体和关系抽取模块, 用于从所述污染场地相关数据中抽取实体、 实体属性以及实体 间关系, 所述 实体至少用于表 示所述污染场地的企业情况、 生产活动 情况、 污染状况和土壤 情况;权 利 要 求 书 1/2 页 2 CN 115525766 A 2知识图谱构建模块, 用于将所述实体、 实体属性以及实体间关系向已构建的本体映射, 基于所述实体以及所述 实体间关系, 构建所述污染场地知识图谱; 其中, 所述已构建的本体 包括概念、 概念属性以及概念间关系, 所述概念至少用于表 示所述污染场地的企业情况、 生 产活动情况、 污染状况和土壤情况。 9.一种电子设备, 其特征在于, 包括: 至少一个处理器, 以及与所述至少一个处理器通 信连接的存储器, 其中, 所述存储器存储有 可被所述至少一个处理器执行的指 令, 所述指 令 被所述至少一个处理器执行, 以使所述至少一个处理器执行权利要求1 ‑7中任一项所述的 方法。 10.一种存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器执行时, 实现 权利要求1 ‑7中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115525766 A 3

PDF文档 专利 污染场地知识图谱的构建方法和装置

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 污染场地知识图谱的构建方法和装置 第 1 页 专利 污染场地知识图谱的构建方法和装置 第 2 页 专利 污染场地知识图谱的构建方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:41:23上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。