全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210082422.2 (22)申请日 2022.01.24 (71)申请人 平安科技 (深圳) 有限公司 地址 518057 广东省深圳市福田区福田街 道福安社区益田路5033号平 安金融中 心23楼 (72)发明人 张跃威 文浩宇  (74)专利代理 机构 深圳市力道知识产权代理事 务所(普通 合伙) 44507 代理人 张传义 (51)Int.Cl. G06F 16/31(2019.01) G06F 16/33(2019.01) G06F 40/30(2020.01) G06F 16/387(2019.01)G06K 9/62(2022.01) (54)发明名称 事件的描述文本预测方法、 装置、 设备及存 储介质 (57)摘要 本申请提供一种事件的描述文本预测方法、 装置、 设备及计算机可读 存储介质, 该方法包括: 从源终端获取目标事件的事件描述文本; 对事件 描述文本进行语义解析, 得到关键动词和关键名 词; 基于事件关系树, 确定关键动词与事件关系 树中节点的第一节点匹配度; 根据第一节点匹配 度, 在事件关系树中确定目标节点, 得到目标第 一文本及目标第二文本; 确定目标第一文本中名 词与目标第二文本中名词的第一关联程度; 根据 第一关联程度和关键名词, 确定与关键名词对应 的目标名词; 根据目标名词对目标第二文本进行 名词替换处理, 得到目标描述文本, 并发送至目 标终端。 本申请还涉及区块链技术, 目标描述文 本可以存 储于区块链中。 权利要求书3页 说明书15页 附图3页 CN 114416912 A 2022.04.29 CN 114416912 A 1.一种事 件的描述文本预测方法, 其特 征在于, 包括: 从源终端获取目标事 件的事件描述文本; 对所述事 件描述文本进行语义 解析, 得到关键动词和关键名词; 基于事件关系树, 确定所述关键动词与所述事件关系树中节点的第一节点匹配度, 其 中, 所述节点用于指示第一文本及与所述第一文本对应的第二文本, 所述第一文本为原因 事件描述文本, 所述第二文本为结果事 件描述文本; 根据所述第一节点匹配度, 在所述事件关系树中确定目标节点, 得到所述目标节点所 指示的目标第一文本及目标第二文本; 基于预设的名词关系数据库, 确定所述目标第 一文本中名词与 所述目标第 二文本中名 词的第一关联程度; 基于预设的语义网络, 根据所述第一关联程度和所述关键名词, 确定与所述关键名词 对应的目标名词, 其中, 所述 目标名词与所述关键名词的第二关联程度大于或等于所述第 一关联程度; 根据所述目标名词对所述目标第二文本进行名词替换处理, 得到目标描述文本, 并将 目标描述文本发送至目标终端。 2.如权利要求1所述的事件的描述文本预测方法, 其特征在于, 所述基于事件关系树, 确定所述关键动词与所述事 件关系树中节点的第一节点匹配度, 包括: 获取所述事件关系树的各个节点对应的第一文本中的动词; 基于预设的余弦相似性算法, 对所述关键动词和所述第 一文本中的动词进行相似度计 算, 得到所述关键动词与各所述第一文本的相似度, 并将所述相似度作为所述关键动词与 所述节点的第一节点匹配度。 3.如权利要求1所述的事件的描述文本预测方法, 其特征在于, 所述事件关系树至少包 括两个层级, 所述 根据所述第一节点匹配度, 在所述事 件关系树中确定目标节点, 包括: 确定所述关键动词与所述事件关系树第N层的各个节点的第一节点匹配度, 其中, N为 大于0的自然数且N 不大于所述事 件关系树的总层数; 将第一节点匹配度大于节点匹配阈值的节点确定为待计算节点; 当N小于所述事件关系树的总层数时, 确定所述关键动词与所述待计算节点的子节点 的第二节点匹配度; 若所述待计算节点的子节点的第 二匹配度小于所述待计算节点的第 一匹配度, 根据 所 述待计算节点确定目标节点; 若所述待计算节点的子节点的第二匹配度大于所述待计算节点的第一匹配度, 将N加 1。 4.如权利要求1所述的事件的描述文本预测方法, 其特征在于, 所述基于预设的名词关 系数据库, 确定所述 目标第一文本中名词与所述 目标第二文本中名词的第一关联程度, 包 括: 获取所述目标第一文本中的第一名词, 以及获取 所述目标第二文本中的第二名词; 根据所述第一名词, 在所述名词关系数据库中确定多个待选名词三元组, 其中, 所述待 选名词三元组包 含与所述第一名词相同的名词; 确定所述待选名词三元组中是否存在所述第二名词;权 利 要 求 书 1/3 页 2 CN 114416912 A 2从存在所述第二名词的待选名词三元组中确定所述第一关联程度。 5.如权利要求1 ‑3任一项所述的事件的描述文本预测方法, 其特征在于, 在所述基于事 件关系树, 确定所述关键动词与所述事 件关系树中节点的第一节点匹配度之前, 还 包括: 获取样本事件对的描述文本数据集, 其中, 所述样本事件对包括样本第一文本及与样 本第一文本对应的样本第二文本, 所述样本第一文本为样本原因事件描述文本, 所述样本 第二文本为样本结果事 件描述文本; 根据样本事件对所包含的所述样本第 一文本以及所述样本第 二文本, 对多个所述样本 事件对进行聚类, 得到所述事 件关系树。 6.如权利要求5所述的事件的描述文本预测方法, 其特征在于, 所述根据样本事件对所 包含的所述样本第一文本以及所述样本第二文本, 对多个所述样本事件对进行聚类, 得到 所述事件关系树, 包括: 对所述样本第一文本进行向量化处理, 得到样本第一文本向量, 以及对所述样本第二 文本进行向量 化处理, 得到样本第二文本向量; 基于预设向量距离计算公式, 根据 各所述样本事件对对应的样本第 一文本向量和样本 第二文本向量, 确定各 所述样本事 件对之间的向量距离; 根据各所述样本事件对之间的向量距离, 将各所述样本事件对分类至多个事件对第 一 聚类中, 其中, 每 个所述事 件对第一聚类至少包括两个样本事 件对; 计算各所述事件对第 一聚类之间的向量距离, 并根据各所述事件对第 一聚类之间的向 量距离, 将各所述对第一聚类分类至多个事件对第二聚类中, 其中, 每个所述事件对第二聚 类至少包括两个所述事 件对第一聚类; 根据各所述事件对第一聚类和各 所述事件对第二聚类, 确定所述事 件关系树。 7.如权利要求6所述的事件的描述文本预测方法, 其特征在于, 所述根据 各所述样本事 件对之间的向量距离, 将各 所述样本事 件对分类至多个事 件对第一聚类中, 包括: 确定第一样本事件对, 以及将在所述本事件对的描述文本数据集中除所述第 一样本事 件对之外的样本事 件对依次作为目标样本事 件对; 计算所述第一样本事 件对与所述目标样本事 件对的向量距离; 确定与所述第一样本事件对的向量距离最小的目标样本事件对为第 二样本事件对, 并 将所述第一样本事 件对和所述第二样本事 件对分类至同一个事 件对第一聚类中。 8.一种事 件的描述文本预测装置, 其特 征在于, 所述事 件的描述文本预测装置包括: 文本获取模块, 用于从源终端获取目标事 件的事件描述文本; 语义解析模块, 用于对所述事 件描述文本进行语义 解析, 得到关键动词和关键名词; 第一节点匹配度确定模块, 用于基于事件关系树, 确定所述关键动词与所述事件关系 树中节点的第一节点匹配度, 其中, 所述节点用于指示第一文本及与所述第一文本对应的 第二文本, 所述第一文本为原因事 件描述文本, 所述第二文本为结果事 件描述文本; 目标节点确定模块, 用于根据所述第一节点匹配度, 在所述事件关系树中确定目标节 点, 得到所述目标节点所指示的目标第一文本及目标第二文本; 第一关联程度确定模块, 用于基于预设的名词关系数据库, 确定所述目标第一文本中 名词与所述目标第二文本中名词的第一关联程度; 目标名词确定模块, 用于基于预设的语义网络, 根据所述第一关联程度和所述关键名权 利 要 求 书 2/3 页 3 CN 114416912 A 3

PDF文档 专利 事件的描述文本预测方法、装置、设备及存储介质

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 事件的描述文本预测方法、装置、设备及存储介质 第 1 页 专利 事件的描述文本预测方法、装置、设备及存储介质 第 2 页 专利 事件的描述文本预测方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:47上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。