全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211533022.5 (22)申请日 2022.12.02 (71)申请人 广州数说故事信息科技有限公司 地址 510620 广东省广州市天河区黄埔大 道西120号15 01室 (72)发明人 牟昊 邓钢清 何宇轩 徐亚波  李旭日  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 李妙芬 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/31(2019.01) G06F 40/295(2020.01) (54)发明名称 一种事件处理方法、 设备及计算机可读存储 介质 (57)摘要 本发明公开了一种事件处理方法、 设备及计 算机可读存储介质, 该方法包括: 采用事件提取 模型对文本信息进行事件提取; 采用实体识别模 型对文本信息进行实体提取; 根据提取的事件信 息和实体, 确定目标事件; 计算目标事件与事件 数据库中各个历史事件的余弦相似度, 并根据余 弦相似度最高的前K个历史事件及其实体、 目标 事件的实体, 判断目标事件与前K个历史事件中 任意一个历史事件是否为同一事件; 若否, 将目 标事件增量更新到事件数据库; 否则更新事件数 据库中对应的历史事件; 本发明采用事件提取模 型进行事件提取, 实体识别模型进行实体提取, 并结合事件的余弦相似度、 实体相似来综合判断 事件相似性, 可以提高事件提取和合并的准确 率。 权利要求书2页 说明书8页 附图4页 CN 115544214 A 2022.12.30 CN 115544214 A 1.一种事 件处理方法, 其特 征在于, 包括: 获取文本信息, 并采用事 件提取模型对所述文本信息进行事 件提取, 得到事 件信息; 采用实体识别模型对所述文本信息进行实体提取, 得到所述文本信息中的实体; 根据所述事 件信息和所述实体, 确定目标事 件; 计算所述目标事件与事件数据库中各个历史事件之间的余弦相似度, 并从所述事件数 据库中选取余弦相似度最高的前 K个历史事 件; 根据选取的前K个历史事件的余弦相似度及其实体、 所述目标事件的实体, 判断所述目 标事件与前K个历史事 件中任意 一个历史事 件是否为同一个事 件; 若否, 将所述目标事 件增量更新到所述事 件数据库中; 若是, 更新所述事 件数据库中与所述目标事 件属于同一个事 件的历史事 件。 2.如权利要求1所述的事件处理方法, 其特征在于, 所述事件信 息包括事件及其事件类 型、 事件类型的概 率。 3.如权利要求2所述的事件处理方法, 其特征在于, 所述根据所述事件信息和所述实 体, 确定目标事 件, 包括: 判断当前提取 出的事件的事件类型的概 率是否大于设定的概 率阈值; 若否, 则丢弃当前提取 出的事件; 若是, 则判断当前提取 出的事件中是否存在所述实体; 当当前提取 出的事件中存在所述实体时, 输出当前提取 出的事件作为目标事 件; 当当前提取 出的事件中不存在所述实体时, 丢弃当前提取 出的事件。 4.如权利要求1所述的事件处理方法, 其特征在于, 所述计算所述目标事件与事件数据 库中各个历史事件之间的余弦相似度, 并从所述事件数据库中选取余弦相似度最高的前K 个历史事 件, 包括: 将所述目标事 件输入到向量模型, 得到所述目标事 件的事件向量; 计算所述事 件向量与事 件数据库中各个历史事 件之间的余弦相似度; 从所述事 件数据库中选取余弦相似度最高的前 K个历史事 件。 5.如权利要求1所述的事 件处理方法, 其特 征在于, 所述方法还 包括: 通过预设的归一 化码表对当前提取 出的实体进行 标准化处理。 6.如权利要求5所述的事件处理方法, 其特征在于, 所述根据选取的前K个历史事件的 余弦相似度及其 实体、 所述目标事件的实体, 判断所述目标事件与前K个历史事件中任意一 个历史事 件是否为同一个事 件, 包括: 对于前K个历史事件, 判断第 i个历史事件与所述目标事件之间的余弦相似度是否大于 预设的相似度阈值; 若否, 确定所述目标事 件与第i个历史事 件不是同一个事 件; 若是, 判断标准 化后的实体与第i个历史事 件对应的实体是否相同; 当标准化后的实体与第i个历史事件对应的实体不相同时, 提取第i+1个历史事件, 并 返回余弦相似度判断流 程; 1≤i≤K ‑1; 当标准化后的实体与第i个历史事件对应的实体相同时, 将所述目标事件和第 i个历史 事件输入到事件相似判断模型, 得到事件判断结果; 其中, 所述事件判断结果包括是同一个 事件、 不是同一个事 件。权 利 要 求 书 1/2 页 2 CN 115544214 A 27.如权利要求6所述的事件处理方法, 其特征在于, 在提取第 i+1个历史事件之间, 还包 括: 判断第i个历史事 件是否为前 K个历史事 件中的最后一个历史事 件; 若是, 则确定所述目标事 件与第i个历史事 件不是同一个事 件; 若否, 则提取第i+1个历史事 件。 8.如权利要求1所述的事件处理方法, 其特征在于, 所述更新所述事件数据库中与 所述 目标事件属于同一个事 件的历史事 件, 包括: 对于所述事件数据库中与 所述目标事件属于同一个事件的历史事件, 更新所述历史事 件的字段; 其中, 所述字段包括对应事 件的发生时间和声量。 9.一种事件处理设备, 其特征在于, 包括: 处理器; 处理器、 存储器以及存储在所述存储 器中且被配置为由所述处理器执行的计算机程序, 所述处理器执行所述计算机程序时实现 如权利要求1 ‑8中任意一项所述的事 件处理方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机程 序, 其中, 在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要 求1‑8中任意一项所述的事 件处理方法。权 利 要 求 书 2/2 页 3 CN 115544214 A 3

PDF文档 专利 一种事件处理方法、设备及计算机可读存储介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种事件处理方法、设备及计算机可读存储介质 第 1 页 专利 一种事件处理方法、设备及计算机可读存储介质 第 2 页 专利 一种事件处理方法、设备及计算机可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:49:07上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。