全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210555549.1 (22)申请日 2022.05.19 (71)申请人 深圳路演时刻网络数据有限公司 地址 518000 广东省深圳市前海深港合作 区南山街道前湾一路35号深 港青年梦 工场10栋603 (72)发明人 郑穗 蒋笑通 方英  (74)专利代理 机构 北京轻创知识产权代理有限 公司 11212 专利代理师 孟仕杰 (51)Int.Cl. G06F 16/35(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06F 40/289(2020.01)G06F 40/295(2020.01) G06F 16/22(2019.01) G06F 16/23(2019.01) G06F 16/25(2019.01) (54)发明名称 一种事件要素抽取方法、 装置、 电子设备及 计算机介质 (57)摘要 本发明涉及一种事件要素抽取方法、 装置、 电子设备及计算机介质, 包括步骤: 获取至少一 条第一事件要素文本; 根据至少一条第一事件要 素文本, 确定每一条第一事件要素文本所对应的 第一标记结果; 根据带有第一标记结果的各条第 一事件要素文本作为第一目标文本, 确定每一条 第一目标文本所对应的第一分类结果; 根据包含 预设的事件要素的各条第一目标文本作为第二 目标文本, 确定每一条第二目标文本所对应的目 标抽取结果。 解决了企业 或个人对于网上事件要 素的获取, 效率低下、 很难大批量、 高实时的处理 这些公开的事 件要素的问题。 权利要求书3页 说明书10页 附图1页 CN 115017309 A 2022.09.06 CN 115017309 A 1.一种事 件要素抽取 方法, 其特 征在于, 包括以下步骤: S1、 获取至少一条第一事 件要素文本; S2、 根据至少一条所述第一事件要素文本, 确定每一条所述第一事件要素文本所对应 的第一标记结果, 所述第一标记结果 为所述第一事 件要素文本中每 个词所对应的权 重; S3, 将带有第一标记结果的每条所述第一事件要素文本作为第一目标文本, 确定每一 条所述第一目标文本所对应的第一分类结果, 所述第一分类结果为所述第一目标文本中包 含预设的事 件要素或不包 含预设的事 件要素; S4、 将包含预设的事件要素的每条所述第一目标文本作为第二目标文本, 确定每一条 所述第二目标文本所对应的目标抽取结果, 所述目标抽取结果为所述第二目标文本中包含 的所述预设的事 件要素。 2.根据权利要求1所述的方法, 其特 征在于, 所述 步骤S2具体包括: 将至少一条所述第 一事件要素文本输入深层双向动态语言模型中, 通过所述深层双向 动态语言模型输出每一条所述第一事件要 素文本所对应的第一标记结果, 所述第一标记结 果为所述第一事 件要素文本中每 个词所对应的权 重; 其中, 所述深层 双向动态语言模型 是通过以下 方式训练得到的: S11、 获取至少一条第二事件要素文本, 每条所述第 二事件要素文本携带有第二标记结 果, 对于每条所述第二事件要素文本, 所述第二标记结果表征了所述第二事件要素文本中 包含的每个词所对应的权 重; S12、 将至少一条所述第二事件要素文本作为第一训练集, 输入至第一初始模型, 得到 所述第一训练集中每条 所述第二事 件要素文本的第一预测标记结果; S13、 对于所述第 一训练集中的每条所述第二事件要素文本, 根据所述第二事件要素文 本的第一预测标记结果和第二标记结果, 确定第一损失值; S14、 根据 所述第一训练集中各条所述第二事件要素文本所对应的第一损失值, 确定所 述第一初始模型 的第一总损失值, 若所述第一总损失值满足预设的第一训练结束条件, 将 满足所述第一训练结束条件时的第一初始模型作为所述深层双向动态语言模型, 若所述第 一总损失值不满足所述第一训练结束条件时, 调整所述第一初始模型 的参数, 并根据调整 后的参数重新对所述第一初始模型进 行训练, 直到所述第一初始模型的第一总损失值满足 所述第一训练结束条件。 3.根据权利要求2所述的方法, 其特征在于, 所述第一初始模型包括依次连接的8个深 度自注意力块, 所述S12包括: S21、 将所述第一训练集中的各条所述第二事件要素文本输入第一个深度自注意力块, 通过所述第一个深度自注意力块得到每条 所述第二事 件要素文本的第二预测标记结果; S22、 将所述第二个深度自注意力块作为当前模块, 通过执行以下步骤, 直到所述当前 模块为第八个深度自注意力块, 将所述第八个自注意力模块输出的每条所述第二事件要 素 文本的第三预测标记结果作为每条 所述第二事 件要素文本的第一预测标记结果; 所述以下步骤 包括: 将各条所述第 二事件要素文本输入至当前模块, 确定所述当前模块输出的每条所述第 二事件要 素文本的第三预测标记结果, 每条所述第二事件要 素文本为携带有 所述当前模块 的前一个模块输出的预测标记结果的第二事 件要素文本 。权 利 要 求 书 1/3 页 2 CN 115017309 A 24.根据权利要求1所述的方法, 其特 征在于, 所述S3具体包括: 将带有第一标记结果的各条所述第 一事件要素文本作为第 一目标文本, 将每条所述第 一目标文本输入文本分类模型中, 通过所述文本分类模型输出每一条所述第一目标文本所 对应的第一分类结果, 所述第一分类结果为所述第一目标文本中包含预设的事件要素或不 包含预设的事 件要素; 所述S4具体包括: 将包含预设的事件要素的各条所述第 一目标文本作为第 二目标文本, 将每条所述第 二 目标文本输入事件抽取模型中, 通过所述事件抽取模型确定每一条所述第二目标文本所对 应的目标抽取结果, 所述目标抽取结果为所述第二目标文本中包含的所述预设的事件要 素; 其中, 所述文本分类模型和所述事 件抽取模型采用联合训练的方式进行训练: S31、 获取至少一条第三事件要素文本, 每条所述第 三事件要素文本携带有所述第三标 记结果, 对于每条所述第三事件要素文本, 所述第三标记结果表征了所述第三事件要素文 本中每个词所对应的权 重; S32、 将带有所述第三标记结果的各条所述第三事件要素文本作为第二训练样本, 输入 至第二初始模型, 得到所述第二训练集中每条所述第三事件要素文本的第一预测分类结 果, 对于每个所述第三事件要素文本, 所述第一预测分类结果为所述第三事件要素文本包 含预设的事 件要素或不包 含预设的事 件要素; S33、 对于所述第 二训练集中的每条所述第三事件要素文本, 根据所述第三事件要素文 本的第一预测分类结果和第三标记结果, 确定第二损失值; S34、 获取至少一条所述第四事件要素文本, 每条所述第四事件要素文本携带有第二分 类结果, 对于每条所述第四事件要素文本, 所述第二分类结果表征了所述第四事件要素文 本中包含预设的事 件要素或不包 含预设的事 件要素; S35、 将带有所述第二分类结果的各条所述第四事件要素文本作为第三训练样本, 输入 至第三初始模型, 得到所述第三训练集中每条所述第四事件要素文本的预测抽取结果, 对 于每个所述第四事件要素文本, 所述预测抽取结果为所述第四事件要 素文本中包含的所述 预设的事 件要素; S36、 对于所述第 三训练集中的每条所述第四事件要素文本, 根据所述第四事件要素文 本的预测抽取 结果和第二分类结果, 确定第三损失值; S37、 根据 所述第二训练集中各条所述第三事件要素文本所对应的第二损失值, 以及所 述第三训练集中各条所述第四事件要素文本所对应的第三损失值, 确定第二总损失值, 若 所述第二总损失值满足预设的第二训练结束 条件时, 将满足所述第二训练结束条件时的第 二初始模型作为所述文本分类模型, 将满足所述第二训练结束条件时的第三初始模型作为 所述事件抽取模型, 若所述第二总损失值不满足训练结束条件时, 调整所述第二初始模型 和第三初始模型的参数, 并根据调整后的参数重新对所述第二初始模型和 第三初始模型进 行训练, 直到所述第二总损失值满足所述第二训练结束条件。 5.根据权利要求4所述的方法, 其特征在于, 所述第 二初始模型包括依次连接的第 一全 连接层和Softmax激活函数层, 所述S32包括: S51、 将所述第二训练集中的各条所述第三事件要素文本输入所述第一全连接层, 对于权 利 要 求 书 2/3 页 3 CN 115017309 A 3

PDF文档 专利 一种事件要素抽取方法、装置、电子设备及计算机介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种事件要素抽取方法、装置、电子设备及计算机介质 第 1 页 专利 一种事件要素抽取方法、装置、电子设备及计算机介质 第 2 页 专利 一种事件要素抽取方法、装置、电子设备及计算机介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:49:45上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。