(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211052666.2
(22)申请日 2022.08.30
(71)申请人 中国人民解 放军国防科技大 学
地址 210001 江苏省南京市秦淮区后标营
18号
(72)发明人 蒋国权 环志刚 丁鲲 刘浏
刘姗姗 张骁雄 张慧 刘茗
(74)专利代理 机构 长沙国科天河知识产权代理
有限公司 432 25
专利代理师 李杨
(51)Int.Cl.
G06F 16/36(2019.01)
G06N 5/04(2006.01)
(54)发明名称
一种事件共指消解方法、 装置、 计算机设备
和存储介质
(57)摘要
本申请涉及一种事件共指消解方法、 装置、
计算机设备和存储介质。 所述方法包括: 构建了
事件共指消解模型, 包括事件抽取组件、 提及编
码器组件、 共指得分器组件和事件共指链重构 模
块, 通过显式建模论元信息, 将论元划分为包含
施事者、 受事者、 时间、 地点和其他共五种角色,
既满足分别处理对应角色论元的需求, 也保证所
有的论元信息都囊括其中; 通过在论元表示中引
入置信分数, 缓解错误传播带来的消极影响; 通
过门控过滤机制, 利用触发词过滤论元中的噪
声, 进一步缓解错误传播; 通过重构事件链的算
法, 进一步提升了事件共指消解模型的性能。 本
发明从多个角度对事件共指消解模型进行了改
进, 提高了模型的泛化性, 优化了推断结果的准
确性。
权利要求书3页 说明书14页 附图4页
CN 115422368 A
2022.12.02
CN 115422368 A
1.一种事 件共指消解方法, 其特 征在于, 所述方法包括:
获取待进行事件共指消解的训练数据集;
将所述训练数据集输入事件共指消解模型; 所述事件共指消解模型包括事件抽取组
件、 提及编码器组件、 共指得分器组件和事 件共指链重构模块;
所述事件抽取组件用于根据 所述训练数据集中的文档数据得到多个事件提及; 每个所
述事件提及中包括事件的触发词、 论元和事件子类型; 所述论元被划分为施事者、 受事者、
时间、 地点和其他共五种角色;
所述提及编码器组件用于根据所述事件提及和对应文档的词元数据得到任一事件提
及的触发词表示和论元角色的论元表示; 其中所述论元表示中包括论元置信 分数; 进一步
得到任意两个事件提及的触发词对表示和论元对表示, 通过门控过滤机制, 根据所述触发
词对表示对所述论元对表示进行过滤, 得到过滤后的论元对表示, 进而根据所述触发词对
表示和过 滤后的论元对表示得到任意两个事 件提及的提及对表示;
所述共指得分器组件用于根据所述 提及对表示得到任意两个事 件提及的共指得分;
所述事件共指链重构模块用于根据所述共指得分得到所述训练数据集中对应文档的
初始事件共指链, 通过计算所述初始事件共指链中单链与其他事件链的共指得分对所述单
链进行验证, 通过计算所述初始事件共指链中长链中的任一事件提及与所述长链中其他事
件提及的共指得分, 对所述长链进行验证, 进而对 所述初始事件共指链进 行重构, 得到预测
的最终事 件共指链;
通过所述训练数据集和所述预测的最终事件共指链对所述事件共指消解模型进行训
练, 得到训练好的事 件共指消解模型;
将待进行事件共指消解的文档数据输入所述训练好的事件共指消解模型, 得到所述文
档数据对应的最终事 件共指链。
2.根据权利要求1所述的方法, 其特征在于, 根据 所述事件提及和对应文档的词元数据
得到任一事 件提及的触发词表示和论元角色的论元表示, 包括:
获取所述事件抽取组件输出的k个事 件提及{m1,m2,…,mk}和对应文档的n个词元 数据;
通过transformer编码器为每个输入词元形成上下文表示为X=(X1,X2, …,Xn); 其中,
d表示每个词元编码后的向量维度;
对于每个事件提及mi, 所述事件提及mi的触发词表示ti被定义为其词元嵌入的平均值:
其中, si和ei分别表示触发词的开始和结束索引;
所述事件提及mi对应角色r的论元表示 为:
其中, r∈{agent,patient,time,place,other}, agent,patient,time,place,other分
别为施事者、 受事者、 时间、 地点和其他共五种论元角色,
是提及mi对应角色r的第l个权 利 要 求 书 1/3 页
2
CN 115422368 A
2论元的表示,
和
分别表示第l个论元的开始和结束索引, c表示第l个论元的置信分数, u
表示mi对应角色r的论元个数; 当 mi对应角色r的论元缺省或不存在, 使用d维0向量表示。
3.根据权利要求2所述的方法, 其特征在于, 进一步得到任意两个事件提及的触发词对
表示和论元对表示, 包括:
给定两个事件提及mi和mj, 分别定义触发词对表示和对应角色r的论元对表示 为:
其中, FFNNt是一个
的标准前馈神经网络,
编码mi和mj的元素级相似
性。
4.根据权利要求3所述的方法, 其特征在于, 通过门控过滤机制, 根据所述触发词对表
示对所述 论元对表示进行 过滤, 得到过 滤后的论元对表示, 包括:
根据所述触发词对表示tij对所述论元对表示
进行正交分解, 得到所述论 元对表示
的正交分量
和平行分量
分别为:
定义所述 正交分量
和所述平行分量
的权重系数分别为:
ωp=1‑ωo
其中, ωo和ωp分别是所述正交分量
和所述平行分量
的权重系数, FFNNp是一个
的前馈神经网络, σ 是sigmo id激活函数;
通过门控过 滤机制, 得到过 滤后的论元对表示:
。
5.根据权利要求4所述的方法, 其特征在于, 根据 所述触发词对表示和过滤后的论元对
表示得到任意两个事 件提及的提及对表示, 包括:
根据所述触发词对表示和过滤后的论元对表示得到任意两个事件提及的提及对表示
fij为:
6.根据权利要求5所述的方法, 其特征在于, 根据 所述提及对表示得到任意两个事件提
及的共指得分, 包括:
根据所述 提及对表示fij得到任意两个事 件提及的共指得分 s(i,j)为:
s(i,j)=F FNNa(fij)
其中, FFNNa是
的前馈神经网络 。权 利 要 求 书 2/3 页
3
CN 115422368 A
3
专利 一种事件共指消解方法、装置、计算机设备和存储介质
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-17 23:37:21上传分享