(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211045398.1
(22)申请日 2022.08.30
(71)申请人 中国人民解 放军国防科技大 学
地址 210001 江苏省南京市秦淮区后标营
18号
(72)发明人 蒋国权 环志刚 丁鲲 刘浏
刘姗姗 张骁雄 刘茗 张慧
(74)专利代理 机构 长沙国科天河知识产权代理
有限公司 432 25
专利代理师 李杨
(51)Int.Cl.
G06F 16/33(2019.01)
G06F 16/36(2019.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
基于建模论元的事件共指消解方法、 装置、
设备和介质
(57)摘要
本申请涉及一种基于建模论元的事件共指
消解方法、 装置、 计算机设备和存储介质。 所述方
法包括: 构建了事件共指消解模型, 包括事件抽
取组件、 提及编码器组件、 共指得分器组件和事
件共指链确定模块, 通过显式建模论元信息, 并
且将论元划分为包含施事者、 受事者、 时间、 地点
和其他共五种角色, 既可以满足分别处理对应角
色论元的需求, 也保证所有的论元信息都囊括其
中, 不会致使某些论元信息的缺失; 通过在论元
表示中引入置信分数, 缓解错误传播带来的消极
影响; 通过设计一种门控过滤机制, 利用触发词
过滤论元中的噪声, 进一步缓解错误传播, 获取
特定上下文中最有用的信息。 本发 明方法具有效
果佳、 适应性 好的优点。
权利要求书3页 说明书12页 附图5页
CN 115422325 A
2022.12.02
CN 115422325 A
1.一种基于建模论元的事 件共指消解方法, 其特 征在于, 所述方法包括:
获取待进行事件共指消解的训练数据集;
将所述训练数据集输入事件共指消解模型; 所述事件共指消解模型包括事件抽取组
件、 提及编码器组件、 共指得分器组件和事 件共指链确定模块;
所述事件抽取组件用于根据 所述训练数据集中的文档数据得到多个事件提及; 每个所
述事件提及中包括事件的触发词、 论元和事件子类型; 所述论元被划分为施事者、 受事者、
时间、 地点和其他共五种角色;
所述提及编码器组件用于根据所述事件提及和对应文档的词元数据得到任一事件提
及的触发词表示和论元角色的论元表示; 其中所述论元表示中包括论元置信 分数; 进一步
得到任意两个事件提及的触发词对表示和论元对表示, 通过门控过滤机制, 根据所述触发
词对表示对所述论元对表示进行过滤, 得到过滤后的论元对表示, 进而根据所述触发词对
表示和过 滤后的论元对表示得到任意两个事 件提及的提及对表示;
所述共指得分器组件用于根据所述 提及对表示得到任意两个事 件提及的共指得分;
所述事件共指链确定模块用于根据所述共指得分得到所述训练数据集中对应文档的
预测事件共指链;
通过所述训练数据集和所述预测事件共指链对所述事件共指消解模型进行训练, 得到
训练好的事 件共指消解模型;
将待进行事件共指消解的文档数据输入所述训练好的事件共指消解模型, 得到所述文
档数据对应的事 件共指链数据。
2.根据权利要求1所述的方法, 其特征在于, 根据 所述事件提及和对应文档的词元数据
得到任一事 件提及的触发词表示和论元角色的论元表示, 包括:
获取所述事件抽取组件输出的k个事 件提及{m1,m2,…,mk}和对应文档的n个词元 数据;
通过transformer编码器为每个输入词 元形成上下文表示为X=(X1,X2,…,Xn); 其中,
d表示每个词元编码后的向量维度;
对于每个事件提及mi, 所述事件提及mi的触发词表示ti被定义为其词元嵌入的平均值:
其中, si和ei分别表示触发词的开始和结束索引;
所述事件提及mi对应角色r的论元表示 为:
其中, r∈{agent,patient,time,place,other}, agent,patient,time,place,other分
别为施事者、 受事者、 时间、 地点和其他共五种论元角色,
是提及mi对应角色r的第l个
论元的表示,
和
分别表示第l个论元的开始和结束索引, c表示第l个论元的置信分数, u
表示mi对应角色r的论元个数; 当 mi对应角色r的论元缺省或不存在, 使用d维0向量表示。权 利 要 求 书 1/3 页
2
CN 115422325 A
23.根据权利要求2所述的方法, 其特征在于, 进一步得到任意两个事件提及的触发词对
表示和论元对表示, 包括:
给定两个事件提及mi和mj, 分别定义触发词对表示和对应角色r的论元对表示 为:
其中, FFNNt是一个
的标准前馈神经网络,
编码mi和mj的元素级相似
性。
4.根据权利要求3所述的方法, 其特征在于, 通过门控过滤机制, 根据所述触发词对表
示对所述 论元对表示进行 过滤, 得到过 滤后的论元对表示, 包括:
根据所述触发词对表示tij对所述论元对表示
进行正交分解, 得到所述论元对表示
的正交分量
和平行分量
分别为:
定义所述 正交分量
和所述平行分量
的权重系数分别为:
ωp=1‑ωo
其中, ωo和ωp分别是所述正交分量
和所述平行分量
的权重系数, FFNNp是一个
的前馈神经网络, σ 是sigmo id激活函数;
通过门控过 滤机制, 得到过 滤后的论元对表示:
5.根据权利要求4所述的方法, 其特征在于, 根据 所述触发词对表示和过滤后的论元对
表示得到任意两个事 件提及的提及对表示, 包括:
根据所述触发词对表示和过滤后的论元对表示得到任意两个事件提及的提及对表示
fij为:
6.根据权利要求5所述的方法, 其特征在于, 根据 所述提及对表示得到任意两个事件提
及的共指得分, 包括:
根据所述 提及对表示fij得到任意两个事 件提及的共指得分 s(i,j)为:
s(i,j)=F FNNa(fij)
其中, FFNNa是
的前馈神经网络 。
7.根据权利要求6所述的方法, 其特征在于, 根据 所述共指得分得到所述训练数据集中
对应文档的预测事 件共指链, 包括:
对任一事件提及, 获取与其具有相同事 件子类型的事 件提及作为 候选共指提及对;权 利 要 求 书 2/3 页
3
CN 115422325 A
3
专利 基于建模论元的事件共指消解方法、装置、设备和介质
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-17 23:42:31上传分享