全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211068809.9 (22)申请日 2022.09.02 (71)申请人 南京信息 工程大学 地址 210044 江苏省南京市江北新区宁六 路219号 (72)发明人 付章杰 于琪  (74)专利代理 机构 南京纵横知识产权代理有限 公司 32224 专利代理师 董建林 (51)Int.Cl. G06F 40/151(2020.01) G06F 40/211(2020.01) G06F 40/216(2020.01) G06K 9/62(2022.01) G06F 21/62(2013.01)G06F 16/35(2019.01) (54)发明名称 一种文本隐写分析方法、 系统、 装置及存储 介质 (57)摘要 本发明公开一种文本隐写分析方法、 系统、 装置及存储介质, 包括: 获取待分析文本后将其 输入到预训练好的多图神经网络中, 得到网络输 出, 若网络输出小于预设阈值, 待分析文本为正 常文本, 否则为隐写文本; 多图神经网络训练时, 利用训练样 本集中的文本生 成了逻辑图、 语意图 和句法图, 分析文本间的统计性关系、 语意 关系、 句法关系, 综合这三种关系对文本进行消息更新 和特征提取, 得到区分度更高的特征, 弥补了 隐 写分析中序列模 型未考虑全局特征的不足, 大大 提高了多图神经网络的分析效率; 对 更新后的三 张图进行图间融合得到总图, 得到总图后池化得 到待分析文本的最终表示, 使得最终表示包含更 丰富的信息, 提高文本隐写分析的准确性。 权利要求书2页 说明书7页 附图1页 CN 115169293 A 2022.10.11 CN 115169293 A 1.一种文本隐写分析 方法, 其特 征在于, 包括: 获取待分析文本; 将待分析文本输入到预训练好的多图神经网络中, 得到网络输出, 若网络输出小于预 设阈值, 待分析文本为 正常文本, 否则待分析文本为隐写 文本; 所述多图神经网络通过以下 方法进行训练: 获取训练样本集, 将训练样本集中的文本转换为词向量; 每次训练时, 将词向量输入到构图模块, 生成包括逻辑图、 语意图和句法图的三张图, 并根据三张图内的各目标节点及目标节点的周围节点的信息对三张图进行图内信息更新; 将更新后的三张图进行图间融合得到总图; 对总图进行图池化得到文本的最终表示; 将文本的最终表示输入到分类 器, 得到分类 器输出; 根据分类器输出, 以交叉熵函数作为损 失函数对多图神经网络进行更新, 重复进行迭 代训练直至训练样本集中的文本使用完毕, 得到训练好的多图神经网络 。 2.根据权利要求1所述的一种 文本隐写分析方法, 其特征在于, 所述训练样本集由隐写 样本数据集和正常样本数据集组成。 3.根据权利要求1所述的一种文本隐写分析方法, 其特征在于, 在生成逻辑图的过程 中, 所述逻辑图中的边权 重通过以下公式进行计算: 其中, 是逻辑图中单词 a、b之间边的边权重, 表示单词 a、b共同出现的 概率, 表示单词 a在语料库中出现的概 率, 表示单词 b在语料库中出现的概 率。 4.根据权利要求1所述的一种文本隐写分析方法, 其特征在于, 在生成语意图的过程 中, 所述语意图中的边权 重通过以下公式进行计算: 其中, 表示语意图中单词 a、b之间边的边权重, 表示单词 a、 b有语意关系的滑动窗口个数, 表示单词 a、b同时出现的滑动窗口个数。 5.根据权利要求1所述的一种文本隐写分析方法, 其特征在于, 在生成句法图的过程 中, 所述句法图中的边权 重通过以下公式进行计算: 其中, 表示句法图中单词 a、b之间边的边权重, 表示单词 a、b 有句法关系的滑动窗口个数, 表示单词 a、b同时出现的滑动窗口个数。 6.根据权利要求1所述的一种文本隐写分析方法, 其特征在于, 对逻辑图、 语意图和句 法图进行图内信息更新包括: 对于任一张图中的任一目标节点, 通过下式从图中各目标节点的周围节点中收集信权 利 要 求 书 1/2 页 2 CN 115169293 A 2息: 其中,mn表示收集到的信息, max表示取周围节点信息中每个维度的最大值, 表示与 目标节点相连接的 p个节点,ec表示单词 c与目标节点之间的权 重, 表示单词 c的词向量; 通过下式将收集到的信息与目标节点自身 进行信息聚合: 其中, 表示单词 a聚合后的词向量, b表示信息要保留的程度, 。 7.根据权利要求1所述的一种 文本隐写分析方法, 其特征在于, 所述损失函数的表达式 为: 其中,yi表示样本的预测标签, pi表示样本的预测标签, N是样本数量。 8.一种文本隐写分析系统, 其特 征在于, 包括: 文本获取模块: 用于获取待分析文本; 文本隐写分析模块: 用于将待分析文本输入到预训练好的多图神经网络中, 得到网络 输出, 若网络 输出小于预设阈值, 待分析文本为 正常文本, 否则待分析文本为隐写 文本; 所述文本隐写分析模块中包括网络训练单元, 用于通过以下方法对多图神经网络进行 训练: 获取训练样本集, 将训练样本集中的文本转换为词向量; 每次训练时, 将词向量输入到构图模块, 生成包括逻辑图、 语意图和句法图的三张图, 并根据三张图内的各目标节点及目标节点的周围节点的信息对三张图进行图内信息更新; 将更新后的三张图进行图间融合得到总图; 对总图进行图池化得到文本的最终表示; 将文本的最终表示输入到分类 器, 得到分类 器输出; 根据分类器输出, 以交叉熵函数作为损 失函数对多图神经网络进行更新, 重复进行迭 代训练直至训练样本集中的文本使用完毕, 得到训练好的多图神经网络 。 9.一种文本隐写分析装置, 其特 征在于, 包括处 理器及存 储介质; 所述存储介质用于存 储指令; 所述处理器用于根据 所述指令进行操作以执行根据权利要求1~7任一项所述方法的步 骤。 10.计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器执行 时实现权利要求1~7任一项所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 115169293 A 3

PDF文档 专利 一种文本隐写分析方法、系统、装置及存储介质

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种文本隐写分析方法、系统、装置及存储介质 第 1 页 专利 一种文本隐写分析方法、系统、装置及存储介质 第 2 页 专利 一种文本隐写分析方法、系统、装置及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:34:17上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。