全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210154146.6 (22)申请日 2022.02.21 (71)申请人 盛夏 地址 266071 山东省青岛市 市南区香港中 路18号 (72)发明人 盛夏  (74)专利代理 机构 北京盛凡佳华专利代理事务 所(普通合伙) 11947 专利代理师 安利敏 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/44(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种NLP模型训练识别系统 (57)摘要 本发明公开了一种NLP模型训练识别系统, 包括训练更新模块和训练图像获取单元, 训练图 像获取单元用于获取样本图片及每个样本图片 的描述信息; 训练更新模块利用训练图像获取单 元所述的样本图片及描述信息训练提取相应的 特征, 并根据相应的特征输入建立的模型中, 得 到模型输 出的融合特征向量, 并基于融合特征向 量进行图片检索; 训练更新模块包括训练集、 特 征提取单元、 第一训练单元、 计算分析单元、 更新 单元、 第二训练单元。 本发明属于学习训练系统 技术领域, 具体是提供了一种从提取图片特征与 相关的文字信息出发, 实现更精 准的图片检索的 NLP模型训练识别系统。 权利要求书1页 说明书4页 附图1页 CN 114565804 A 2022.05.31 CN 114565804 A 1.一种NLP模型训练识别系统, 其特征在于: 包括训练更新模块和训练图像获取单元, 所述训练图像获取单元用于获取样本图片及每个样本图片的描述信息; 所述训练更新模块 利用训练图像获取单元所述的样本图片及描述信息训练提取相应的特征, 并根据相应的特 征输入建立的模型中, 得到模型输出的融合特 征向量, 并基于融合特 征向量进行图片检索。 2.根据权利要求1所述的一种NLP模型训练识别系统, 其特征在于: 所述训练更新模块 包括训练集、 特 征提取单元、 第一训练单 元、 计算分析 单元、 更新单 元、 第二训练单 元; 所述特征提取单元用于对待检索的样本图片进行提取图片特征操作、 且对样本图片进 行提取文本特征的操作, 通过特征提取单元提取后的图片特征以及文本特征存入训练集 内; 所述第一训练单元, 利用训练集中的图片特征以及文本特征数据对图像翻译模型的生 成器和判别器分别进行训练, 并将训练后的图像翻译模型确定为第一模型; 所述计算分析单元, 被配置成将当前训练数据序列输入所述第一模型, 计算元损 失函 数在当前训练数据序列上的第一梯度, 并对训练数据使用自然语言处理技术(NLP)进行文 本分析; 所述更新单元, 被配置成根据所述第一梯度与学习率更新所述第一模型的网络参数, 得到第二模型; 所述第二训练单元, 被配置成基于所述未来训练数据序列和更新后的学习率进行模型 训练, 训练完成后形成目标模型。 3.根据权利要求2所述的一种NLP模型训练识别系统, 其特征在于: 所述样本图片的描 述信息包括但不限于样本图片上的文字信息, 还 包括与样本图片相关联的文字信息 。 4.根据权利要求3所述的一种NLP模型训练识别系统, 其特征在于: 所述计算分析单元 还包括文本合并模块、 关键词提取模块和文本分析单元, 所述文本合并模块用于将目标图 片上的文字信息以及目标图片关联的文字信息进 行合并, 所述关键词提取模块用于对目标 图片的文字信息构成文本 分析, 得到由关键词和权重组成的一组向量, 所述文本 分析单元, 用于进行关键词提取与文本分类得到向量和分类。 5.根据权利要求2所述的一种NLP模型训练识别系统, 其特征在于: 所述生成器为编码 模型‑解码模型 结构, 所述编码模型采用的是残差网络架构。权 利 要 求 书 1/1 页 2 CN 114565804 A 2一种NLP模型训练识别系统 技术领域 [0001]本发明属于学习训练系统技术领域, 尤其涉及深度学习、 NLP等技术领域, 具体是 指一种NLP模型训练识别系统。 背景技术 [0002]NLP(Natural  Language  Processing)是人工智能(A I)的一个子领域, 目前常规的 NLP在能提供正常接口服务之前都需要经过模型的训练、 发布、 以及模型启动三个过程, 这 三个过程目前业内都需要开发人员在服务器上进行手工操作, 每一次NLP语意识别模型 的 发布以及训练时都会 存在误操作风险, 容 易因为人的操作错 误导致故障。 [0003]随着基础技术的不断进步, 人类信息交互形式不断进化, 从声音、 文字、 图片到视 频, 形式越来越生动、 高效, 但也越来越庞大、 复杂。 其中, 图片媒体近来已经成为普遍的交 互形式, 对图片进行高效检索在搜索、 推荐、 广告等领域都有着广泛应用, 也一直是业界研 究的热点。 发明内容 [0004]针对上述情况, 为克服现有技术的缺陷, 本发明提供了一种从提取 图片特征与相 关的文字信息出发, 实现更精准的图片检索的N LP模型训练识别系统。 [0005]本发明采取的技术方案如下: 本 发明一种NLP模型训练识别系统, 包括训练更新模 块和训练图像获取 单元, [0006]所述训练图像获取 单元用于获取样本图片及每 个样本图片的描述信息; [0007]所述训练更新模块利用训练图像获取单元所述的样本图片及描述信息训练提取 相应的特征, 并根据相应的特征输入建立的模型中, 得到模型输出的融合特征向量, 并基于 融合特征向量进行图片检索。 [0008]在本方案中, 所述训练更新模块包括训练集、 特征提取单元、 第一训练单元、 计算 分析单元、 更新单 元、 第二训练单 元, [0009]所述特征提取单元用于对待检索的样本图片进行提取图片特征操作、 且对样本图 片进行提取文本特征的操作, 通过特征提取单元提取后的图片特征以及文本特征存入训练 集内, [0010]第一训练单元, 利用训练集中的图片特征以及文本特征数据对图像翻译模型的生 成器和判别器分别进行训练, 并将训练后的图像翻译模型确定为第一模型; [0011]计算分析单元, 被配置成将当前训练数据序列输入所述第一模型, 计算元损失函 数在当前训练数据序列上的第一梯度, 并对训练数据使用自然语言处理技术(NLP)进行文 本分析; [0012]更新单元, 被配置成根据所述第一梯度与学习率更新所述第一模型的网络参数, 得到第二模型; [0013]第二训练单元, 被配置成基于所述未来训练数据序列和更新后的学习率进行模型说 明 书 1/4 页 3 CN 114565804 A 3

PDF文档 专利 一种NLP模型训练识别系统

文档预览
中文文档 7 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种NLP模型训练识别系统 第 1 页 专利 一种NLP模型训练识别系统 第 2 页 专利 一种NLP模型训练识别系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:12:05上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。