全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210332932.0 (22)申请日 2022.03.31 (71)申请人 上海易康源医疗健康科技有限公司 地址 200120 上海市浦东 新区中国(上海) 自由贸易试验区临港新片区新杨公路 860号10幢 (72)发明人 曾祥云 朱姬渊  (74)专利代理 机构 上海硕力知识产权代理事务 所(普通合伙) 31251 专利代理师 刘桂芝 (51)Int.Cl. G06V 20/62(2022.01) G06V 30/10(2022.01) G06V 10/44(2022.01) G06V 10/764(2022.01)G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 文字检测系统、 检测方法及训练方法 (57)摘要 本发明公开一种文字检测系统、 检测方法及 训练方法, 文字检测系统包括第一网络、 第二网 络以及分类单元、 回归单元, 其中: 第一网络用以 提取第一源图片S1、 第一源图片S1以及目标图片 T的特征; 第二网络单元用以接收第一网络输出 的特征提取分析, 用以提高文字检测的敏感度; 分类单元用以对文字检测结果进行分类; 回归单 元用以对文字检测结果进行回归分析。 本发明能 够学习不同情况的环境下样本的特征的不变同 时提升单类样本的独特性, 使得模 型既能够学习 到较强的领域泛化能力, 又能提升样本的区分 度, 保持较高的检测敏感度。 权利要求书1页 说明书4页 附图1页 CN 114663875 A 2022.06.24 CN 114663875 A 1.一种文字检测系统, 其特征是, 包括第一网络、 第 二网络以及 分类单元、 回归单元, 其 中: 第一网络用以提取第一源图片 S1、 第二源图片 S2以及目标图片T的特 征; 第二网络单 元用以接收第一网络 输出的特 征提取分析, 用以提高文字检测的敏感度; 分类单元用以对文字检测结果进行分类; 回归单元用以对文字检测结果进行回归分析。 2.如权利要求1所述的文字检测系 统, 其特征是, 第二网络包括NS1网络、 NS2网络以及 学习网络, 其中: NS1网络用以对第一源图片 S1以及目标图片T的特 征进行分析, 得到高阶特 征; NS2网络用以对第二源图片 S2以及目标图片T的特 征进行分析, 得到低阶特 征; 学习网络用以对NS1网络和NS2网络学习, 并更新 NS1网络和NS2网络 。 3.如权利 要求1所述的文字检测系统, 其特征是, 分类单元由全连接层模块以及sofmax 层组成。 4.如权利要求1所述的文字检测系统, 其特 征是, 回归单 元为二个全连接层模块组成。 5.如权利要求1所述的文字检测系统, 其特 征是, 所述第一网络为ef ficientnet V2。 6.一种文字检测方法, 应用于文字检测系统中, 包括 步骤: 获取图片信息; 对图片信息进行处 理, 并给出检测结果, 其特征是, 所述文字检测系统为权利要求1 ‑5之任一所述的文字检测系统。 7.一种文字检测系统的训练方法, 应用于文字检测系统中, 其特 征是, 包括步骤: 输入第一源图片 S1、 第二源图片 S2以及目标图片T; 从第一网络中抽取 特征, 并用GRL方法对图片对齐, 以least ‑squares进行训练; 第一源图片S1域和目标图片T通过第一网络再输入给第二网络的NS1网络, 用以实现高 阶源‑目标域的对齐以及源域的检测训练; 保持上述训练阶段学习到的目标, 对第二网络的学习网络进行训练, 并更新NS1网络、 NS2网络。 8.一种计算机可读存储介质, 其特征是, 所述存储介质中存储有指令或者程序, 所述指 令或者程序由处 理器加载并执 行如权利要求6所述的文字检测方法。 9.一种电子设备, 其特征是, 包括: 处理器、 存储介质和总线, 所述存储介质存储有所述 处理器可执行 的机器可读指令, 当电子设备运行时, 所述处理器与所述存储介质之间通过 总线通信, 所述处 理器执行所述机器可读指令, 以执 行如权利要求6所述的文字检测方法。权 利 要 求 书 1/1 页 2 CN 114663875 A 2文字检测系统、 检测方 法及训练方 法 技术领域 [0001]本发明涉及人工智能技 术领域, 尤其涉及文字检测系统、 检测方法及训练方法。 背景技术 [0002]文字检测任务是找出图像或视频中人们感兴趣的物体, 并同时检测出它们的位置 和大小。 文字检测技术 发展至今已经有几十年的时间, 从技术的发展 脉络看, 可以划分为传 统文字检测算法时期(2014 年之前)以及之后的基于 机器学习的文字检测算法。 [0003]传统文字检测算法主要基于手工提取特征, 手工 的缺陷主要在于计算量大, 识别 效果比较差, 而且人工成本也 非常高。 随着机器学习的各种新算法成熟, 文字检测技术得到 了质的飞跃, 基于CNN以及Y OLO的各种文字检测算法不断创新出来, 大大提高了文字检测的 识别能力和准确率。 [0004]基于机器学习的文字检测计算需要大量的标注数据, 往往在真实工业场景, 图片 分别非常复杂, 人工标注很难覆盖各个情况, 如图片不同的光照, 扭曲, 模糊等情况都很难 用标注到位。 导 致文字检测鲁棒 性比较差, 在不同的领域泛化能力 弱, 最终准确率 不高。 发明内容 [0005]本发明为解决现有技术中存在的技术问题, 提供一种文字检测系统, 包括第一网 络、 第二网络以及分类单 元、 回归单 元, 其中: [0006]第一网络用以提取第一源图片 S1、 第二源图片 S2以及目标图片T的特 征; [0007]第二网络单元用以接收第一网络输出的特征提取分析, 用以提高文字检测的敏感 度; [0008]分类单元用以对文字检测结果进行分类; [0009]回归单元用以对文字检测结果进行回归分析。 [0010]进一步地, 第二网络包括 NS1网络、 NS2网络以及学习网络, 其中: [0011]NS1网络用以对第一源图片 S1以及目标图片T的特 征进行分析, 得到高阶特 征; [0012]NS2网络用以对第二源图片 S2以及目标图片T的特 征进行分析, 得到低阶特 征; [0013]学习网络用以对NS1网络和NS2网络学习, 并更新 NS1网络和NS2网络 。 [0014]进一步地, 分类单 元由全连接层模块以及sofmax层组成。 [0015]进一步地, 回归单 元为二个全连接层模块组成。 [0016]进一步地, 所述第一网络为ef ficientnet V2。 [0017]本发明还提供一种文字检测方法, 应用于文字检测系统中, 包括 步骤: [0018]获取图片信息; [0019]对图片信息进行处 理, 并给出检测结果, [0020]所述文字检测系统为所述的文字检测系统。 [0021]本发明还提供一种文字检测系统的训练方法, 应用于文字检测系统中, 包括 步骤: [0022]输入第一源图片 S1、 第二源图片 S2以及目标图片T;说 明 书 1/4 页 3 CN 114663875 A 3

PDF文档 专利 文字检测系统、检测方法及训练方法

文档预览
中文文档 7 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 文字检测系统、检测方法及训练方法 第 1 页 专利 文字检测系统、检测方法及训练方法 第 2 页 专利 文字检测系统、检测方法及训练方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:11:21上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。