全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210311748.8 (22)申请日 2022.03.28 (71)申请人 上海易康源医疗健康科技有限公司 地址 200120 上海市浦东 新区中国(上海) 自由贸易试验区临港新片区新杨公路 860号10幢 (72)发明人 曾祥云 朱姬渊  (74)专利代理 机构 上海硕力知识产权代理事务 所(普通合伙) 31251 专利代理师 杨用玲 (51)Int.Cl. G06V 20/62(2022.01) G06V 30/10(2022.01) G06V 10/44(2022.01) G06V 10/764(2022.01)G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 文字检测系统、 训练方法及检测方法 (57)摘要 本发明公开一种文字检测系统、 训练方法及 检测方法。 文字检测系统包括预处理单元、 基础 网络单元、 目标定位单元、 输出处理单元。 其中: 预处理单元用以对输入的图片进行预处理, 用以 作为基础网络单元的输入图像; 基础网络单元用 以对输入图像进行特征抽取, 获得特征图; 目标 定位单元用以对 特征图进行定位; 输出处理单元 用以对目标定位单元定位的目标进行处理, 得到 文字目标。 本发 明针对文字检测准确率不高的技 术缺陷提出的技术方案, 能够大大提高对复杂背 景的文字 检测鲁棒 性。 权利要求书2页 说明书5页 附图1页 CN 114724130 A 2022.07.08 CN 114724130 A 1.一种文字检测系统, 其特征是, 包括预处理单元、 基础网络单元、 目标定位单元、 输出 处理单元, 其中: 预处理单元用以对输入的图片进行 预处理, 用以作为基础网络单 元的输入图像; 基础网络单 元用以对输入图像进行 特征抽取, 获得 特征图; 目标定位单 元用以对特 征图进行定位; 输出处理单元用以对目标定位单 元定位的目标进行处 理, 得到文字目标。 2.如权利要求1所述的文字检测系统, 其特征是, 基础网络单元为对多个基础网络模块 构成, 每个基础网络模块为: 对输入 经过2次卷积得到第一特征图, 对输入经过1次卷积和多 次残差模块得到第二特征图, 将第一特征图和第二特征图进行concat后, 再经过1次卷积 输 出。 3.如权利要求1所述的文字检测系统, 其特征是, 基础网络单元还包括池化模块, 用以 处理不同纵横比和不同尺 寸的输入图像的问题, 其结构为: 将输入图像复制为多份, 对其中 进行间隔采样, 并进行框处 理, 再和特 征图在通道维度上进行拼接, 最后经 过CSP结构输出。 4.如权利要求2或3所述的文字检测系统, 其特征是, 基础网络单元还包括嵌入模块, 用 以将先验的隐式知识传递到基础网络单 元的的显性知识中, 其结构为: 将多个输出特征图分别在经过1次卷积后, 叠加到一维正态分布的先验矩阵中, 再分别 经过1次卷积后, 乘以另一个一维正态分布的先验矩阵。 5.如权利要求1所述的文字检测系统, 其特征是, 预处理单元包括数据增强模块、 框处 理模块以及切片模块, 其中: 数据增强模块用以增 加了数据的多样性; 框处理模块用以将不 规整图片标准 正方形; 切片模块用以对图片进行切片操作, 并进行拼接, 得到特 征图。 6.如权利要求1所述的文字检测系统, 其特征是, 目标定位单元包括特征金字塔网络模 块和聚合网络模块, 其中: 特征金字塔网络模块用以自上而下传递了语义信息, 发现大目标; 聚合网络模块用以自底而上传递语义信息, 发现小目标。 7.如权利要求1所述的文字检测系统, 其特征是, 输出处理单元包括定位精度模块和目 标锁定模块, 其中: 定位精度模块 为GIOU, 用以发现目标; 目标锁定模块用以确定最佳目标, 并消除冗余的边界框 。 8.一种文字检测系统的训练方法, 应用于文字检测系统中, 其特 征是, 包括步骤: 设置学习率、 激活函数以及优化方法; 对输入的图片进行 数据处理: 先验框筛选; 对中心坐标进行调整; 设置损失函数, 计算损失值并进行训练。 9.一种文字检测方法, 应用于文字检测系统中, 包括 步骤: 获取图片信息; 对图片信息进行处 理, 并给出检测结果,权 利 要 求 书 1/2 页 2 CN 114724130 A 2其特征是, 所述文字检测系统为权利要求1 ‑7所述的文字检测系统。 10.一种电子设备, 其特征是, 包括: 处理器、 存储介质和总线, 所述存储介质存储有所 述处理器可执行 的机器可读指令, 当电子设备运行时, 所述处理器与所述存储介质之间通 过总线通信, 所述处理器执行所述机器可读指令, 以执行如权利要求9所述的文字检测方 法。权 利 要 求 书 2/2 页 3 CN 114724130 A 3

PDF文档 专利 文字检测系统、训练方法及检测方法

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 文字检测系统、训练方法及检测方法 第 1 页 专利 文字检测系统、训练方法及检测方法 第 2 页 专利 文字检测系统、训练方法及检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:11:27上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。