全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210583992.X (22)申请日 2022.05.25 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 范森 吕鹏原 王晓燕 乔美娜  刘珊珊  (74)专利代理 机构 中科专利商标代理有限责任 公司 11021 专利代理师 吴晓兵 (51)Int.Cl. G06V 30/18(2022.01) G06V 10/44(2022.01) G06V 10/46(2022.01) G06V 10/764(2022.01)G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 文本检测方法、 模 型的训练方法、 装置、 电子 设备及介质 (57)摘要 本公开提供了文本检测方法、 深度学习模 型 的训练方法、 装置、 电子设备、 存储介质以及程序 产品, 涉及人工智 能技术领域, 尤其涉及深度学 习、 图像处理、 计算机视觉技术领域, 可应用于 OCR等场景。 具体实现方案为: 对待检测图像进行 图像特征提取, 得到全局特征图; 对全局特征图 进行分类, 得到分类结果; 基于分类结果, 从多个 检测模式中确定目标检测模式; 以及按照目标检 测模式处理全局特征图, 得到待检测图像的文本 检测结果。 权利要求书3页 说明书11页 附图9页 CN 114998906 A 2022.09.02 CN 114998906 A 1.一种文本检测方法, 包括: 对待检测图像进行图像特 征提取, 得到全局特 征图; 对所述全局特 征图进行分类, 得到分类结果; 基于所述分类结果, 从多个 检测模式 中确定目标检测模式; 以及 按照所述目标检测模式处 理所述全局特 征图, 得到所述待检测图像的文本检测结果。 2.根据权利要求1所述的方法, 其中, 所述对所述全局特征图进行分类, 得到分类结果, 包括: 对所述全局特 征图进行第一卷积 操作, 得到第一卷积后的全局特 征图; 以及 对所述第一卷积后的全局特 征图进行分类, 得到所述分类结果。 3.根据权利要求1或2所述的方法, 其中, 所述基于所述分类结果, 从多个检测模式中确 定目标检测模式, 包括: 在确定所述分类结果为分割分类结果的情况下, 确定所述目标检测模式为分割检测模 式; 以及 在确定所述分类结果为 回归分类结果的情况下, 确定所述目标检测模式为 回归检测模 式。 4.根据权利要求3所述的方法, 其中, 所述目标检测模式包括回归检测模式; 所述按照所述目标检测模式处理所述全局特征图, 得到所述待检测图像的文本检测结 果, 包括: 对所述全局特 征图进行第二卷积 操作, 得到第二卷积后的全局特 征图; 以及 对所述第二卷积后的全局特征图进行非极大值抑制处理, 得到所述待检测图像的文本 检测结果。 5.根据权利要求3所述的方法, 其中, 所述目标检测模式包括分割检测模式; 所述按照所述目标检测模式处理所述全局特征图, 得到所述待检测图像的文本检测结 果, 包括: 对所述全局特 征图进行第三卷积 操作, 得到第三卷积后的全局特 征图; 以及 对所述第三卷积后的全局特征图进行连通域标记 处理, 得到所述待检测图像的所述文 本检测结果。 6.一种深度学习模型的训练方法, 包括: 对样本图像进行图像特 征提取, 得到样本全局特 征图; 按照多个 检测模式分别处 理所述样本全局特 征图, 得到多个样本文本检测结果; 基于所述多个样本文本检测结果, 确定所述样本图像的分类标签; 将所述样本全局特 征图输入至深度学习模型中, 得到样本分类结果; 以及 利用所述样本分类结果和所述分类标签, 训练所述深度学习模型, 得到经训练的深度 学习模型。 7.根据权利要求6所述的方法, 其中, 所述基于所述多个样本文本检测结果, 确定所述 样本图像的分类标签, 包括: 从所述多个样本文本检测结果中确定目标样本文本检测结果; 确定与所述目标样本文本检测结果相匹配的目标样本检测模式; 以及 将与所述目标样本检测模式相对应的预定分类标签作为所述样本图像的分类标签。权 利 要 求 书 1/3 页 2 CN 114998906 A 28.一种文本检测装置, 包括: 提取模块, 用于对待检测图像进行图像特 征提取, 得到全局特 征图; 分类模块, 用于对所述全局特 征图进行分类, 得到分类结果; 确定模块, 用于基于所述分类结果, 从多个 检测模式 中确定目标检测模式; 以及 检测模块, 用于按照所述目标检测模式处理所述全局特征图, 得到所述待检测图像的 文本检测结果。 9.根据权利要求8所述的装置, 其中, 所述分类模块包括: 第一卷积单元, 用于对所述全局特征图进行第一卷积操作, 得到第一卷积后的全局特 征图; 以及 分类单元, 用于对所述第一卷积后的全局特 征图进行分类, 得到所述分类结果。 10.根据权利要求8或9所述的装置, 其中, 所述确定模块包括: 第一确定单元, 用于在确定所述分类结果为分割分类结果的情况下, 确定所述目标检 测模式为分割检测模式; 以及 第二确定单元, 用于在确定所述分类结果为回归分类结果的情况下, 确定所述目标检 测模式为回归检测模式。 11.根据权利要求10所述的装置, 其中, 所述目标检测模式包括回归检测模式; 所述检测模块包括: 第二卷积单元, 用于对所述全局特征图进行第二卷积操作, 得到第二卷积后的全局特 征图; 以及 第一处理单元, 用于对所述第二卷积后的全局特征图进行非极大值抑制处理, 得到所 述待检测图像的文本检测结果。 12.根据权利要求10所述的装置, 其中, 所述目标检测模式包括分割检测模式; 所述检测模块包括: 第三卷积单元, 用于对所述全局特征图进行第三卷积操作, 得到第三卷积后的全局特 征图; 以及 第二处理单元, 用于对所述第三卷积后的全局特征图进行连通域标记处理, 得到所述 待检测图像的所述文本检测结果。 13.一种深度学习模型的训练装置, 包括: 样本提取模块, 用于对样本图像进行图像特 征提取, 得到样本全局特 征图; 样本检测模块, 用于按照多个检测模式分别处理所述样本全局特征图, 得到多个样本 文本检测结果; 样本确定模块, 用于基于所述多个样本文本检测结果, 确定所述样本图像的分类标签; 样本输入模块, 用于将所述样本全局特征图输入至深度学习模型中, 得到样本分类结 果; 以及 训练模块, 用于利用所述样本分类结果和所述分类标签, 训练所述深度 学习模型, 得到 经训练的深度学习模型。 14.根据权利要求13所述的装置, 其中, 所述样本确定模块包括: 第一样本确定单元, 用于从所述多个样本文本检测结果中确定目标样本文本检测结 果;权 利 要 求 书 2/3 页 3 CN 114998906 A 3

PDF文档 专利 文本检测方法、模型的训练方法、装置、电子设备及介质

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 文本检测方法、模型的训练方法、装置、电子设备及介质 第 1 页 专利 文本检测方法、模型的训练方法、装置、电子设备及介质 第 2 页 专利 文本检测方法、模型的训练方法、装置、电子设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:10:26上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。