全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210110162.5 (22)申请日 2022.01.28 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 范森 乔美娜 刘珊珊 吕鹏原  章成全 姚锟  (74)专利代理 机构 中科专利商标代理有限责任 公司 11021 专利代理师 杨静 (51)Int.Cl. G06V 10/24(2022.01) G06V 10/26(2022.01) G06V 10/44(2022.01) (54)发明名称 文本图像矫正方法、 装置、 电子设备以及存 储介质 (57)摘要 本公开提供了一种文本图像矫正方法、 装 置、 电子设备 以及存储介质, 涉及人工智能技术 领域, 具体为深度学习、 计算机视觉技术领域, 可 应用于光学字符识别等场景。 具体实现方案为: 从待矫正文本图像的待矫正文本区域的边界中 确定至少一个第一备选控制点序列; 根据至少一 个第一备选控制点序列包括的多个第一备选控 制点各自的位置信息和与待矫正文本图像对应 的预期文本图像的预期控制点序列包括的多个 预期控制点各自的位置信息, 得到至少一个备选 矫正文本图像的备选矫正文本图像数据; 根据对 至少一个备选矫正文本图像的备选矫正文本图 像数据进行评估 得到的评估结果, 从至少一个备 选矫正文本图像中确定目标矫 正文本图像 。 权利要求书4页 说明书16页 附图6页 CN 114494686 A 2022.05.13 CN 114494686 A 1.一种文本图像矫 正方法, 包括: 从待矫正文本图像的待矫正文本区域的边界中确定至少一个第 一备选控制点序列, 其 中, 所述第一备选控制点序列包括多个第一备选控制点; 根据所述至少一个第一备选控制点序列包括的多个第一备选控制点各自的位置信息 和与所述待矫正文本图像对应的预期文本图像的预期控制点序列包括的多个预期控制点 各自的位置信息, 得到 至少一个备选矫 正文本图像的备选矫 正文本图像数据; 以及 根据对所述至少一个备选矫正文本图像的备选矫正文本图像数据进行评估得到的评 估结果, 从所述至少一个备选矫 正文本图像中确定目标矫 正文本图像。 2.根据权利要求1所述的方法, 其中, 所述根据对所述至少一个备选矫正文本图像的备 选矫正文本图像数据进行评估得到的评估结果, 从所述至少一个备选矫正文本图像中确定 目标矫正文本图像, 包括: 对所述至少一个备选矫正文本图像的备选矫正文本图像数据进行评估, 得到所述至少 一个备选矫 正文本图像各自的评估值; 从所述至少一个备选矫 正文本图像各自的评估值中确定目标评估值; 以及 将与所述目标评估值对应的备选矫 正文本图像确定为所述目标矫 正文本图像。 3.根据权利要求1或2所述的方法, 其中, 所述对所述至少一个备选矫正文本 图像的备 选矫正文本图像数据进行评估, 得到所述至少一个备选矫 正文本图像各自的评估值, 包括: 利用平整文本图像识别模型处理所述至少一个备选矫正文本图像的备选矫正文本图 像数据, 得到所述至少一个备选矫 正文本图像各自的评估值, 其中, 所述平整文本 图像识别模型是利用训练样本训练预定分类器得到的, 所述训练 样本包括样本平整文本图像的样本平整文本图像数据和样本扭曲文本图像的样本扭曲文 本图像数据, 所述样本扭曲文本图像数据是对所述样本平整文本图像数据进 行扭曲处理得 到的。 4.根据权利要求3所述的方法, 其中, 所述样本扭曲文本图像数据 是对所述样本平整文 本图像数据进行 扭曲处理得到的, 包括: 所述样本扭曲文本图像数据 是基于预定变换算法, 根据第 一样本控制点序列包括的多 个第一样本控制点各自的位置信息和与所述样本平整文本图像对应的第二样本控制点序 列包括的多个第二样本控制点各自的位置信息得到的, 其中, 所述第一样本控制点序列是 根据所述第二样本控制点序列得到的。 5.根据权利要求1~4中任一项所述的方法, 其中, 所述从待矫正文本 图像的待矫正文 本区域的边界中确定 至少一个第一备选控制点序列, 包括: 从所述待矫正文本图像的待矫正文本区域的边界中确定多个第 二备选控制点序列; 以 及 从所述多个第二备选控制点序列中确定所述至少一个第一备选控制点序列。 6.根据权利要求5所述的方法, 其中, 所述第 二备选控制点序列包括多个第 二备选控制 点, 所述多个第二备选控制点包括所述待矫正文本区域沿阅读方向的第一边界上 的M个第 二备选控制点和第二 边界上的M个第二备选控制点; 其中, 与第0序号对应的第二备选控制点表征左上角点, 与第(M ‑1)序号对应的第二备 选控制点表征右上角点, 与第M序号对应的第二备选控制点表征右下角点, 与第(2M ‑1)序号权 利 要 求 书 1/4 页 2 CN 114494686 A 2对应的第二备选控制点表征左下角点, 其中, M是 大于或等于1的整数。 7.根据权利要求6所述的方法, 其中, 所述从所述多个第 二备选控制点序列中确定至少 一个第一备选控制点序列, 包括: 针对所述多个第 二备选控制点序列中的每个第 二备选控制点序列, 在根据所述第 一边 界上的与第k序号对应的第二备选控制点的位置信息、 所述第二边界上的与第(k+M)序号对 应的第二备选控制点的位置信息、 所述第一边界上 的与第h序号对应的第二备选控制点的 位置信息和所述第二边界上的与第(h+M)序号对应的第二备选控制点的位置信息, 确定第k 线段与第h线段未相交的情况下, 将所述第二备选控制点序列确定为所述第一备选控制点 序列, 其中, 所述第k线段是根据与所述第k序号对应的第二备选控制点和与所述第(k+M)序 号对应的第二备选控制点确定的; 其中, 所述第h线段是根据与所述第h序号对应的第二备选控制点和与所述第(h+M)序 号对应的第二备选控制点确定的; 其中, k和h均是 大于或等于 0且小于或等于(M ‑1)的整数且k≠ h。 8.根据权利要求6或7所述的方法, 其中, 所述从所述待矫正文本 图像的待矫正文本区 域的边界中确定多个第二备选控制点序列, 包括: 基于预定排序策略, 对所述多个第二备选控制点各自的序号进行多次调整, 得到每次 调整后的序号序列; 以及 根据所述每次调整后的序号序列, 得到每 个所述第二备选控制点序列。 9.根据权利要求8所述的方法, 其中, 所述基于预定排序策略, 对所述多个第二备选控 制点各自的序号进行多次调整, 得到每次调整后的序号序列, 包括: 针对第i次调整, 将与初始序号为第i序号对应的第二备选控制点的序号调整为第0序 号, 其中, i是 大于或等于1且小于或等于(2M ‑1)的整数; 在j‑i>0的情况下, 将与初始序号为第j序号对应的第二备选控制点的序号调整为第 (j‑i)序号, 其中, j是 大于或等于1且小于或等于(2M ‑1)的整数且j≠i; 以及 在j‑i<0的情况下, 将与初始序号为第j序号对应的第二备选控制点的序号调整为第 (j+2M‑i)序号。 10.根据权利要求1~9中任一项所述的方法, 其中, 所述根据所述至少一个第 一备选控 制点序列包括的多个第一备选控制点各自的位置信息和与所述待矫正文本图像对应的预 期文本图像的预期控制点序列包括的多个预期控制点各自的位置信息, 得到至少一个备选 矫正文本图像的备选矫 正文本图像数据, 包括: 基于预定变换算法, 根据所述至少一个第 一备选控制点序列包括的多个第 一备选控制 点各自的位置信息和与所述待矫正文本图像对应的预期文本图像的预期控制点序列包括 的多个预期控制点各自的位置信息, 得到所述至少一个备选矫正文本图像的备选矫正文本 图像数据。 11.根据权利要求10所述的方法, 其中, 所述预定变换算法包括薄板样条插值 算法。 12.一种文本图像矫 正装置, 包括: 第一确定模块, 用于从待矫正文本图像的待矫正文本区域的边界中确定至少一个第 一 备选控制点序列, 其中, 所述第一备选控制点序列包括多个第一备选控制点;权 利 要 求 书 2/4 页 3 CN 114494686 A 3

PDF文档 专利 文本图像矫正方法、装置、电子设备以及存储介质

文档预览
中文文档 27 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 文本图像矫正方法、装置、电子设备以及存储介质 第 1 页 专利 文本图像矫正方法、装置、电子设备以及存储介质 第 2 页 专利 文本图像矫正方法、装置、电子设备以及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:12:14上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。