全网唯一标准王
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210603229.9 (22)申请日 2022.05.31 (65)同一申请的已公布的文献号 申请公布号 CN 114694162 A (43)申请公布日 2022.07.01 (73)专利权人 深圳航天信息有限公司 地址 518000 广东省深圳市宝安区新 安街 道兴东社区69区洪浪北二路26号信义 领御研发中心8栋 601 (72)发明人 仇庆宇 李淼 巨东敏  (74)专利代理 机构 郑州知倍 通知识产权代理事 务所(普通 合伙) 41191 专利代理师 李玲玲 (51)Int.Cl. G06V 30/42(2022.01)G06V 10/50(2022.01) G06V 10/44(2022.01) G06V 30/148(2022.01) G06V 30/16(2022.01) G06T 7/11(2017.01) 审查员 邱立英 (54)发明名称 基于图像处 理的发票图像识别方法及系统 (57)摘要 本发明涉及图像处理技术领域, 具体涉及一 种基于图像处理的发票图像识别方法及系统。 该 方法包括: 获得只包含机打内容的差值图像; 根 据差值图像中的边缘像素点的梯度直方图; 选择 一个预设梯度方向的边缘像素点作为角点, 同时 筛选获得第一角点; 获得字符区域, 字符区域为 一个完整机打字符串的最小外接矩形; 利用第一 角点之间的结构参数对所有字符区域中的每个 字符周围的第一角点进行筛选获得字符区域中 所有字符的结构角点; 根据字 符区域中属于每个 字符的结构角点的坐标对字 符进行分割并识别。 能够大大减少SIFT角点检测所保留的冗余角点, 减少了所有像素点的重复运算和判断; 进一步减 少冗余角点对字符分割的影 响, 得到精确的字 符 分割信息 。 权利要求书2页 说明书7页 附图1页 CN 114694162 B 2022.08.16 CN 114694162 B 1.一种基于图像处理的发票图像识别方法, 其特征在于, 该方法包括: 将机打发票图像 和标准发票模板图像进行作差获得只包含机打内容的差值图像; 获得差值图像中的边缘像 素点, 根据边缘像素点的梯度方向构建梯度直方图; 利用梯度直方图选择一个预设梯度方 向的边缘像素点作为角点; 根据角点邻域范围内像素点的不同梯度方向的数量, 以及角点与邻域范围内像素点的 梯度幅值的方差获得梯度复杂度; 设定梯度阈值, 梯度复杂度大于梯度阈值的角点为第一 角点; 对差值图像进 行区域划分, 获得字符区域, 字符区域为一个完整机 打字符串的最小外 接矩形; 获得字符区域中的第一角点中的位于左上角的角点作为字符区域第一个字符的起始 角点, 基于起始角点与其最邻近的第一角点的水平方向的偏移距离、 竖直方向上 的偏移距 离和偏移角度获得结构参数; 设定结构阈值, 将结构参数小于结构 阈值的最邻近的第一角 点剔除, 该过程为角点剔除过程; 若起始角点的最邻近的第一角点被剔除, 获得与起始角点 第二邻近的第一角点进行角点剔除过程, 若起始角点的最邻近的第一角点未被剔除, 获得 与起始角点的最邻近的第一角点的最邻近的第一角点进行角点剔除过程, 直至得到第一个 字符的结构角点, 获得字符区域中所有字符的结构角点; 根据字符区域中属于每个字符的 结构角点的坐标对字符进行分割, 对分割后的字符进行识别。 2.根据权利要求1所述的一种基于图像处理 的发票图像识别方法, 其特征在于, 所述根 据边缘像素点的梯度方向构建梯度直方图包括: 将 360度均匀划分为预设数量的方向范围, 统计属于每 个方向范围的边 缘像素点的个数构建梯度灰度直方图。 3.根据权利要求1所述的一种基于图像处理 的发票图像识别方法, 其特征在于, 所述梯 度复杂度为: 其中, 表示角点的梯度复杂度; 表示角点8邻域范围内像素点的不同梯度方 向的数 量; 表示角点8邻域范围内第i个像素点的梯度幅值; 表示角点8邻域范围内像素点的梯 度幅值的平均值; 表示角点8邻域范围的8个 像素点。 4.根据权利要求1所述的一种基于图像处理 的发票图像识别方法, 其特征在于, 所述对 差值图像进行区域划分, 获得字符区域包括: 根据差值图像中每个完整的字符串中每个字 符的最上方、 最下方的第一角点以及完整字符串中最左侧和最右侧的第一角点获得每个完 整的字符串的最小外 接矩形, 所述 最小外接矩形为 一个字符区域。 5.根据权利要求1所述的一种基于图像处理 的发票图像识别方法, 其特征在于, 在所述 获得结构参数之前还包括: 在差值图像中建立直角坐标系, 以x轴 方向作为中心方向, 向上 和向下各旋转 所得到的一个角度范围; 以y轴方向作为中心方向, 向左和向右各旋转 得到的一个角度范围; 将两个角度范围进行组合获得一个角度区域, 获得该角度区域内 的第一角点, 记为待剔除角点。 6.根据权利要求1所述的一种基于图像处理 的发票图像识别方法, 其特征在于, 所述结权 利 要 求 书 1/2 页 2 CN 114694162 B 2构参数为: 其中, 在差值图像 中建立直角坐标系; 表示结构参数; 表示起始角点在x轴方向上, 即水平方向上与其最邻近的第一角点之间的距离, 为偏 移距离; 表示起始角点在y轴方向 上, 即竖直方向上与其最邻近的第一角点之间的距离, 为偏移距离; 表示机打 的字符在 未发生偏移时字符水平方向上的宽度; 表示机打的字符在未发生偏移时字符竖直方向 上的高度; 表示起始角点与其最邻近的角点之间的偏移角度, 偏移角度 以x轴正方向为 初始 , 逆时针方向旋转 来定义角度大小。 7.根据权利要求1所述的一种基于图像处理 的发票图像识别方法, 其特征在于, 所述得 到第一个字符的结构角点包括: 获得字符区域中第一个字符的起始角点, 计算起始角点与 其最邻近的第一角点之间的结构参数, 若结构参数小于结构 阈值, 则将最邻近的第一角点 剔除, 获取起始角点与第二邻近的第一角点之 间的结构参数, 若 结构参数小于结构阈值, 将 第二邻近的第一角点剔除; 若结构参数大于结构阈值, 则保留第二邻近的第一角点, 计算与第二邻近的第一角点 最邻近的第一角点与第二邻近的第一角点之间的结构参数, 若结构参数大于结构 阈值, 将 与第二邻近的第一角点 最邻近的第一角点保留; 若起始角点与其最邻 近的第一角点之间的结构参数大于结构阈值, 则保留与起始角点 最邻近的第一角点, 计算与起始角点最邻近的第一角点与最邻近的第一角点的最邻近的第 一角点之间的结构参数, 若结构参数大于结构阈值, 则将与最邻近的第一角点的最邻近的 第一角点保留, 其中剔除的第一角点都为待剔除角点中的角点。 8.根据权利要求1所述的一种基于图像处理 的发票图像识别方法, 其特征在于, 在所述 得到第一个字符的结构角点之后还包括: 将第一个字符的结构角点两两之间用直线相连, 若一个结构角点所对应的直线中不存在与第一个字符相交的直线, 则该结构角点不属于第 一个字符的结构角点; 获得不属于第一个字符的结构角点用于第二个字符的结构角点的判 断。 9.根据权利要求1所述的一种基于图像处理 的发票图像识别方法, 其特征在于, 所述根 据字符区域中属于每个字符的结构角点的坐标对字符进行分割, 对分割后的字符进行识别 包括: 根据一个字符区域中的每个字符的结构角点的坐标获得每个字符的最小外接矩形, 完成对一个字符区域中每个字符的分割; 基于字符的语义特征利用神经网络对分割后的字 符进行识别。 10.一种基于图像处理 的发票图像识别系统, 包括存储器、 处理器以及存储在存储器上 并可在处理器上运行 的计算机程序, 其特征在于, 所述计算机程序被处理器执行时实现如 权利要求1至9任一项所述 一种基于图像处 理的发票图像识别方法的步骤。权 利 要 求 书 2/2 页 3 CN 114694162 B 3

PDF文档 专利 基于图像处理的发票图像识别方法及系统

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于图像处理的发票图像识别方法及系统 第 1 页 专利 基于图像处理的发票图像识别方法及系统 第 2 页 专利 基于图像处理的发票图像识别方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:10:20上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。