(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210352578.8
(22)申请日 2022.04.06
(65)同一申请的已公布的文献号
申请公布号 CN 114445814 A
(43)申请公布日 2022.05.06
(73)专利权人 深圳市华汉伟业科技有限公司
地址 518000 广东省深圳市南 山区西丽 街
道西丽社区同发南路万科云城六期二
栋1702房-170 6房
(72)发明人 杨洋 黄涛 黄淦 林泽伟
李杰明
(74)专利代理 机构 深圳鼎合诚知识产权代理有
限公司 4 4281
专利代理师 郭燕 彭家恩(51)Int.Cl.
G06V 20/62(2022.01)
G06V 10/28(2022.01)
G06V 10/44(2022.01)
G06V 30/10(2022.01)
(56)对比文件
CN 107045 634 A,2017.08.15
CN 106874909 A,2017.0 6.20
CN 10725 6262 A,2017.10.17
CN 108898138 A,2018.1 1.27
US 2020401834 A1,2020.12.24
JP 201812 9689 A,2018.08.16
审查员 易浩民
(54)发明名称
一种字符区域提取方法、 计算机可读存储介
质
(57)摘要
一种字符区域提取方法、 计算机可读存储介
质, 其中方法包括: 获取待处理图像; 对待处理图
像进行灰度反转得到待处理反转图像, 分别提取
待处理图像和待处理反转图像的灰度盆地, 进行
筛选得到候选字符区域; 对候选区域进行距离变
换和形态学处理获得骨架区域, 利用膨胀处理后
的骨架区域的距离变换值估计笔画宽度; 根据笔
画宽度对骨架区域进行过滤。 该方法能够适应复
杂背景下的字符区域提取, 可以有效地将噪声等
非字符区域进行剔除, 提高了字符区域提取的稳
定性和准确性, 对于光照不均匀、 对比度较低的
场景下的字符区域检测, 也能有效提高稳定性。
权利要求书3页 说明书18页 附图10页
CN 114445814 B
2022.07.08
CN 114445814 B
1.一种字符区域 提取方法, 其特 征在于, 包括:
获取待处 理图像, 若所获取的待处 理图像为彩色图像则将其 转换为灰度图像;
对所述待处 理图像进行 灰度反转处 理, 得到待处 理反转图像;
分别将所述待处理图像和所述待处理反转图像作为输入图像, 对输入图像进行像素间
灰度值的比较以获取灰度盆地, 将所述待处理图像的灰度盆地作为第一字符初筛区域, 将
所述待处理反转图像的灰度盆地作为第二字符初筛区域, 其中灰度盆地指图像中相邻连通
区域的集合, 此集合内所有像素 的灰度值都小于或等于一数值, 且集合的外边缘像素 的灰
度值都大于该 数值;
根据预设的几何特征, 分别对所述第 一字符初筛区域和所述第 二字符初筛区域进行筛
选, 对筛选后位置对应的第一字符初筛区域和第二字符初筛区域, 根据两者的面积从中选
取一个作为 候选字符区域;
对候选字符区域进行距离变换, 使候选字符区域中每个像素点的值由变换前对应的像
素点到最近背景像素点的距离代替;
对进行距离变换后的所述候选字符区域进行形态学处理以获得骨架区域, 并对骨架区
域进行膨胀处理, 计算膨胀后的骨架区域中像素点的值的平均值 li, 利用平均值 li估计笔画
宽度Li, 其中下标i表示第i个骨架区域;
根据笔画宽度对骨架区域进行 过滤, 得到字符区域, 具体包括:
预先设置置信水平 p, 根据以下公式计算置信水平系数 cp:
,
将骨架区域的特 征向量xi代入以下公式计算得到 f(xi):
,
其中特征向量 xi=(Li,Ai),Ai表示骨架区域的面积, μ表示所有骨 架区域的特征向量的均
值, ∑表示特 征向量的协方差矩阵, n表示骨架区域的数量;
保留f(xi)< cpσ的骨架区域作为字符区域, 其中 σ表示所有骨架区域的特征向量的标准
差。
2.如权利要求1所述的字符区域提取方法, 其特征在于, 所述对输入图像进行像素间灰
度值的比较以获取 灰度盆地包括:
初始化步骤, 向用于存放组块的栈内存入一空组块, 该空组块的值为256, 组块用于存
储像素的坐标, 且坐标被存入组块的像素, 其灰度值不大于组块的值; 选取输入图像中任意
一像素作为源像素, 标注其已被访问过, 并把该源像素作为当前像素;
组块入栈步骤, 向栈内存入一空组块, 该组块的值为当前值, 当前值指当前像素的灰度
值;
邻域搜索步骤, 按顺序检查当前像素的邻域内的像素是否已被访 问过, 当检查到未被
访问过的像素时则执行第一灰度比较步骤, 当所有像素都已被访问过时则执行组块累计步
骤;权 利 要 求 书 1/3 页
2
CN 114445814 B
2第一灰度比较步骤, 将该未被访 问过的像素的灰度值与当前值进行比较, 当该未被访
问过的像素 的灰度值小于当前值时, 则将当前像素 的坐标存入堆中, 将该未被访问过的像
素作为新的当前像素, 标注其已被访问过, 并返回组块入栈步骤, 否则, 将该未被访问过的
像素的坐标存入堆中, 标注其已被访问过, 返回邻域搜索步骤, 其中堆用于存储边界像素的
坐标;
组块累计步骤, 将当前像素的坐标存入栈顶的组块中, 弹出堆中灰度值最小的像素的
坐标, 将该像素作为新的当前像素, 执行第二灰度比较步骤, 若堆中灰度值最小的像素不只
一个, 则按后进先 出的原则弹出, 若此时堆 为空则执 行灰度盆地生成步骤;
第二灰度比较步骤, 判断此时的当前值是否和上一个当前值相同, 若相同则返回邻域
搜索步骤, 否则执 行第三灰度比较步骤;
第三灰度比较步骤, 判断当前值是否小于栈顶第二个组块的值, 若是则将栈顶组块记
录到区域增长历史表中, 然后将当前值作为栈顶组块的值, 并返回邻域搜索步骤, 否则执行
组块合并步骤;
组块合并步骤, 将栈顶 组块记录到区域增长历史表中, 然后 合并栈顶的两个组块, 合并
后的组块的值 为其中较大者, 执 行第四灰度比较步骤;
第四灰度比较步骤, 判断当前值是否大于栈顶组块的值, 若是则返回第三灰度比较步
骤, 否则返回邻域搜索步骤;
灰度盆地生成步骤, 查找区域增长历史表中的父组块和子组块, 将所有父组块作为灰
度盆地, 其中子组块中的所有像素均包 含于其父组块中。
3.如权利要求2所述的字符区域提取方法, 其特征在于, 还包括: 每当栈中有更大的组
块的值出现时, 则将其记录为灰度阈值, 每当灰度阈值的变化达到预设的变化步长 δ时, 则
判断区域增长历史表中的组块是否为稳定区域, 其中当组块的面积 变化率小于预设的面积
变化阈值时则判定该组块 为稳定区域, 组块的面积变化 率根据以下公式计算:
,
其中q(i)表示灰度阈值 为i时组块的面积变化 率,Qi表示灰度阈值 为i时组块的面积。
4.如权利要求1所述的字符区域提取方法, 其特征在于, 所述几何特征包括面积、 长宽
比以及面积与外 接矩形面积的比值中的一 者或多者。
5.如权利要求1所述的字符区域提取方法, 其特征在于, 所述对筛选后位置对应的第 一
字符初筛区域和第二字符初筛区域, 根据两者的面积从中选取一个作为候选字符区域, 包
括:
计算第一字符初筛区域的面积和第 二字符初筛区域的面积, 以及两者的合并区域的面
积;
计算第一字符初筛区域与合并区域的面积比, 以及第 二字符初筛区域与合并区域的面
积比, 当两面积比均大于预设的面积比阈值时, 选取第一字符初筛区域和第二字符初筛区
域中, 与合并区域相交面积较大的作为 候选字符区域。
6.如权利要求1所述的字符区域提取方法, 其特征在于, 所述对候选字符区域进行距离
变换, 使候选字符区域中每个像素点的值由变换前对应的像素点到最近背 景像素点的距离
代替, 包括:权 利 要 求 书 2/3 页
3
CN 114445814 B
3
专利 一种字符区域提取方法、计算机可读存储介质
文档预览
中文文档
32 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共32页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:11:15上传分享