全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211342704.8 (22)申请日 2022.10.31 (71)申请人 蓝舰信息科技 南京有限公司 地址 211100 江苏省南京市江宁区天元东 路1009号(江宁科 学园) (72)发明人 余海涛 陈明  (74)专利代理 机构 苏州市知腾 专利代理事务所 (普通合伙) 32632 专利代理师 李建 (51)Int.Cl. G06V 30/148(2022.01) G06V 30/244(2022.01) G06V 10/82(2022.01) (54)发明名称 一种手写体文本精准分割方法 (57)摘要 本发明涉及图像数据处理领域, 具体涉及一 种手写体文本精准分割方法, 包括: 获取手写体 文本灰度图中的行区域及行区域中列像素点中 的突变点; 利用行区域中列像素点中的突变点个 数获取行区域中的分割 列; 利用行区域中各子区 域的分割列和突变点构建初始分割框; 利用初始 分割框中分割列中的突变点、 分割列的邻域内的 突变点获取分割列的相似突变点连线, 进而 得到 初始分割框中分割 列的调整必要性; 利用个人书 写特征框的宽度、 初始分割框中分割列的列序号 和调整必要性, 得到初始分割框的宽度调整后的 大小; 根据初始分割框的宽度调整后的大小 得到 第二分割框, 利用第二分割框对手写体文本进行 分割。 上述方法用于分割手写体文本, 可提高分 割准确性。 权利要求书3页 说明书10页 附图2页 CN 115393861 A 2022.11.25 CN 115393861 A 1.一种手写体文本精准分割方法, 其特 征在于, 包括: 获取去噪后的手写体文本灰度图中的每一个行区域; 利用行区域中列像素点的灰度值与背景灰度值的差值获取行区域中每一列像素点中 的突变点; 利用行区域中每一列像素点中的突变点个数获取疑似分割列, 利用疑似分割列在行区 域中的位置获取 行区域中的分割列; 根据分割列在行区域中的位置获取 行区域中的分割列的列序号; 将所有分割列中任意相邻的两个分割列 作为边界, 将行区域划分为多个子区域; 利用各子区域中的分割列和各子区域中每一列像素点中突变点的位置构建行区域中 的初始分割框; 利用初始分割框 中分割列中突变点的位置和灰度值、 分割列的邻域内突变点的位置和 灰度值, 获取分割列的相似突变点连线; 计算分割列的相似突变点连线中位于初始分割框外的连线中突变点的数量占分割列 的相似突变点连线中突变点的数量的比例, 得到初始分割框中分割列的调整必要性; 获取个人书写特征框的宽度, 利用个人书写特征框的宽度、 初始分割框中分割列的列 序号、 初始分割框中分割列的调整必要性, 计算得到初始分割框的宽度调整后的大小; 根据初始分割框的宽度调 整后的大小得到第 二分割框, 利用第 二分割框对行区域中的 手写体文本进行分割。 2.根据权利要求1所述的一种手写体文本精准分割方法, 其特征在于, 所述行区域中每 一列像素点中的突变点是按照如下 方式获取: 统计去噪后的手写体文本灰度图中所有像素点的灰度值的频 数; 将所有频 数按照从大到小的方式进行排序, 获取序列中前5个频 数对应的灰度值; 计算序列中前5个频 数对应的灰度值的均值, 将该 灰度值均值作为背景 灰度值; 计算行区域中列像素点的灰度值与背景 灰度值的差值; 设置灰度值差值第 一阈值, 对行区域中列像素点的灰度值与背景灰度值的差值进行判 断: 当行区域中列像素点的灰度值与背景灰度值的差值大于等于灰度值差值第一阈值时, 则该列像素点为突变点; 当行区域中列像素点的灰度值与背 景灰度值的差值小于灰度值差 值第一阈值时, 则该列像素点 不为突变点。 3.根据权利要求1所述的一种手写体文本精准分割方法, 其特征在于, 所述行区域中的 分割列是按照如下 方式获取: 统计行区域中每一列像素点中的突变点个数; 设置突变点个数阈值范围, 对行区域中每一列像素点中的突变点个数进行判断: 当行 区域中列像素点中的突变点个数处于突变点个数阈值范围时, 则该列为疑似分割列; 当行 区域中列像素点中的突变点个数不处于突变点个数阈值范围时, 则该列不是疑似分割列; 将每个疑似分割列作为第一分割列, 对每个第一分割列进行判断: 当第一分割列的相 邻列不是疑似分割列时, 则将第一分割列确定为分割列; 当第一分割列的相邻列是疑似分割列时, 则进行如下步骤: 将第一分割列及其相邻列划分为 一个集合, 得到第一 集合; 将第一分割列的相邻列作为第二分割列, 判断第二分割列的相邻列是否为疑似分割权 利 要 求 书 1/3 页 2 CN 115393861 A 2列, 若第二分割 列的相邻列是疑似分割列时, 则将第二分割列的相 邻列划分到第一集合, 得 到更新后的第一 集合; 按照得到更新后的第一集合的方式对更新后的第一集合中的疑似分割列的相邻列进 行迭代判断, 直至更新后的第一集合中的所有疑似分割列的相邻列都不是疑似分割列时, 迭代停止, 得到第二 集合; 将第二集合中位置最靠右的列确定为分割列。 4.根据权利要求1所述的一种手写体文本精准分割方法, 其特征在于, 所述行区域中的 初始分割框是按照如下 方式构建: 将所有分割列中任意相邻的两个分割列 作为边界, 将行区域划分为多个子区域; 计算每个子区域中两个分割列之间的横向距离, 将 横向距离作为初始分割框的宽度; 获取每个子区域中突变点的纵坐标最小值和纵坐标最大值, 将该子区域中突变点的纵 坐标最小值和纵坐标最大值进行作差, 将差值作为初始分割框的长度; 利用初始分割框的宽度和长度、 每个子区域中的分割列、 每个子区域中突变点的纵坐 标最小值和纵坐标最大值构建行区域中的初始分割框 。 5.根据权利要求1所述的一种手写体文本精准分割方法, 其特征在于, 所述分割列的相 似突变点连线是按照如下 方式获取: 选取初始分割框的右分割列中的任意 一个突变点作为第一 突变点; 计算第一 突变点与右分割列的相邻列中的每 个突变点之间的欧式距离; 将右分割列的相邻列中与第一突变点之间的欧式距离最小的突变点作为第一突变点 的匹配点; 计算第一 突变点与其匹配点的灰度值差值; 设置灰度值差值第二阈值, 对第一突变点与其匹配点的灰度值差值进行判断: 当第一 突变点与其匹配点的灰度值差值小于灰度值差值第二阈值时, 则第一突变点与其匹配点相 似, 将两点进行 连接; 反之则不进行 连接; 将与第一突变点相似的匹配点作为第 二突变点, 计算第 二突变点与右侧相邻列中的每 个突变点之 间的欧式距离, 将右侧相 邻列中与第二突变点之间的欧式距离最小的突变点作 为第二突变点的匹配点; 对第二突变点与其匹配点的灰度值差值进行判断: 当第 二突变点与其匹配点的灰度值 差值小于灰度值差值第二阈值时, 则第二 突变点与其匹配点相似, 将两点进行 连接; 按照对第二突变点与其匹配点判断的方式对初始分割框外的突变点是否与右分割列 中的突变点相似进行迭代判断, 直至不存在初始分割框外的突变点与 右分割列中的突变点 相似时, 迭代 停止, 获取 过右分割列的右侧相似突变点连线; 按照获取过右分割列的右侧相似突变点连线的方法获取过右分割列的左侧相似突变 点连线; 将过右分割列的右侧相似突变点连线和过右分割列的左侧相似突变点连线进行连接, 获取过右分割列的相似突变点连线; 按照获取 过右分割列的相似突变点连线的方法获取 过左分割列的相似突变点连线。 6.根据权利要求1所述的一种手写体文本精准分割方法, 其特征在于, 所述初始分割框 中分割列的调整必要性是按照如下 方式得到:权 利 要 求 书 2/3 页 3 CN 115393861 A 3

PDF文档 专利 一种手写体文本精准分割方法

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种手写体文本精准分割方法 第 1 页 专利 一种手写体文本精准分割方法 第 2 页 专利 一种手写体文本精准分割方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:26:47上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。