全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211264165.0 (22)申请日 2022.10.17 (71)申请人 杭州恒生聚源信息技 术有限公司 地址 310018 浙江省杭州市杭州经济技 术 开发区白杨街道科技园路2号2幢 1701-1714室 申请人 上海恒生聚源数据服 务有限公司 (72)发明人 孙勇 顾文斌 杨祎聪 李晓平  丁雪纯 于业达  (74)专利代理 机构 北京超凡宏宇专利代理事务 所(特殊普通 合伙) 11463 专利代理师 曹瑞敏 (51)Int.Cl. G06V 10/26(2022.01) G06V 10/56(2022.01)G06V 10/74(2022.01) G06V 10/764(2022.01) G06V 30/148(2022.01) G06T 7/11(2017.01) (54)发明名称 折线图的数据提取方法及处 理设备 (57)摘要 本申请的实施例提供了一种折线图的数据 提取方法及处理设备, 涉及图像模式识别领域。 利用图例检测模 型对待提取的折线图进行检测, 确定待提取的折线图的 图例区域; 根据图例区域 内空白区域的位置信息, 对图例区域进行分割处 理, 得到至少一个图例标识线区域以及至少一个 图例标识名区域; 分别对每个图例标识线区域以 及每个图例标识名区域进行识别, 得到每个图例 标识线的特征信息以及每个图例标识名的内容 信息; 根据每个图例标识线的特征信息及每个图 例标识名的内容信息, 对待提取的折线图的数据 区域中与特征信息对应的数据进行提取, 获得与 内容信息对应的至少一个目标数据值。 利用该图 例分割方法, 提高了图例识别效果, 还提高了折 线图数据提取准确性。 权利要求书3页 说明书16页 附图7页 CN 115331013 A 2022.11.11 CN 115331013 A 1.一种折线图的数据提取 方法, 其特 征在于, 包括: 利用图例检测模型对待提取的折线图进行检测, 确定所述待提取的折线图的图例区 域; 根据所述图例区域内空白区域的位置信息, 对所述图例区域进行分割处理, 得到至少 一个图例标识线区域以及至少一个图例标识名区域; 分别对每个所述图例标识线区域以及每个所述图例标识名区域进行识别, 得到每个所 述图例标识线的特 征信息以及每 个所述图例标识名的内容信息; 根据每个所述图例标识线的特征信 息及每个所述图例标识名的内容信 息, 对所述待提 取的折线图的数据区域中与所述特征信息对应的数据进行提取, 获得与所述内容信息对应 的至少一个目标 数据值。 2.根据权利要求1所述的折线图的数据提取方法, 其特征在于, 所述对所述图例区域进 行分割处 理, 得到至少一个图例标识线区域以及至少一个图例标识名区域, 包括: 获得所述图例区域对应的水平排布图形; 对所述水平排布图形中像素变化 值进行遍历识别; 当目标位置的像素点变化值满足空白区域识别条件时, 确定所述目标位置为空白区域 的位置信息; 根据多个所述空白区域的位置信息, 对所述水平排布区域进行分割, 确定多个内容区 域; 对各所述内容区域进行分析, 确定全部所述图例标识线区域以及所述图例标识名区 域。 3.根据权利要求2所述的折线图的数据提取方法, 其特征在于, 所述获得所述图例区域 对应的水平排布图形, 包括: 根据所述图例区域内各待识别子区域的排布顺序, 确定所述图例区域的图例分布类 型; 若所述图例分布类型为垂直分布类型或表格分布类型, 则根据 各所述待识别 子区域在 水平方向的投影结果, 将各 所述待识别子区域进行 水平分割, 获得多个水平排布图形。 4.根据权利要求2所述的折线图的数据提取方法, 其特征在于, 所述对各所述内容区域 进行分析, 确定全部所述图例标识线区域以及所述图例标识名区域, 包括: 对各所述内容区域进行初步遍历, 将各所述内容 区域划分为多个初始图例标识线区域 以及多个初始图例标识名区域; 若初始标识线区域均满足直线识别条件, 则将所述初始标识线区域作为图例标识线区 域, 所述初始图例标识名区域作为所述图例标识名区域, 并将所述图例标识线区域的类型 标记为直线标识线区域类型; 若所述初始标识线区域均满足符号识别条件, 则将所述初始标识线区域作为图例标识 线区域, 所述初始图例标识名区域作为所述图例标识名区域, 并将所述图例标识线区域的 类型标记为符号标识线区域类型。 5.根据权利要求 4所述的折线图的数据提取 方法, 其特 征在于, 所述方法还 包括: 对各所述图例标识线区域进行矫正处理, 将满足标识名识别条件的图例标识线区域作 为图例标识名区域。权 利 要 求 书 1/3 页 2 CN 115331013 A 26.根据权利要求2所述的折线图的数据提取方法, 其特征在于, 所述当目标位置的像素 点变化值满足空白条件时, 确定所述目标位置为空白区域的位置信息, 包括: 对所述水平排布图形进行垂直投影, 得到垂直投影图形; 对所述垂直投影图形中各像素点进行投影计算, 得到各所述像素点的投影值以及投影 变动值; 根据各所述像素点的投影值以及投影变动值, 对所述水平排布图形中各像素点进行遍 历, 将满足空白区域识别条件的多个像素所在的区域的位置信息作为空白区域的位置信 息。 7.根据权利要求1所述的折线图的数据提取方法, 其特征在于, 所述根据每个所述图例 标识线的特征信息及每个所述图例标识名的内容信息, 对所述待提取的折线图的数据区域 中与所述特征信息对应的数据进行提取, 获得与所述内容信息对应的至少一个目标数据 值, 包括: 利用直线检测模型对所述待提取的折线图进行识别, 确定所述待提取的折线图的数据 区域以及坐标信息; 将所述图例标识线的特征信 息与所述数据区域内坐标信 息对应的区域进行匹配, 得到 与各所述图例标识名的内容信息对应的至少一个目标 数据值。 8.根据权利要求7所述的折线图的数据提取方法, 其特征在于, 所述将所述图例标识线 的特征信息与所述数据区域内坐标信息对应的区域进 行匹配, 得到与各所述图例标识名的 内容信息对应的至少一个目标 数据值, 包括: 若所述图例标识线的特征信 息为颜色特征, 则 计算所述颜色特征与 所述坐标信 息中各 横轴刻度点对应的区域内的多个像素点的颜色特征之 间的颜色值距离, 并将所述颜色值距 离小于预设颜色阈值且 满足预设斜 率条件的像素点作为对应的数据值 点; 根据各所述数据值点与坐标信 息的相对位置关系, 确定各所述数据值点对应的目标数 据值。 9.根据权利要求7所述的折线图的数据提取方法, 其特征在于, 所述根据 所述图例标识 线的特征信息、 各所述图例标识名的内容信息, 对所述数据区域内坐标信息对应的位置进 行匹配, 得到各 所述图例标识名的内容信息对应的多个数据值, 包括: 若所述图例标识线的特征信 息为符号特征, 则 计算所述符号特征与 所述坐标信 息中各 横轴刻度点对应的区域进行模式匹配, 得到 至少一个待选区域; 将至少一个所述待选区域的中心点 坐标作为对应的数据值 点; 根据各所述数据值点与坐标信 息的相对位置关系, 确定各所述数据值点对应的目标数 据值。 10.一种折线图的数据提取装置, 其特 征在于, 包括: 图例检测模块, 用于利用图例检测模型对待提取的折线图进行检测, 确定所述待提取 的折线图的图例区域; 图例分割模块, 用于根据所述图例区域内空白区域的位置信息, 对所述图例区域进行 分割处理, 得到至少一个图例标识线区域以及至少一个图例标识名区域; 图例识别模块, 用于分别对每个所述图例标识线区域以及每个所述图例标识名区域进 行识别, 得到每 个所述图例标识线的特 征信息以及每 个所述图例标识名的内容信息;权 利 要 求 书 2/3 页 3 CN 115331013 A 3

PDF文档 专利 折线图的数据提取方法及处理设备

文档预览
中文文档 27 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 折线图的数据提取方法及处理设备 第 1 页 专利 折线图的数据提取方法及处理设备 第 2 页 专利 折线图的数据提取方法及处理设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:58:18上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。