前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >图表解析技术:逆向提取图表数据,需要哪几步?

图表解析技术:逆向提取图表数据,需要哪几步?

原创
作者头像
合合技术团队
发布2025-03-06 10:31:03
发布2025-03-06 10:31:03
260
举报

对于我们时代的所有“PPT工作者”来说,图表是一位熟悉的“老朋友”了。

通过Office、编程语言库或是更丰富的生成工具,我们能够便捷地将数据绘制成美观、抓眼、适宜展示的图表,在各类汇报、讲演、宣传工作里起到比表格数字更直观的效果。

然而,当我们产生了与之相反的需求:将各色报告或论文中的图表逆向转化为原始数据,用于数据处理分析,又应该怎么做呢?

与绘制图表相比,解析它们的任务提出了更精密的技术要求。本期内容中,我们将初步探讨图表解析技术的构成与发展历程。

分步完成任务

通过流程图,我们可以简单理解图表识别的流程。下面,我们将对这些步骤中的几个特殊环节进行拆解。

1.图表检测与定位:锁定数据可视化区域

图表检测与定位是图表解析的第一步,其核心任务是在复杂文档(如PDF、扫描件或截图)中精准识别图表边界框。早期方法依赖边缘检测和形态学操作(如OpenCV),但难以处理重叠元素,2016年后,基于深度学习的目标检测模型成为主流解决方案。但当前技术仍面临一些挑战,例如手绘草图边界模糊导致漏检,以及图文混排场景下的误判。工业界常采用级联检测策略——先用轻量级模型快速筛选候选区域,再用高精度模型二次验证。

2.图表类型分类:准确识别特征

图表类型分类旨在通过识别图表的视觉特征和表示形式,区分不同类型的图表,如条形图、饼图、折线图、散点图和热力图等。准确识别这些图表类型对于后续的数据挖掘和分析至关重要,因为每种图表类型都要求特定的数据提取方法。例如,在折线图中,关键点(如转折点和端点)的识别是至关重要的;而在柱状图中,则需要关注数据及其相关的文本标签。 深度学习技术,特别是卷积神经网络(CNN),已经成为图像分类任务中的主流方法。VGG、ResNet、Inception和EfficientNet等模型在从图表图像中提取高级特征方面表现出色。迁移学习的应用进一步提升了分类精度,使得从自然图像中学到的特征能够应用于图表分类任务[1]。然而,基于CNN的方法在处理噪声或视觉上相似的图表时可能遇到挑战。为了解决这些问题,视觉Transformer通过局部窗口注意力机制有效管理全局和局部图像特征,提高了复杂图表的处理性能[2]。

3.图表结构分析:解剖数据架构

该步骤的目的是解析图表的基础架构,包括坐标轴范围、数据点空间位置及颜色编码逻辑。传统方法利用霍夫变换检测直线(坐标轴)和圆形(饼图),但对变形图表适应性差。深度学习方案中,Poco等(2017)提出基于CNN的网络方法,可定位折线图顶点和柱状图立柱[3]。颜色编码解析需结合HSV色彩空间分析与图例位置匹配,IBM研究院开发的ChartParser系统(2022)通过利用颜色信息进行数据关联[4]。

4.数据重建与映射:从像素到信息的转化法则

此阶段将视觉元素转化为结构化数据,核心任务包括数值归一化与语义绑定。坐标轴映射采用线性插值算法,将像素位置转换为实际值。图例-数据系列绑定则主要依赖颜色/纹理相似度匹配,完成文本与视觉元素之间的相关性映射。

技术发展简史

1.规则驱动时代(1990s-2000s)

早期的图表解析依赖人工预设规则。研究者通过模板匹配识别基本图形(如圆形判定为饼图),结合OCR提取文字标签,再通过坐标轴比例换算数值。这类方法对标准化印刷图表(如学术论文中的柱状图)有一定效果,但灵活性极低,无法处理复杂布局或变形图表。典型代表如Futrelle团队开发的基于约束文法的图表分析方法[5],能解析部分图表,但需手动标注特征,针对每种图表类型单独设计规则。这一阶段效率和准确率较为低下,仅能处理印刷文档中的规范图表。

2.机器学习崛起(2005-2015)

随着机器学习的普及和特征工程的发展,研究者开始提取颜色分布、几何形状等统计特征,结合支持向量机(SVM)、隐马尔可夫模型(HMM)进行分类,实现多类型图表解析,但仍需人工定义特征规则[6],同期,图表解析技术开始初步商用化。

3.深度学习突破与多模态融合(2016-至今)

卷积神经网络(CNN)改变了特征提取方式。以DeepChart(2018)为代表的端到端模型,可直接从像素输入预测图表类型和数据结构[7]。ResNet、U-Net等架构被用于坐标轴检测和数据点分割,显著提升了堆叠图、雷达图等复杂图表的解析能力。2021年后,Transformer架构与视觉-语言预训练模型(VLP)成为技术发展的新引擎。

复杂图表案例

目前,图表解析技术能力不断增强,商用产品已经实现复杂图表的精准识别与数据还原。

如图中,柱状图数据与折线图拐点、标签均判断准确,对应输出为结构化数据。

对于没有明确数值标注的堆叠柱状图(Stacked Bar Chart),现有模型也能提供测量后的预估值,为数据分析提供依据。

图表解析技术通过计算机视觉与自然语言处理协同工作,将图像中的图表转化为结构化数据,当前已在学术及商业领域落地应用。在金融分析工作中,它能自动提取财报图表数据,提升投研效率;在学术领域,能协助论文图表数据快速复用,避免手动录入带来的传统错漏与人力损耗。在多模态大模型不断发展的背景下,未来,多模态大模型与知识推理的结合,将不断推进解析技术的边界,实现“看懂图表逻辑”的认知级解析。

参考文献 [1] Alex Krizhevsky, Ilya Sutskever, and Geoffrey E Hinton. Imagenet classification with deep convolutional neural networks. Advances in neural information processing systems, 25, 2012. [2] Kenny Davila, Fei Xu, Saleem Ahmed, David A Mendoza, Srirangaraj Setlur, and Venu Govindaraju. Icpr 2022: Challenge on harvesting raw tables from infographics (chart-infographics). In 2022 26th International Conference on Pattern Recognition (ICPR), pages 4995–5001. IEEE, 2022. [3] Jorge Poco and Jeffrey Heer. 2017. Reverse-Engineering Visualizations: Recovering Visual Encodings from Chart Images. Comput. Graph. Forum 36, 3 (June 2017), 353–363. https://doi.org/10.1111/cgf.13193. [4] Kumar, Anukriti & Ganu, Tanuja & Guha, Saikat. (2022). ChartParser: Automatic Chart Parsing for Print-Impaired. 10.48550/arXiv.2211.08863. [5] R. P. Futrelle and N. Nikolakis, "Efficient analysis of complex diagrams using constraint-based parsing," Proceedings of 3rd International Conference on Document Analysis and Recognition, Montreal, QC, Canada, 1995, pp. 782-790 vol.2, doi: 10.1109/ICDAR.1995.602019. [6] Manolis Savva, Nicholas Kong, Arti Chhajta, Li Fei-Fei, Maneesh Agrawala, and Jeffrey Heer. 2011. ReVision: automated classification, analysis and redesign of chart images. In Proceedings of the 24th annual ACM symposium on User interface software and technology (UIST '11). Association for Computing Machinery, New York, NY, USA, 393–402. https://doi.org/10.1145/2047196.2047247. [7] Tang, Binbin & Liu, Xiao & Lei, Jie & Song, Mingli & Tao, Dapeng & Sun, Shuifa & Dong, Fangmin. (2015). DeepChart: Combining deep convolutional networks and deep belief networks in chart classification. Signal Processing. 124. 10.1016/j.sigpro.2015.09.027.

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 分步完成任务
  • 技术发展简史
  • 复杂图表案例
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档