首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >图表解析技术:逆向提取图表数据,需要哪几步?

图表解析技术:逆向提取图表数据,需要哪几步?

原创
作者头像
合合技术团队
发布于 2025-03-06 02:31:03
发布于 2025-03-06 02:31:03
2120
举报

对于我们时代的所有“PPT工作者”来说,图表是一位熟悉的“老朋友”了。

通过Office、编程语言库或是更丰富的生成工具,我们能够便捷地将数据绘制成美观、抓眼、适宜展示的图表,在各类汇报、讲演、宣传工作里起到比表格数字更直观的效果。

然而,当我们产生了与之相反的需求:将各色报告或论文中的图表逆向转化为原始数据,用于数据处理分析,又应该怎么做呢?

与绘制图表相比,解析它们的任务提出了更精密的技术要求。本期内容中,我们将初步探讨图表解析技术的构成与发展历程。

分步完成任务

通过流程图,我们可以简单理解图表识别的流程。下面,我们将对这些步骤中的几个特殊环节进行拆解。

1.图表检测与定位:锁定数据可视化区域

图表检测与定位是图表解析的第一步,其核心任务是在复杂文档(如PDF、扫描件或截图)中精准识别图表边界框。早期方法依赖边缘检测和形态学操作(如OpenCV),但难以处理重叠元素,2016年后,基于深度学习的目标检测模型成为主流解决方案。但当前技术仍面临一些挑战,例如手绘草图边界模糊导致漏检,以及图文混排场景下的误判。工业界常采用级联检测策略——先用轻量级模型快速筛选候选区域,再用高精度模型二次验证。

2.图表类型分类:准确识别特征

图表类型分类旨在通过识别图表的视觉特征和表示形式,区分不同类型的图表,如条形图、饼图、折线图、散点图和热力图等。准确识别这些图表类型对于后续的数据挖掘和分析至关重要,因为每种图表类型都要求特定的数据提取方法。例如,在折线图中,关键点(如转折点和端点)的识别是至关重要的;而在柱状图中,则需要关注数据及其相关的文本标签。 深度学习技术,特别是卷积神经网络(CNN),已经成为图像分类任务中的主流方法。VGG、ResNet、Inception和EfficientNet等模型在从图表图像中提取高级特征方面表现出色。迁移学习的应用进一步提升了分类精度,使得从自然图像中学到的特征能够应用于图表分类任务[1]。然而,基于CNN的方法在处理噪声或视觉上相似的图表时可能遇到挑战。为了解决这些问题,视觉Transformer通过局部窗口注意力机制有效管理全局和局部图像特征,提高了复杂图表的处理性能[2]。

3.图表结构分析:解剖数据架构

该步骤的目的是解析图表的基础架构,包括坐标轴范围、数据点空间位置及颜色编码逻辑。传统方法利用霍夫变换检测直线(坐标轴)和圆形(饼图),但对变形图表适应性差。深度学习方案中,Poco等(2017)提出基于CNN的网络方法,可定位折线图顶点和柱状图立柱[3]。颜色编码解析需结合HSV色彩空间分析与图例位置匹配,IBM研究院开发的ChartParser系统(2022)通过利用颜色信息进行数据关联[4]。

4.数据重建与映射:从像素到信息的转化法则

此阶段将视觉元素转化为结构化数据,核心任务包括数值归一化与语义绑定。坐标轴映射采用线性插值算法,将像素位置转换为实际值。图例-数据系列绑定则主要依赖颜色/纹理相似度匹配,完成文本与视觉元素之间的相关性映射。

技术发展简史

1.规则驱动时代(1990s-2000s)

早期的图表解析依赖人工预设规则。研究者通过模板匹配识别基本图形(如圆形判定为饼图),结合OCR提取文字标签,再通过坐标轴比例换算数值。这类方法对标准化印刷图表(如学术论文中的柱状图)有一定效果,但灵活性极低,无法处理复杂布局或变形图表。典型代表如Futrelle团队开发的基于约束文法的图表分析方法[5],能解析部分图表,但需手动标注特征,针对每种图表类型单独设计规则。这一阶段效率和准确率较为低下,仅能处理印刷文档中的规范图表。

2.机器学习崛起(2005-2015)

随着机器学习的普及和特征工程的发展,研究者开始提取颜色分布、几何形状等统计特征,结合支持向量机(SVM)、隐马尔可夫模型(HMM)进行分类,实现多类型图表解析,但仍需人工定义特征规则[6],同期,图表解析技术开始初步商用化。

3.深度学习突破与多模态融合(2016-至今)

卷积神经网络(CNN)改变了特征提取方式。以DeepChart(2018)为代表的端到端模型,可直接从像素输入预测图表类型和数据结构[7]。ResNet、U-Net等架构被用于坐标轴检测和数据点分割,显著提升了堆叠图、雷达图等复杂图表的解析能力。2021年后,Transformer架构与视觉-语言预训练模型(VLP)成为技术发展的新引擎。

复杂图表案例

目前,图表解析技术能力不断增强,商用产品已经实现复杂图表的精准识别与数据还原。

如图中,柱状图数据与折线图拐点、标签均判断准确,对应输出为结构化数据。

对于没有明确数值标注的堆叠柱状图(Stacked Bar Chart),现有模型也能提供测量后的预估值,为数据分析提供依据。

图表解析技术通过计算机视觉自然语言处理协同工作,将图像中的图表转化为结构化数据,当前已在学术及商业领域落地应用。在金融分析工作中,它能自动提取财报图表数据,提升投研效率;在学术领域,能协助论文图表数据快速复用,避免手动录入带来的传统错漏与人力损耗。在多模态大模型不断发展的背景下,未来,多模态大模型与知识推理的结合,将不断推进解析技术的边界,实现“看懂图表逻辑”的认知级解析。

参考文献 [1] Alex Krizhevsky, Ilya Sutskever, and Geoffrey E Hinton. Imagenet classification with deep convolutional neural networks. Advances in neural information processing systems, 25, 2012. [2] Kenny Davila, Fei Xu, Saleem Ahmed, David A Mendoza, Srirangaraj Setlur, and Venu Govindaraju. Icpr 2022: Challenge on harvesting raw tables from infographics (chart-infographics). In 2022 26th International Conference on Pattern Recognition (ICPR), pages 4995–5001. IEEE, 2022. [3] Jorge Poco and Jeffrey Heer. 2017. Reverse-Engineering Visualizations: Recovering Visual Encodings from Chart Images. Comput. Graph. Forum 36, 3 (June 2017), 353–363. https://doi.org/10.1111/cgf.13193. [4] Kumar, Anukriti & Ganu, Tanuja & Guha, Saikat. (2022). ChartParser: Automatic Chart Parsing for Print-Impaired. 10.48550/arXiv.2211.08863. [5] R. P. Futrelle and N. Nikolakis, "Efficient analysis of complex diagrams using constraint-based parsing," Proceedings of 3rd International Conference on Document Analysis and Recognition, Montreal, QC, Canada, 1995, pp. 782-790 vol.2, doi: 10.1109/ICDAR.1995.602019. [6] Manolis Savva, Nicholas Kong, Arti Chhajta, Li Fei-Fei, Maneesh Agrawala, and Jeffrey Heer. 2011. ReVision: automated classification, analysis and redesign of chart images. In Proceedings of the 24th annual ACM symposium on User interface software and technology (UIST '11). Association for Computing Machinery, New York, NY, USA, 393–402. https://doi.org/10.1145/2047196.2047247. [7] Tang, Binbin & Liu, Xiao & Lei, Jie & Song, Mingli & Tao, Dapeng & Sun, Shuifa & Dong, Fangmin. (2015). DeepChart: Combining deep convolutional networks and deep belief networks in chart classification. Signal Processing. 124. 10.1016/j.sigpro.2015.09.027.

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
合合信息“TextIn大模型加速器 2.0”版本来了:文档解析和图表解析能力全面升级
在日常工作中,我们常常遇到无法直接复制的文档内容或图片内容,这些内容通常需要进行识别和解析。一个典型的例子是,当我们需要将折线图转化为表格数据时,手动操作既繁琐又容易出错。近期,我发现合合信息 TextIn 推出了全新解决方案——大模型加速器 2.0,专门解决这一问题。通过大规模预训练的基座模型,TextIn采用生成式学习方法,从图表的布局、线条、颜色、标记等多个维度进行深度建模。这样,它能够准确提取图表中的关键数据点、坐标轴信息、图例说明等内容,并将其转化为大模型能够理解的Markdown格式,在处理“柱形图+折线图”等复合式图表时,图表解析模块不仅能够精准解析不同类型图表的数据,还能够将这些图表数据还原为完整的Excel表格,进一步展示了文档解析引擎强大的“理解力”。
猫头虎
2025/03/28
2452
数据可视化工具软件中常用的20种经典图表
接下来就以SovitChart平台为例,对数据可视化过程中的常用图表类型进行总结,以便将繁杂的、大量的数据变得轻松易懂。
物联网数据可视化PaaS平台
2022/03/18
3.3K0
数据可视化工具软件中常用的20种经典图表
C++ Qt开发:Charts绘制各类图表详解
Qt 是一个跨平台C++图形界面开发库,利用Qt可以快速开发跨平台窗体应用程序,在Qt中我们可以通过拖拽的方式将不同组件放到指定的位置,实现图形化开发极大的方便了开发效率,本章将重点介绍TreeWidget与QCharts的常用方法及灵活运用。
王瑞MVP
2023/12/25
4.7K0
新功能内测!图表解析上线,一键帮助大模型读懂图表数据
TextIn文档解析上线新功能【图表识别】,目前已启动内测。图表识别功能可以智能解析图表属性Chart,并以Excel格式精准输出,帮助大模型深度理解图表的结构、趋势和数据逻辑,让数据分析更高效。
合合技术团队
2025/02/13
2680
新功能内测!图表解析上线,一键帮助大模型读懂图表数据
数据分析师应该知道的2大模型和6种图表!
数据分析是指用适当的统计分析对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。
1480
2019/05/21
1.3K0
33种经典图表类型总结,轻松玩转数据可视化
导读:随着时代的发展,越来越多的数据量堆积,然而这些密密麻麻的数据的可读性较差并且毫无重点,而数据可视化更加直观有意义,更能帮助数据更易被人们理解和接受。
IT阅读排行榜
2018/11/07
6.5K0
【Unity 实用插件篇】| 可视化图表插件XCharts (折线图、柱状图、饼图等)详细教学
一款基于UGUI的功能强大、简单易用的数据可视化图表插件。支持折线图、柱状图、饼图、雷达图、散点图、热力图、环形图、K线图、极坐标、平行坐标等十多种内置图表,以及3D饼图、3D柱图、3D金字塔、漏斗图、仪表盘、水位图、象形柱图、甘特图、矩形树图等扩展图表。
呆呆敲代码的小Y
2023/07/28
19.4K1
【Unity 实用插件篇】| 可视化图表插件XCharts (折线图、柱状图、饼图等)详细教学
人人都会用到的数据可视化之常用图表类型
文章介绍 “数据可视化”可以帮助用户理解数据,一直是热门方向。 图表是”数据可视化”的常用手段,其中又以基本图表——柱状图、折线图、饼图等等最为常用。 用户非常熟悉这些图表,但如果被问到,它们的特点
灯塔大数据
2018/04/08
1.3K0
人人都会用到的数据可视化之常用图表类型
图表解析系列之柱状图
是一种以长方形的长度为变量的统计图表。长条图用来比较两个或以上的价值(不同时间或者不同条件),只有一个变量,通常利用于较小的数据集分析。长条图亦可横向排列。——维基百科
Data探险实验室
2023/02/23
3.4K0
图表解析系列之柱状图
定义可视化!用30分钟读懂人类感知世界的39项研究
你想充分了解人类的感知世界吗?你对可视化是如何定义的呢?它是一门科学还是一门语言,那就请跟我们的作者一同走进这个世界,用短短的30分钟,看看39项关于人类感知的研究.
大数据文摘
2019/04/26
1.3K0
定义可视化!用30分钟读懂人类感知世界的39项研究
Qt | QPieSeries(饼图)+QSplineSeries(曲线图)+QAreaSeries(面积图)实战
QPieSeries是一个用于创建和展示饼图的类。它提供了基本的饼图绘制功能,包括设置饼图的标签、数据和样式。用户可以通过实例化QPieSeries类并调用其方法来生成饼图。此外,QPieSeries还支持一些交互功能,如设置饼图的颜色、边框宽度等。
Qt历险记
2024/07/31
7090
Qt | QPieSeries(饼图)+QSplineSeries(曲线图)+QAreaSeries(面积图)实战
17 种经典图表总结,轻松玩转数据可视化!
导读:随着时代的发展,越来越多的数据量堆积,然而这些密密麻麻的数据的可读性较差并且毫无重点,而数据可视化更加直观有意义,更能帮助数据更易被人们理解和接受。
小小詹同学
2019/06/20
1.2K0
17 种经典图表总结,轻松玩转数据可视化!
遇见大数据可视化 :图表设计 ( 一 )
腾讯大数据可视化设计团队
2017/07/07
6.7K2
遇见大数据可视化 :图表设计 ( 一 )
数据可视化艺术:使用cutecharts轻松创建各种图表
上篇文章写了如何使用matplotlib绘制一些基本的图表, 这篇写一下如何使用cutecharts来绘制图表以及绘制图表时支持的参数。 cutecharts是一个简单而强大的Python库,它可以轻松创建各种类型的图表,包括折线图、饼图、柱状图、散点图和雷达图。它与matplotlib不同的是, 可以生成手绘样式的图表,可以让你的PPT或分析更生动,看起来不那么干巴。可以直接导出html分享给别人
不止于python
2023/09/22
4770
数据可视化艺术:使用cutecharts轻松创建各种图表
【Python篇】matplotlib超详细教程-由入门到精通(上篇)
matplotlib 是 Python 中最常用的绘图库之一。它提供了类似于 Matlab 的 API,方便用户创建各种类型的图表。我们主要使用其中的 pyplot 模块,它是绘制图表的核心工具。
半截诗
2024/10/09
4.2K0
【Python篇】matplotlib超详细教程-由入门到精通(上篇)
人人都会用到的数据可视化之常用图表类型
图表是”数据可视化”的常用手段,其中又以基本图表——柱状图、折线图、饼图等等最为常用。
IT阅读排行榜
2018/08/16
6570
人人都会用到的数据可视化之常用图表类型
【数据可视化】Echarts的高级功能
为了使图表更具表现力,可以使用混搭图表对数据进行展现。 当多个系列的数据存在极强的不可分离的关联意义时,为了避免在同一个直角系内同时展现时产生混乱,需要使用联动的多图表对其进行展现。
zxctscl
2024/03/29
1.4K0
【数据可视化】Echarts的高级功能
数据可视化基本套路总结
真依然很拉风,简书《数据可视化》专栏维护者,里面有很多优秀的文章,本文便是其中一篇。
生信宝典
2018/08/01
2.9K0
数据可视化基本套路总结
【数据可视化】Echarts最常用图表
在上一篇博客中提到了【数据可视化】数据可视化入门前的了解,这次来看看Echarts最常用图表有哪些,和作用是什么?
zxctscl
2024/03/16
1.4K0
【数据可视化】Echarts最常用图表
数据可视化图表
常听到一句话,“能用图描述的就不用表,能用表就不用文字”。这句话也直接的表明了:在认知上,大家对于图形的敏感度远比文字高。
Python数据科学
2019/06/03
2.4K0
推荐阅读
相关推荐
合合信息“TextIn大模型加速器 2.0”版本来了:文档解析和图表解析能力全面升级
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档