最近,数据分析师圈子大家在讨论GPT-4对他们的工作有什么影响:是替代还是辅助?个人认为GPT-4可以帮助我提高工作效率和质量。
要成为一名高级的数据分析师,需要经过长期的学习和实践,掌握数据分析的理论、技术和方法。这样的人才对雇主来说,也需要付出较高的合作成本。
达摩院的初步实验表明GPT-4的成本远低于雇用数据分析师的成本。假设每月工作21天,每天工作8小时,按照市场上的工资水平来算,GPT-4的使用成本只有初级数据分析师的0.71%和高级数据分析师的0.45%。
这个结果是从三位达摩院的研究者们设计的一个让GPT-4从数据获取、清洗、分析、可视化到报告的整个过程都自动完成的框架下得出的。
接下来,我们一起来看看他们的论文中,GPT-4是如何做到的吧!
论文:Is GPT-4 a Good Data Analyst? 地址:https://arxiv.org/abs/2305.15038 代码:https://github.com/DAMO-NLP-SG/GPT4-as-DataAnalyst
为了使用GPT-4自动化整个数据分析过程,研究者们将端到端的框架分成了代码生成、代码执行和分析生成三个步骤,通过这个框架,可以对比GPT-4和人类分析师的表现。
图:GPT-4作为数据分析师的工作流程
此图中业务问题和数据库的必填信息如右上蓝色框所示。参考外部知识源的可选输入在左上角的红色虚线框中圈出。包括提取数据、数据可视化和分析在内的输出在底部的绿色框中圈出。
为了实现作业任务,我们需要进行以下步骤:
任务目标:需要回答一个与业务相关的问题,并从一个或多个相关的数据库表中提取所需数据。然后,需要生成可视化图形以便更好地理解数据,并提供一些分析和见解,以帮助人们更好地理解数据。
具体来说就是:给定一个与业务相关的问题(q)和一个或多个相关的数据库表(d)及其模式(s),提取所需的数据(D),生成一个图(G)可视化并提供一些分析结果(A)。
数据来源:研究者们选择了NvBench数据集从不同领域随机选择100个6种不同图表类型和4种不同难度级别的问题进行实验。再分别让GPT-4和2位高级分析师和1位初级分析师去做这个任务,以得到任务结果数据。
评估指标:针对俩种输出内容,设置了七种不同的维度进行效果评价。可视化图是根据信息正确性,图表类型正确性和美观这三个维度评价。分析文本则是根据数据正确性,与问题相关性,分析复杂度和表达流畅度四个维度评价。
在这些维度上同时聘请了6名专业数据注释者对任务的输出进行人工评估打分。
令人惊讶的是,实验结果显示,GPT-4可以达到与人类相当的表现。这意味着,GPT-4不仅能理解和生成语言,还能进行复杂的数据分析任务。
表:GPT-4作为数据分析师的表现
根据上表,GPT-4生成的图表在信息准确度方面表现不佳,平均得分只有0.78;但在图表类型选择方面表现优异,正确率达到99%;图表的美观程度一般。GPT-4的分析结果在正确性方面较高,平均有94%的内容是正确的,而且与问题相关性较好;但分析的复杂度和流畅度都不高。
表:数据分析师和GPT‑4在几个随机示例上的比较
上表中,根据3位分析师的分析结果的各指标得分来看,我们可以对GPT-4的数据可视化和分析能力进行如下总结:
GPT-4还可以通过插件联网,搜索实时在线信息,结合背景知识进行数据分析和结论推断,越来越接近人类分析师的水平。但也有一些它无法完成的任务,例如理解数据的深层含义,考虑假设条件,提出有效的解决方案,与团队成员协作沟通等。
这篇论文为我们提供了一个新的视角,让我们重新思考人工智能的可能性和限制。虽然GPT-4在数据分析任务上的表现令人鼓舞,但我们还需要进行更多的研究,才能确定它是否真的可以取代数据分析师。