在过去几十年IT发展的历程当中,发生过的最重要事件是:将数据的展现层和数据存储层进行了分离。分离形成了截然不同的两层:
一、可视化层,也可称为数据展现层,关注于人对数据的理解和分析能力;
二、数据库层,则关注于有效地快速查询和处理数据。(Excel表格、PowerPivot中存储的都是结构化数据)
通过这种分离,Excel分析师也同时具有了强大的数据操控能力,可以随心所欲玩转数据。如果有使用普通数据透视表的经验,你对这种数据分层所带来的灵活性就不再陌生。也就是说:数据透视表/图,是Excel当中最常用的数据分析展现层,是Excel当中最强大的工具,英文为PivotTable,俗称交叉表。
PowerPivot是数据透视表的强大“后台”,以结构化的方式来存储数据,以及计算公式,为报表和可视化图表提供丰富的分析维度和度量。传统上我们所用的数据透视表的“数据源表”,仅仅对数据进行了简单的标准化。而现在我们可以使用PowerPivot这个强大的分析型数据库来更加结构智能化地存储的数据集,利用DAX计算列/计算字段来提供丰富的分析维度和度量,称为PowerPivot数据模型。
那么,PowerPivot在哪里呢?
实际上在我们熟悉的“创建数据透视表”对话框中,不难找到发现其中透露出的三种数据源讯息:
也就是说,PowerPivot数据模型,和Excel单元格区域(数据源表)、Excel表格,并列为数据透视表的三大来源。
PowerPivot是个介于Excel区域/表和数据透视表之间的中间层:
PowerPivot是数据透视表的一种“外部数据源”。可以将此数据(单元格区域或者Excel表格),添加到PowerPivot数据模型。
从这来看,PowerPivot其实很简单,就是个升级版本的“Excel表格”而已。
也就是说,只要将PowerPivot看成是一类更加结构化,更加智能的数据透视表数据源,就能快速掌握PowerPivot并理解其原理。PowerPivot和数据透视表,是两个既分离又相辅相成的两个不同部件。没有PowerPivot,照样可以基于Excel表格来使用数据透视表。
遗憾的是很多人还傻傻分不清数据透视表和PowerPivot,甚至分不清Excel表格(Table)和电子表格(Spreadsheet)
下面,先让我们回忆下Excel表格的三大特点。
1、Excel表格包含了表名和列名,横向上我们可以构造辅助列,称为计算列,并直观地进行“结构化引用”。
2、纵向上我们可以添加汇总行,使用分类汇总函数(Subtotal)和聚合函数,只要掌握这两个函数,就能打天下!
3、通过交互式的动态筛选可以将Excel表格中的部分数据行隐藏,随时间变化新增的记录行也可自动追加到Excel表格当中,同时汇总行的值也会自动更新,这就实现了“报表的自动化”。
再来看看下图中的PowerPivot,PowerPivot继承了Excel表格的很多优点。
(1)都可使用表名【列名】,来对表格数据进行结构化引用,PowerPivot自动化程度更高,对数据的要求也更严格(包括格式、排序、标记(日期表)、修改(单元格)等)。
(2)都有计算列/汇总值。只是PowerPivot将纵向的汇总结果称为“计算字段”/度量。
(3)可基于自身,来生成数据透视表。
PowerPivot的功能更加强大,主要体现在三个方面:
1、除了计算列/汇总行,还能在底层直接编辑存储更为复杂的公式,供分析时使用。(称为“数据分析表达式(DAX)计算列/计算字段”)
2、将数据分类为多个表格,并能将多个表格进行关联。(称为“PowerPivot数据模型”)
3、将数据透视表“打散”为数据魔方,形成自由交互的报表。(称为OLAP“多维数据集函数”自由式报表)
那么,对于创建仪表板和交互式报告而言,PowerPivot的优势体现在哪里呢?
1、PowerPivot是个更大的数据容器。通过将多个表格整合到一起,可以实现一次数据准备,多次数据复用,以供生成多个数据透视表/图的效果。而同时控制多个动态图表,是交互式报告和仪表板的基础。
2、PowerPivot中包含的分析公式,可供数据透视表直接生成更具有洞察力的分析指标。
3、基于PowerPivot的数据透视表,可以生成一个自由组合的“数据魔方”。带有交互性并可将指标自由组合,是交互式报告和仪表板的定制化个性化所在。
Excel数据分析师,正朝着数据建模师和BI分析师的角色转变,所以我们有必要了解一下PowerPiviot到底是个什么鬼。
领取专属 10元无门槛券
私享最新 技术干货