在我们以往的人力资源数据分析课程中,我们都是以单表的形式来对某个模块进行数据分析,数据的来源也只是来源于某个模块的单张数据表,但是人力资源的各个模块其实是一个体系化的存在,我们在分析某个模块的时候,其实一定会跟另外一个模块的数据进行关联。
比如我们做薪酬数据分析的时候,一般会单纯的分析薪酬的数据,比如每个部门的薪酬对比,每个层级的薪酬中位值数据,薪酬类别的占比等,但是很少添加其他模块来辅助进行薪酬的数据分析。所以这个时候我们需要绩效模块来做薪酬的辅助分析,在分析关键岗位薪酬数据的时候,我们需要在添加一列,加入每个岗位的绩效数据,这样我们就可以同时根据薪酬和绩效的时候,来分析公司内部的薪酬结构是否合理。
但是如果要增加绩效的数据,就需要两张表的数据关联,薪酬表和绩效表的数据关联,就需要来对这两张表做数据建模,通过关键字段做管理,然后做数据透视。这个就是我们今天要分享的如何对多张表做数据关联,数据建模,进行多维度的数据分析。
我们今天通过两张表做案例,一张是人员结构表,一张是人员绩效表。
首先如果两张表要做数据的关联建模,就需要有一个相同的关键字段,在这两种表里的关键字段就是员工编号,我们可以通过员工标号来进行数据关联。
在EXCEL中数据建模我们通过EXCEL中的POVIT插件来完成
选择人员结构表,点击表格的管理,就会进入到数据建模的界面
在这个建模管理的界面中,其实和我们普通的EXCEL界面类似,不过在右上角有个比较重要的“关系图视图”,这个功能就是来对两张表进行关系的管理。
因为是对两张表进行数据建模,所以我们需要通过PQ来导入“员工绩效表”。在开始 - 其他数据源 中找到绩效表的路径,导入绩效表
完成了表的导入后,在模型中就有了两张表,接下来就需要对两张表建立关系,我们讲过关系的建立是通过表中的关键字段来进行建立的,两张表的关键字段是“员工编号”,在关系视图中,我们手动的拖动两张表的员工编号,对两张表进行关联。
两张表进行关联后,我们就可以任意的拖动两张表的数据字段来构建数据透视表,在你的数据透视表界面就会出现两张表的数据。
所以我们在数据分析的时候,可以调动两张表的数据进行透视表的构建,比如我想看每个学历的绩效数据,验证是不是学历越高,绩效越高。如果在以前我们可能需要做VLOOKUP,把绩效数据匹配到人员结构表中,然后做透视,但是在这里,你构建了关系后,你可以直接在人员结构表中选择“学历”,在薪酬表中选择“绩效分值”,就可以构建出一个透视表。
我们还可以换任何的维度做分析,比如我想看每个年龄段或者每个工龄的绩效分值,都可以从两个表中拉出数据构建透视表和透视图。
所以我们可以对人力资源各个模块进行体系化的数据建模,这样当我们在做数据分析的时候,就可以调用任意一个模块任意一个维度的数据字段,从多维度进行数据分析。