遇急能静,遇怒能止
数据转换可以理解为在原有数据的基础上进行增、删、改等操作,数据转换能力是Power Query的基础数据处理能力。最简单的数据转换是更改数据类型。
数据类型是我们使用Power Query时,务必关注的第一件事。与 Excel 不同的是Power Query对数据类型有严格的要求。
数据类型的隐式转换
在Excel中,数据类型存在隐式转换,所以它对于数据的类型要求并不高。在 Excel 单元格中输入公式:="1"+1,可以返回正确的计算结果 2。
但是在Power Query中,文本型的数据无法与数值型数据相加,因此上述表达式会报错。事实上将数据加载到Power Query后的第一件事通常都是定义数据类型。
即使你没有手动定义,默认情况下,Power Query也会在加载时,基于前1000行的数据自动检测数据类型。
更换数据类型
Power Query提供了足够多且足够简单的方式帮助我们手动设置数据类型。
选中需要更改数据类型的列,单击「数据类型」,从弹出的下拉列表中选择想要设置的格式即可。
通过功能菜单转换数据类型
也可以单击列标题左边的数据类型图标,从弹出的列表中选择。
如果有多列数据需要更改格式,逐一修改也许会比较耗时。选中所有需要改变数据类型的列,单击功能界面中的「检测数据类型」是最方便快捷的方式。
自动检测选中的列的数据类型
数据类型分类
Power Query支持定义多种数据类型,并且每个数据类型都有各自独特的图标代表。
关于数据类型还需要强调的是:当列标题左边的数据类型标识为“ABC123”时,代表该列的数据类型为任意,意味着该列数据类型未定或者包含多种数据类型。
Power Query支持的数据类型
还有另外两种非常重要的数据类型,那就是错误(Error)和空值(null)。
错误及空值在数据清洗实战中用处很多。出现空值的原因很多,Excel 的合并单元格导入 Power Query 后就会识别成空值。利用空值可以筛选掉无用的行或者将它替换成有用的数值。
对于错误值,我们可以通过替换错误和删除错误来消除它们对数据分析的影响。
百余篇优质原创文章练习文件;
365天不限次数答疑;
持续更新的杂志级图表制作方法及源文件;
历次分享的优秀可视化仪表板模板。
…………
领取专属 10元无门槛券
私享最新 技术干货