据说,世界上的数据分析师分为两类,使用Excel的分析师,和其他分析师。
很多传统行业的数据分析师只要求掌握Excel即可,会SPSS/SAS是加分项。即使在挖掘满街走,Python不如狗的互联网数据分析界,Excel也是不可替代的。
Excel是每一个入行的数据分析师新人必不可少的工具,因为Excel涵盖的功能足够多,如何使用EXCEL进行数据分析呢?接下来小编会给大家介绍下数据分析常用的各种函数的用法及用途,数据分析中常见的Excel函数全部总结在这里了。
清洗处理类
主要是文本、格式以及脏数据的清洗。很多数据并不是直接拿来就能用的,需要经过数据分析人员的清理。数据越多,这个步骤花费的时间越长。
Trim
清除掉单元格两边的内容,mysql和python都有同名的内置函数,以及ltrim和rtrim的引申用法。
Concatenate
用法:Concatenate(单元格1,单元格2……),合并单元格
例如:concatenate(“我”,”很”,”帅”) = 我很帅,还有另一种合并方式是 &,”我”&”很”&”帅” = 我很帅。当需要合并的内容过多时,concatenate的效率比较快也比较优雅, MySQL有近似函数concat。
Replace
用法:Replace(指定字符串,哪个位置开始替换,替换几个字符,替换成什么)
替换掉单元格的字妇产,清洗使用较多。可以指定替换字符的起始位置。
Substitute
和replace接近,区别是替换为全局替换,没有起始位置的概念。
Left/Right/Mid
用法:Mid(指定字符串,开始位置,截取长度)
截取字符串中的字符,Left(字符串,截取第几位)。left为从左截取,right为从右截取,mid为从指定位置截取指定长度。
Len/Lenb
返回字符串的长度,在len中,中文计算为一个,在lenb中,中文计算为两个。
Find
用法:Find(要查找字符,指定字符串,第几个字符)
查找某字符串出现的位置,可以指定为第几次出现,与Left/Right/Mid结合能完成简单的文本提取。
MySQL中有近似函数 find_in_set,Python中有同名函数。
Search
和find类似,区别是Search大小写不敏感,但支持*通配符
Text
讲数值转化为指定的文本格式,可以和时间序列函数一起看
关联匹配类
在进行多表关联或者行列比对时用到的函数,越复杂的表用得越多。多说一句,良好的表习惯可以减少这类函数的使用。
Lookup
Lookup(查找的值,值所在的位置,返回相应位置的值)
最被忽略的函数,功能性和Vlookup一样,但是引申有数组匹配和二分法。
Vlookup
用法:Vlookup(查找的值,哪里找,找哪个位置的值,是否精准匹配)
Index/Match
用法:Index(查找的区域,区域内第几行,区域内第几列)
和Match组合,媲美Vlookup,但是功能更强大。
Row
返回单元格所在的行
Column
返回单元格所在的列
Offset
用法:Offset(指定点,偏移多少行,偏移多少列,返回多少行,返回多少列)
建立坐标系,以坐标系为原点,返回距离原点的值或者区域。正数代表向下或向右,负数则相反。
逻辑运算类
数据分析中不得不用到逻辑运算,后期也会遇到布尔类型,True和False。当然,数据分析也很考验逻辑。
1. IF
2. And
3. Or
4. IS系列
5. IF系列
计算统计类
常用的基础分析统计函数,以描述性统计为准。
1. Sum/Sumif/Sumifs
2. Sumproduct
3. Count/Countif/Countifs
4. Max
5. Min
6. Rank
7. Rand/Randbetween
8. Averagea
9. Quartile
10.Stdev
11.Substotal
12.Int/Round
时间序列类
专门用户处理时间格式以及转换
1. Year
2. Month
3. Weekday
4. Weeknum
5. Day
6. Date
7. Now
8. Today
9. Datedif
函数真是不少,都是数据分析工作中常用的,快打开你的EXCEL试试吧,自己实际动手操作一遍才能熟练掌握!
领取专属 10元无门槛券
私享最新 技术干货