在前面两篇文章中,介绍了dplyr包针对数据框的基本操作,但是dplyr包不仅仅只有这些功能,还有很多其他实用的函数,这篇将介绍在我工作中,用到dplyr包的其他函数。
首先,新建下面用到的数据框,下面示例将以此为基础。
排序
场景:对数据框进行排序。
arrange()函数将数据框所有列按指定列排序。
多条件列
场景:前面使用if_else()函数新增条件列,但是有时候判断的条件不止一个,则需要使用多条件判断函数。
熟悉SQL的童靴,可以看出来该函数与SQL中case when语句很像,没错,功能也是一致的。
去重
场景:常常需要对数据框进行去重。
又一个与SQL相似的地方,连名字一看就知道,distinct()函数实现SQL中distinct语句的功能。
不重复计数
场景:在Power Query中,有个函数实现不重复计数,在dplyr包也有函数实现相同的功能。这个功能常用于计算销售数据中订单数的个数,因为我处理的销售数据中同一订单购买的不同产品是分开来的,但是订单号是一样的。
这个与distinct()函数指定列去重有点类似,只不过增加了计数这个功能。
总结
arrange()函数排序;
case_when()函数多条件判断;
distinct()函数去重;
n_distinct()函数不重复计数;
好了,dplyr包的教程就到此结束了,希望你喜欢dplyr包系列教程。
相关阅读:
R包系列——dplyr包教程1
R包系列——dplyr包教程2
扫一扫,关注我的个人公众号,获取源码,更有各种数据分析视频免费获取。
领取专属 10元无门槛券
私享最新 技术干货