我就在这里,不离不弃
——A·May
R-79T-91
对表的管理
May2018年2月8日
之前的数据管理的内容都是针对于表中数据的,而没有针对表与表之间的操作介绍,今天就结合SQL语句,学习一下R语言中对表与表之间关系的处理,主要用到的包依然是W大神的dplyr包,还有我们熟悉的sqldf包和merge。敏感的小伙伴也会发现,其实表的三个主要操作是和欧拉图相一致的,并集、交集和差集。
建立示例数据t1/t2/t3
1.横向表操作
横向表操作主要有三个方面,5个内容。第一,笛卡尔积表连接,就是两个表的所有列相互组合起来,是n*n的结果;第二,内连接,结果是两个表的共同的结果;第三,外连接,包括左连接、右连接和全连接,其中涉及保留哪个表数据的问题。
2.纵向表操作
纵向表操作,变量(字段)相同。也包括三个方面的内容:第一是并集操作,这个可以用rind完成;第二是交集操作,保留两个表中相同的数据;第三个是差集操作,从A集合中除去和B集共同的数据。
参考阅读
学习数据挖掘交流平台
领取专属 10元无门槛券
私享最新 技术干货