今天主要介绍数据集在列方向上的链接。
如果我们希望在数据集的列方面进行合并,更好的选择是使用pd.merge()来进行。一起来看个例子:
如图,我们想将df1和df2在axis=1轴方向上进行链接,可以把n列作为桥梁:
注意,使用on的前提是两个数据集至少有一个共同的列名。
如果列名不同,可以分别用left_on和right_on来指定。我们将df2中的列名n改为q,再进行链接:
当我们指定了左边的列和右边的列后,会多出一列,可以用drop方法去掉。
除了合并列之外,我们还可以按索引进行合并,直接用join即可:
若两个数据集作为桥梁的列中的元素不同,默认返回相同元素对应的行:
默认链接方式为inner,还可以设置为其它方式:
outer意为外连接,返回两个数据集的所有行。
left为左链接,只返回左边数据集的所有行。
right为右链接,只返回右边数据集的所有行。
若两个数据集的列名相同,则合并后会自动添加后缀。
我们先将df2的列名改成与df1相同,再进行链接:
可以看到,相同的列名自动添加了后缀_x,_y。我们也可以用suffixes参数自己指定后缀:
好了,这就是今天的全部内容,下次再会。
领取专属 10元无门槛券
私享最新 技术干货