首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python数据分析之pandas(五)

今天主要介绍数据集在列方向上的链接。

如果我们希望在数据集的列方面进行合并,更好的选择是使用pd.merge()来进行。一起来看个例子:

如图,我们想将df1和df2在axis=1轴方向上进行链接,可以把n列作为桥梁:

注意,使用on的前提是两个数据集至少有一个共同的列名。

如果列名不同,可以分别用left_on和right_on来指定。我们将df2中的列名n改为q,再进行链接:

当我们指定了左边的列和右边的列后,会多出一列,可以用drop方法去掉。

除了合并列之外,我们还可以按索引进行合并,直接用join即可:

若两个数据集作为桥梁的列中的元素不同,默认返回相同元素对应的行:

默认链接方式为inner,还可以设置为其它方式:

outer意为外连接,返回两个数据集的所有行。

left为左链接,只返回左边数据集的所有行。

right为右链接,只返回右边数据集的所有行。

若两个数据集的列名相同,则合并后会自动添加后缀。

我们先将df2的列名改成与df1相同,再进行链接:

可以看到,相同的列名自动添加了后缀_x,_y。我们也可以用suffixes参数自己指定后缀:

好了,这就是今天的全部内容,下次再会。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190211G08TTZ00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券