大家好,又见面了,我是你们的朋友全栈君。
在pandas中如果我们想将两个表格按照某一主键合并,我们需要用到merge函数。
pd.merge(dataframe_1,dataframe_2,how="inner")
参数how有四个选项,分别是:inner、outer、left、right。
inner是merge函数的默认参数,意思是将dataframe_1和dataframe_2两表中主键一致的行保留下来,然后合并列。
outer是相对于inner来说的,outer不会仅仅保留主键一致的行,还会将不一致的部分填充Nan然后保留下来。
然后是left和right,首先为什么是left和right,left指代的是输入的时候左边的表格即dataframe_1,同理right指代dataframe_2。
left和right相当于inner和outer取了个折中的合并方法,意为保证dataframe_1或者dataframe_2不变(不变的表格我们这里记为目标表格),然后另一个表格(我们这里记为信息表格)向目标表格添加信息。
添加信息的方法是在信息表格中搜索与目标表格拥有相同主键的行直接合并,最后没有增加信息的目标表格的行,使用Nan填充。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/204282.html原文链接:https://javaforall.cn