考虑以下数据帧:
import pandas as pd
data1={'column_a' : ['a','a','b','c','d','e'],
'column_b' : [1,2,3,4,5,6],
'column_c' : [9,8,6,4,5,4]}
data2={'column_a' : ['f','f','g','a','a','a'],
'column_b' : [7,8,9,7,5,6],
'column_c' : [6,8,7,6,5,4]}
df_1 = pd.DataFrame(data1)
df_2 = pd.DataFrame(data2)
您将如何连接这两个数据帧,以便df_2
将附加到df_1
,但覆盖column_a
上的df_1
?我正在寻找以下结果
column_a column_b column_c
b 3 6
c 4 4
d 5 5
e 6 4
f 7 6
f 8 8
g 9 7
a 7 6
a 5 5
a 6 4
请注意,来自df_1
的顶部带有'a‘的2行不再可用,因为它们已被来自df_2
的3个a覆盖。
发布于 2019-03-01 23:47:01
只需在append
或concat
之前进行一次筛选
pd.concat([df_1.loc[~df_1.column_a.isin(df_2.column_a)],df_2])
Out[29]:
column_a column_b column_c
2 b 3 6
3 c 4 4
4 d 5 5
5 e 6 4
0 f 7 6
1 f 8 8
2 g 9 7
3 a 7 6
4 a 5 5
5 a 6 4
https://stackoverflow.com/questions/54947950
复制相似问题