在公共列上连接Python中的两个CSV文件可以通过以下步骤实现:
import pandas as pd
df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')
common_column = 'common_column_name'
merged_df = pd.merge(df1, df2, on=common_column)
merged_df = pd.merge(df1, df2, on=common_column, how='left')
left_on
和right_on
参数指定左侧和右侧的连接键:merged_df = pd.merge(df1, df2, left_on='column_name1', right_on='column_name2')
astype()
方法将其转换为相同的数据类型:df1['common_column'] = df1['common_column'].astype(str)
df2['common_column'] = df2['common_column'].astype(str)
merge()
函数的on
参数和suffixes
参数。例如,如果要在公共列上连接时,只保留df1中的行:merged_df = pd.merge(df1, df2, on=common_column, how='left', suffixes=('_df1', '_df2'))
merged_df = merged_df[~merged_df['common_column_df2'].notnull()]
以上是在公共列上连接Python中两个CSV文件的基本步骤。根据具体的应用场景和需求,可以进一步处理和操作连接后的DataFrame对象。腾讯云提供了云原生数据库TencentDB和云服务器CVM等产品,可以用于存储和处理CSV文件数据。更多关于腾讯云产品的信息,请参考腾讯云官方网站:https://cloud.tencent.com/。
领取专属 10元无门槛券
手把手带您无忧上云