合并两个具有公共列的数据帧,并在公共值不为NA时添加指示器,可以使用以下步骤来完成:
import pandas as pd
df1 = pd.DataFrame({'A': [1, 2, 3, 4], 'B': [5, 6, 7, 8]})
df2 = pd.DataFrame({'A': [1, 2, 3, 5], 'C': [9, 10, 11, 12]})
merge
函数合并两个数据帧,指定公共列为'A':merged_df = pd.merge(df1, df2, on='A', how='inner')
这里使用了how='inner'
参数来指定合并方式为内连接,即只保留两个数据帧中'A'列的公共值。
merged_df['Indicator'] = merged_df['C'].notna()
这里使用了notna()
函数来判断'C'列的值是否为NA,然后将结果赋给新的指示器列'Indicator'。
最终,merged_df
将是合并后的数据帧,其中包含了两个数据帧的公共列'A'和指示器列'Indicator'。
这个方法适用于各种数据分析和处理场景,例如合并两个数据集、数据清洗和数据整合等。对于腾讯云相关产品,可以使用腾讯云的云数据库 TencentDB 来存储和管理数据,具体产品介绍和链接地址请参考腾讯云官方网站。
领取专属 10元无门槛券
手把手带您无忧上云