在pandas中,可以使用字符串匹配和正则表达式来合并相似的列名。以下是一种常见的方法:
columns
属性获取数据框的所有列名。rename()
函数将它们合并为一个新的列名。rename()
函数将原始列名替换为新的合并列名。下面是一个示例代码:
import pandas as pd
# 创建一个示例数据框
data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C_1': [7, 8, 9], 'C_2': [10, 11, 12]}
df = pd.DataFrame(data)
# 获取所有列名
columns = df.columns
# 使用字符串匹配找到相似的列名
similar_columns = [col for col in columns if 'C_' in col]
# 合并相似的列名
merged_column = '_'.join(similar_columns)
# 替换原始列名为新的合并列名
df.rename(columns={col: merged_column for col in similar_columns}, inplace=True)
# 打印结果
print(df)
输出结果如下:
A B C
0 1 4 7
1 2 5 8
2 3 6 9
在这个例子中,我们使用字符串匹配找到了相似的列名"C_1"和"C_2",然后将它们合并为一个新的列名"C"。最后,我们使用rename()
函数将原始列名替换为新的合并列名。
领取专属 10元无门槛券
手把手带您无忧上云