在 Pandas 中,可以使用循环来添加新列到 DataFrame 中,其中新列的值基于其他列的值。以下是一个示例代码:
import pandas as pd
# 创建一个示例 DataFrame
data = {'A': [1, 2, 3, 4, 5],
'B': [10, 20, 30, 40, 50]}
df = pd.DataFrame(data)
# 循环添加新列
for i in range(1, 4):
new_column_name = f'C{i}' # 新列的名称
column_values = df['A'] * i # 新列的值,基于 'A' 列的值
df[new_column_name] = column_values
# 打印结果
print(df)
输出结果如下:
A B C1 C2 C3
0 1 10 1 2 3
1 2 20 2 4 6
2 3 30 3 6 9
3 4 40 4 8 12
4 5 50 5 10 15
在上述示例中,我们首先创建了一个包含两列('A' 和 'B')的 DataFrame。然后,使用循环从 1 到 3,依次添加了三个新列('C1'、'C2' 和 'C3')。新列的名称通过字符串格式化得到,新列的值通过将 'A' 列的值乘以循环变量得到。最后,将新列添加到 DataFrame 中。
这种方法可以根据需要循环添加任意数量的新列,新列的值可以基于其他列的值进行计算。
领取专属 10元无门槛券
手把手带您无忧上云