在Pandas dataframe中根据另一列的条件创建新列的最佳方式是使用np.where()
函数。np.where()
函数可以根据条件在两个值之间进行选择,并将结果赋给新列。
具体步骤如下:
import pandas as pd
和import numpy as np
。df = pd.DataFrame({'col1': [1, 2, 3, 4, 5], 'col2': [6, 7, 8, 9, 10]})
。np.where()
函数创建新列:df['new_col'] = np.where(df['col1'] > 3, 'A', 'B')
。这个例子中,如果'col1'列的值大于3,则新列'new_col'的值为'A',否则为'B'。print(df)
。这种方式的优势是简洁高效,可以根据条件快速创建新列。它适用于各种场景,例如根据某一列的值进行分类、根据条件进行数据清洗等。
腾讯云相关产品和产品介绍链接地址:
领取专属 10元无门槛券
手把手带您无忧上云