从pandas dataframe中的现有列创建新列可以使用以下方法:
- 使用算术运算符创建新列:可以使用加法、减法、乘法、除法等算术运算符来对现有列进行操作,并将结果赋值给新列。例如,要创建一个新列"total",将"column1"和"column2"相加,可以使用以下代码:
df['total'] = df['column1'] + df['column2']
- 使用函数创建新列:可以使用内置函数或自定义函数来对现有列进行操作,并将结果赋值给新列。例如,要创建一个新列"length",计算"column3"的长度,可以使用以下代码:
df['length'] = df['column3'].apply(len)
- 使用条件语句创建新列:可以使用条件语句来根据现有列的值创建新列。例如,要创建一个新列"category",根据"column4"的值判断其所属的类别,可以使用以下代码:
df['category'] = np.where(df['column4'] > 0, 'positive', 'negative')
- 使用字符串方法创建新列:如果现有列是字符串类型,可以使用字符串方法来对其进行操作,并将结果赋值给新列。例如,要创建一个新列"uppercase",将"column5"的值转换为大写字母,可以使用以下代码:
df['uppercase'] = df['column5'].str.upper()
- 使用聚合函数创建新列:可以使用聚合函数对现有列进行汇总,并将结果赋值给新列。例如,要创建一个新列"average",计算"column6"的平均值,可以使用以下代码:
df['average'] = df['column6'].mean()
以上是从pandas dataframe中的现有列创建新列的几种常见方法。根据具体需求和数据类型,可以选择适合的方法来创建新列。