Pandas 是一个强大的 Python 数据分析库,提供了高性能、易于使用的数据结构和数据分析工具。数据帧(DataFrame)是 Pandas 中的一种数据结构,类似于表格或 SQL 表,包含行和列。
在 Pandas 中,数据帧(DataFrame)是一种二维表格数据结构,可以包含不同类型的数据(如整数、浮点数、字符串等)。
Pandas 广泛应用于数据科学、机器学习、金融分析等领域,用于数据清洗、预处理、分析和可视化。
假设我们有一个 Pandas 数据帧 df
,其中有一列包含两个值,我们希望将其拆分为两列并命名。
import pandas as pd
# 创建示例数据帧
data = {
'A': ['foo', 'bar', 'baz'],
'B': ['one two', 'three four', 'five six']
}
df = pd.DataFrame(data)
# 拆分列 'B' 并命名新列
df[['B1', 'B2']] = df['B'].str.split(expand=True)
# 删除原始列 'B'
df.drop('B', axis=1, inplace=True)
print(df)
df
,其中列 'B' 包含需要拆分的值。str.split(expand=True)
方法将列 'B' 拆分为两列,并将结果赋值给新的列 'B1' 和 'B2'。drop
方法删除原始的列 'B'。通过上述步骤,我们可以轻松地将 Pandas 数据帧中的某一列拆分为两列并命名。
领取专属 10元无门槛券
手把手带您无忧上云