Pandas DataFrame 是一个二维的表格型数据结构,可以存储多种类型的数据,并且具有强大的数据处理和分析能力。它类似于 Excel 表格或 SQL 表,但提供了更多的功能和灵活性。
Pandas DataFrame 可以包含多种类型的数据,包括整数、浮点数、字符串、日期时间等。
import pandas as pd
# 读取 CSV 文件
df = pd.read_csv('file.csv')
print(df)
import numpy as np
# 将 DataFrame 转换为 NumPy 数组
array = df.to_numpy()
print(array)
# 检查缺失值
print(df.isnull().sum())
# 删除包含缺失值的行
df = df.dropna()
# 填充缺失值
df = df.fillna(0) # 用 0 填充缺失值
# 按某一列分组
grouped = df.groupby('column_name')
# 对分组后的数据进行聚合操作
result = grouped.agg({'column_name': 'sum', 'another_column': 'mean'})
print(result)
通过以上内容,你可以了解 Pandas DataFrame 的基础概念、优势、类型、应用场景以及常见问题的解决方法。希望这些信息对你有所帮助!
领取专属 10元无门槛券
手把手带您无忧上云