import pandas as pd
import numpy as np
# 创建一个示例数据集
data = {
'Name': ['Alice', 'Bob', 'Charlie', 'David'],
'Age': [25, 30, 35, 40],
'Income': [50000, 60000, 70000, 80000]
}
df = pd.DataFrame(data)
# 查看数据集的前几行
print("数据集的前几行:")
print(df.head())
# 计算一些基本统计信息
print("\n年龄的平均值:", df['Age'].mean())
print("收入的中位数:", df['Income'].median())
print("年龄的标准差:", df['Age'].std())
# 筛选特定条件的数据
older_than_30 = df[df['Age'] > 30]
print("\n年龄大于 30 的人:")
print(older_than_30)
# 对数据进行分组并计算统计信息
grouped = df.groupby('Age')
print("\n按年龄分组后的收入总和:")
print(grouped['Income'].sum())
这段代码首先创建了一个包含姓名、年龄和收入信息的示例数据集,然后使用pandas
库进行了一些基本的数据分析操作,包括查看数据、计算统计信息、筛选数据和分组计算。
这个入门级的实例,对于数据分析从业者有一定的参考价值。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。