首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【愚公系列】2023年07月 Python自动化办公之pandas操作excel

【愚公系列】2023年07月 Python自动化办公之pandas操作excel

作者头像
愚公搬代码
发布2025-05-28 15:56:06
发布2025-05-28 15:56:06
22400
代码可运行
举报
文章被收录于专栏:历史专栏历史专栏
运行总次数:0
代码可运行

前言

python中能操作Excel的库主要有以下9种:

本文主要针对pandas读取 写入 修改 操作Excel进行详细介绍

一、pandas操作Excel

1.pandas基本介绍

Pandas是一个用于数据操作和数据分析的Python库。它提供了高效的数据结构,使得处理数据变得更加简单和快捷。Pandas的核心数据结构包括两种类型:Series和DataFrame。Series是一维的数据结构,类似于数组,可以容纳任何类型的数据。DataFrame是二维的数据结构,可以认为是一个表格,其中每列可以是不同类型的数据。Pandas还提供了许多数据操作和数据分析的方法,例如数据清洗、数据筛选、数据变换、数据分组等等。Pandas的优点包括:易于操作、高效处理大数据、内置可视化工具、灵活的数据结构、支持多种数据格式等等。

官方网站:https://pandas.pydata.org/

官方文档:https://pandas.pydata.org/pandas-docs/stable/

2.基本使用

Pandas的使用可以分为以下几个方面:

  1. 数据结构的创建

创建Series和DataFrame的方式如下:

代码语言:javascript
代码运行次数:0
运行
复制
import pandas as pd

# 创建Series
s = pd.Series([1, 2, 3, 4])
print(s)

# 创建DataFrame
data = {'name': ['Tom', 'Jack', 'Steve', 'Ricky'], 
        'age': [28, 34, 29, 42],
        'city': ['Beijing', 'Shanghai', 'Guangzhou', 'Shenzhen']}
df = pd.DataFrame(data)
print(df)
  1. 数据读取和写入

读取和写入数据的方式有很多种,比较常用的是读写CSV和Excel文件:

代码语言:javascript
代码运行次数:0
运行
复制
import pandas as pd

# 读取CSV文件
df = pd.read_csv('data.csv')

# 读取Excel文件
df = pd.read_excel('data.xlsx')

# 写入CSV文件
df.to_csv('data.csv', index=False)

# 写入Excel文件
df.to_excel('data.xlsx', index=False)
  1. 数据清洗和处理

Pandas提供了一系列数据清洗和处理的方法:

代码语言:javascript
代码运行次数:0
运行
复制
import pandas as pd

# 删除缺失值
df.dropna(inplace=True)

# 删除重复数据
df.drop_duplicates(inplace=True)

# 替换数据
df.replace('old_value', 'new_value', inplace=True)

# 排序
df.sort_values('column_name', inplace=True)

# 筛选数据
df[df['column_name'] > 10]

# 分组汇总数据
df.groupby('column_name').sum()

# 合并数据
pd.merge(df1, df2, on='column_name')
  1. 数据可视化

Pandas内置了一些数据可视化工具,可以方便地绘制图表:

代码语言:javascript
代码运行次数:0
运行
复制
import pandas as pd
import matplotlib.pyplot as plt

# 绘制直方图
df['column_name'].hist()

# 绘制饼图
df.groupby('category')['value'].sum().plot(kind='pie')

# 绘制散点图
plt.scatter(df['column1'], df['column2'])

总的来说,Pandas提供了很多方便的数据操作和分析的功能,可以帮助我们更快地处理和分析数据。

3.相关案例

代码语言:javascript
代码运行次数:0
运行
复制
import pandas as pd
from pandas import DataFrame

# pandas读写Excel
def fun3_8_2():
    data = pd.read_excel('3_8 pandas 修改操作练习.xlsx', sheet_name='Sheet1')
    print(data)

    # 增加行数据,在第5行新增
    data.loc[4] = ['4', 'john', 'pandas']

    # 增加列数据,给定默认值None
    data['new_col'] = None

    # 保存数据
    DataFrame(data).to_excel('new.xlsx', sheet_name='Sheet1', index=False, header=True)


if __name__ == '__main__':
    fun3_8_2()
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2023-07-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前言
  • 一、pandas操作Excel
    • 1.pandas基本介绍
    • 2.基本使用
    • 3.相关案例
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档