前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Python 中批量提取 Excel 数据的详细指南

Python 中批量提取 Excel 数据的详细指南

作者头像
sergiojune
发布于 2024-06-25 00:53:28
发布于 2024-06-25 00:53:28
1.7K04
代码可运行
举报
文章被收录于专栏:日常学python日常学python
运行总次数:4
代码可运行

更多Python学习内容:ipengtao.com

在数据处理和分析的过程中,Excel 是一种广泛使用的数据存储格式。使用 Python 可以高效地从多个 Excel 文件中提取数据,进行汇总和分析。本文将详细介绍如何使用 pandasopenpyxlxlrd 三种库来批量提取 Excel 数据,并提供相应的示例代码。

使用 pandas 批量提取 Excel 数据

pandas 是一个强大的数据分析库,它提供了直接读取和处理 Excel 文件的功能。

1. 安装 pandas

首先,确保已安装 pandasopenpyxl

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pip install pandas openpyxl

2. 读取单个 Excel 文件

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import pandas as pd

# 读取 Excel 文件
df = pd.read_excel('data.xlsx')

# 显示前几行数据
print(df.head())

3. 批量读取多个 Excel 文件

假设有多个 Excel 文件存放在一个文件夹中,文件名格式为 data_1.xlsx, data_2.xlsx,以此类推。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import os

# 存放 Excel 文件的文件夹路径
folder_path = 'path_to_folder'

# 获取所有 Excel 文件路径
file_list = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xlsx')]

# 初始化一个空的 DataFrame
all_data = pd.DataFrame()

# 逐个读取并合并
for file in file_list:
    df = pd.read_excel(file)
    all_data = all_data.append(df, ignore_index=True)

# 显示合并后的数据
print(all_data.head())

使用 openpyxl 批量提取 Excel 数据

openpyxl 是一个专门处理 Excel 文件的库,适用于处理 .xlsx 格式的文件。

1. 安装 openpyxl

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pip install openpyxl

2. 读取单个 Excel 文件

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from openpyxl import load_workbook

# 加载 Excel 文件
wb = load_workbook('data.xlsx')

# 选择活动工作表
ws = wb.active

# 读取所有数据
data = []
for row in ws.iter_rows(values_only=True):
    data.append(row)

# 打印数据
for row in data:
    print(row)

3. 批量读取多个 Excel 文件

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import os
from openpyxl import load_workbook

# 存放 Excel 文件的文件夹路径
folder_path = 'path_to_folder'

# 获取所有 Excel 文件路径
file_list = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xlsx')]

# 初始化一个空的列表
all_data = []

# 逐个读取并合并
for file in file_list:
    wb = load_workbook(file)
    ws = wb.active
    for row in ws.iter_rows(values_only=True):
        all_data.append(row)

# 打印合并后的数据
for row in all_data:
    print(row)

使用 xlrd 批量提取 Excel 数据

xlrd 是一个用于读取 Excel 文件的库,适用于 .xls.xlsx 格式的文件。

1. 安装 xlrd

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pip install xlrd

2. 读取单个 Excel 文件

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import xlrd

# 打开 Excel 文件
workbook = xlrd.open_workbook('data.xls')

# 选择工作表
sheet = workbook.sheet_by_index(0)

# 读取所有数据
data = []
for row_idx in range(sheet.nrows):
    row = sheet.row_values(row_idx)
    data.append(row)

# 打印数据
for row in data:
    print(row)

3. 批量读取多个 Excel 文件

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import os
import xlrd

# 存放 Excel 文件的文件夹路径
folder_path = 'path_to_folder'

# 获取所有 Excel 文件路径
file_list = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xls') or f.endswith('.xlsx')]

# 初始化一个空的列表
all_data = []

# 逐个读取并合并
for file in file_list:
    workbook = xlrd.open_workbook(file)
    sheet = workbook.sheet_by_index(0)
    for row_idx in range(sheet.nrows):
        row = sheet.row_values(row_idx)
        all_data.append(row)

# 打印合并后的数据
for row in all_data:
    print(row)

总结

本文详细介绍了如何使用 pandasopenpyxlxlrd 三种库批量提取 Excel 数据,并提供了相应的示例代码。通过这些方法,可以高效地处理多个 Excel 文件,提高数据处理的效率。希望这些内容能够帮助大家在实际开发中更好地处理 Excel 数据。

如果你觉得文章还不错,请大家 点赞、分享、留言 下,因为这将是我持续输出更多优质文章的最强动力!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 日常学python 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
手把手教你4种方法用Python批量实现多Excel多Sheet合并
大家好,我是崔艳飞。前两天给大家分享了Python自动化文章:手把手教你利用Python轻松拆分Excel为多个CSV文件,而后在Python进阶交流群里边有读者遇到一个问题,他有很多个Excel表格,他需要对这些Excel文件进行合并。
Python进阶者
2021/03/09
2.4K0
手把手教你4种方法用Python批量实现多Excel多Sheet合并
Python自动化:Python操作Excel的多种方式Pandas+openpyxl+xlrd
使用pandas操作Excel文件主要涉及读取(read_excel)和写入(to_excel)两个主要操作。
小白的大数据之旅
2024/11/20
1.3K0
Python下Excel批量处理工具:从入门到实践
在日常办公中,Excel表格处理是一项常见且繁琐的任务。当需要处理大量Excel文件时,手动操作不仅效率低下,还容易出错。因此,开发一款Excel批量处理工具成为了一个迫切的需求。本文将介绍如何使用Python语言开发一款Excel批量处理工具,帮助快速上手并实现自动化处理。
大盘鸡拌面
2024/04/29
7040
使用Python读取Excel表格“.xlsx”和“.xls”方法大全:一文教会你如何使用Python处理Excel表格数据
随着数据分析的普及,处理Excel表格成了开发者的日常需求。今天,猫头虎为你整理了使用Python读取.xlsx和.xls文件的多种方法,无论是新手还是老鸟,都能轻松掌握!🚀
猫头虎
2025/01/10
2.2K0
AI办公自动化-kimi批量在多个Excel工作表中绘制柱状图
设置柱状图的标题为"1-9月注册人数",选择图表样式为1,并设置y轴和x轴的标题分别为"注册人数"和"月份"。
AIGC部落
2024/06/24
6060
AI办公自动化-kimi批量在多个Excel工作表中绘制柱状图
超超长篇 - 手把手带你用python玩转Excel
gitee:https://gitee.com/xiaozai-van-liu/mwj_utils
梦无矶小仔
2024/06/18
1.1K0
超超长篇 - 手把手带你用python玩转Excel
Python 接口测试之Excel表格数据操作方法封装
  我们在做接口测试,经常会用到excel去管理测试数据,对Excel的操作比较频繁,那么使用python如何操作Excel文件的读与写呢?由于之前讲的都是大的框框,没有讲这么小的模块使用,现在就化整为0的讲解。
全栈测试开发日记
2023/02/18
6620
Python 接口测试之Excel表格数据操作方法封装
Python3 读取和写入excel xlsx文件 使用openpyxl
•win32com:不仅仅是excel,可以处理office;不过它相当于是 windows COM 的封装,新手使用起来略有些痛苦。
用户7886150
2020/12/23
3.4K0
Python操作Excel模块,你猜哪家强?
导读:Python操作excel的模块简直不要太多,今天就为大家比较下各模块之间的优缺点。
IT阅读排行榜
2020/02/20
1.9K0
Python操作Excel模块,你猜哪家强?
使用python操作Excel文件
我们在办公日常用经常会接触到办公软件Excel,也会遇到大量数据迁移的问题,手动操作这么反人类的事情,俺们程序员肯定是不会干的。
不作声
2020/12/08
1.1K0
盘点一个Python自动化办公Excel数据处理的需求
前几天在Python白银交流群【干锅牛蛙】问了一个Python处理Excel数据的问题。问题如下:有两个问题哈:1、表头有合并单元格识别不出来,如何处理类似下图
Python进阶者
2024/02/29
1960
盘点一个Python自动化办公Excel数据处理的需求
零代码编程:用ChatGPT根据excel表格数据来批量修改文件标题名
现在,希望根据Excel表格中的标题名来对文件夹里的mp4文件进行批量重命名,在ChatGPT中输入提示词:
AIGC部落
2024/06/24
1690
零代码编程:用ChatGPT根据excel表格数据来批量修改文件标题名
python读写excel
在工作中往往需要读取 excel 文件,但是读取 excel 的方式很多,本文只列举集中比较好用的读写 2003 或者 2007 的方法:
机器学习和大数据挖掘
2019/07/02
1.9K0
python读取excel数据
在数据处理和分析的过程中,Python 以其强大的功能和灵活性成为了众多开发者的首选工具。其中,读取 Excel 数据是一项常见的任务。本文将介绍 Python 读取 Excel 数据的各种方式以及可能遇到的问题,并着重讲解如何解决读取 Excel 文件时出现的编码问题。
井九
2024/10/12
3800
Python处理Excel数据的方法[通俗易懂]
当Excel中有大量需要进行处理的数据时,使用Python不失为一种便捷易学的方法。接下来,本文将详细介绍多种Python方法来处理Excel数据。
全栈程序员站长
2022/11/18
6.2K0
Python办公自动化之Excel做表自动化:全网最全,看这一篇就够了!
官方文档:https://xlrd.readthedocs.io/en/latest/
Python小二
2020/09/08
8K0
Python办公自动化之Excel做表自动化:全网最全,看这一篇就够了!
openpyxl:Python的Excel操作库
luckpunk
2023/09/27
9430
openpyxl:Python的Excel操作库
Python 实现多 Sheet 表合并、多工作簿合并、一表按列拆分
作者:黄伟 来源:杰哥的IT之旅(ID:Jake_Internet) 转载请联系授权(WeChat ID:Hc220066)
AI算法与图像处理
2019/11/13
11.3K0
Python 自动化办公实战指南:从基础到进阶
在现代职场中,大量重复性的任务仍然存在,例如整理 Excel 表格、批量发送邮件、数据录入、文件命名等。这些操作机械又耗时,容易出错。
用户11690571
2025/06/10
1840
Python使用openpyxl模块读写excel文件
openpyxl是一个用于写入和读取xlsx格式的excel文件的Python模块。
Python碎片公众号
2021/02/26
4.9K0
Python使用openpyxl模块读写excel文件
推荐阅读
相关推荐
手把手教你4种方法用Python批量实现多Excel多Sheet合并
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验