Pandas在使用read_excel时不断重复行

Pandas是一个开源的数据分析和数据处理工具，在使用read_excel函数读取Excel文件时，可能会出现重复行的问题。这个问题通常是由于Excel文件中的某些行包含了合并的单元格或者存在空白行导致的。

为了解决这个问题，可以采取以下步骤：

使用skiprows参数来跳过需要忽略的行。可以使用列表形式来指定需要跳过的行号，例如skiprows=[0, 2, 3]将跳过第1、第3和第4行。
使用header参数指定数据开始的行号。如果Excel文件中包含标题行，可以设置header为正确的行号，例如header=1表示数据从第2行开始。
使用usecols参数指定需要读取的列范围。可以使用列表形式来指定需要读取的列的索引或者列名，例如usecols=[0, 1, 2]表示只读取第1、第2和第3列的数据。

下面是一个示例代码：

import pandas as pd

df = pd.read_excel('data.xlsx', skiprows=[0], header=1, usecols=[0, 1, 2])

在上述示例代码中，data.xlsx是要读取的Excel文件名，skiprows跳过第1行，header设置为1表示数据从第2行开始，usecols只读取第1、第2和第3列的数据。你可以根据实际情况调整这些参数来适应你的数据。

对于Pandas的更多详细信息和用法，你可以参考腾讯云的相关产品腾讯云数据分析平台TDSQL，它是基于Presto和Hive的大数据分析服务，适用于数据分析、BI、报表、数据仓库等场景。你可以通过以下链接了解更多信息：

腾讯云数据分析平台TDSQL

Pandas在使用read_excel时不断重复行

、、、

我使用read_excel()将xlsx电子表格转换为数据帧。它通常工作得很好，但对于这个电子表格，当我导入它并尝试用df["Date"]列出所有值时，它似乎会在每个日期重复很多很多次。正如你所看到的，日期是重复的，它们在我的电子表格中绝对不像那样。知道为什么吗？谢谢

浏览 28提问于2020-01-13得票数 1

回答已采纳

1回答

Excel (LibreOffice Calc)显示空白单元格，但openpyxl显示值

、、、、

我有一个工作簿工作表，当用LibreOffice计算打开时，它显示前3行数据。如果我使用条件格式将单元格背景颜色设置为红色(如果单元格为空)，则第4行及后面的所有单元格都显示为红色。当我使用Pandas读取电子表格时，我得到了20行，第4行到第20行都是空白的。当我使用openpyxl读取电子表格时，我也得到了20行，这里是有趣的部分:第4行到第

浏览 10提问于2020-03-01得票数 0

1回答

如何访问Pandas中的重复列

、、

我在excel文件中有以下数据，具有相同名称的列。而不使用列索引号，而仅使用标题。有没有一种方法，不用真正重命名头文件？我目前使用的是列索引号，但是文件一天比一天大。

浏览 15提问于2020-09-20得票数 0

回答已采纳

1回答

Pandas读取具有多个行、列和合并单元格表头的excel表格

、、、

我是新手使用pandas，我正在尝试使用pandas read excel来处理文件作为df。电子表格如下所示： Excel Matrix 问题是这个文件在列和行中包含双标题，并且每个列的第一个标题都包含合并的单元格。我读过一些相关的帖子，说这是由于一些标题重复，但我一直无法解决这个问题。任何指南都将不胜感激。参考文献： Pandas read excel sheet with multiple header when first column is

浏览 502提问于2021-08-07得票数 0

回答已采纳

1回答

Pandas read_excel方法跳过行

、

我正在使用pandas中的read_excel方法读取xls文件。这是Excel文件：如您所见，A2和B2单元格合并为一个。因此，从read_excel方法返回的dataframe对象从第3行开始。当我打印dataframe对象的前两列的名称时，它打印A3和B3单元格。因此，我无法访问前两行，但我需要它们。

浏览 3提问于2020-08-31得票数 0

2回答

在python中访问excel工作表的单独行

、、、、

我想让我的主脚本将excel工作表读入单独的行，如下所述：我只想知道python控制台中不同行的详细信息，例如:- row1 = ['name':row1,'meetid':121121,'

浏览 2提问于2020-11-22得票数 0

回答已采纳

2回答

Pandas:如何从excel文件中读取DataFrame文件，其中多行有时用换行符分隔(\n)

、、、、

我正在尝试用pandas读取一些excel文件。在某些文件中，感兴趣的表的格式不是很好，即多行被格式化为单行，但每行都有多行。因此，当您查看excel文件时，数据显示得很好。此外，当使用pandas解析它时，每行的末尾确实有一个换行符(\n)。问题是，当我使用read_excel()函数读取它时，它将它转换成一个DataFrame，它不将换行符视为单独的行，而是将其放入包含\n的一行中。我想写一段代

浏览 6提问于2019-04-11得票数 6

2回答

为什么Pandas read_excel函数在Pyinstaller .exe中返回一个错误，而不是在Pyinstaller解释器下返回一个错误？

、、

我使用Pandas read_excel函数从电子表格中导入数据。在Python解释器下运行时，这很好，但是当我用PyInstaller构建一个exe时，它会返回一个IndexError。当我用pandas_test.py构建PyInstaller时，它成功地生成了一个pandas_test.exe，但是我得到了以下错误：回溯(最近一次调用)：文件"pandas_test.py"，第4行，<e

浏览 0提问于2018-09-06得票数 3

2回答

如何在制作DataFrame时忽略电子表格中的空白？

、、、

我有一个像这样的Excel文件-我想忽略所有空白行，包括BSE_IDA.INTV_R (临时表)部分，并使用该表下的列标题和DataFrame中的所有值作为行。我该怎么做？

浏览 1提问于2018-06-20得票数 0

回答已采纳

1回答

帮助提高我在python中的"read_excel“执行时间。我的代码读起来很慢

、、

当我的工作表上少于50行时，它工作得很好。但是，当我尝试使用包含近4.000行的实际excel文件时，突然要花费很长时间。虽然4.000是很多，但我确信我的方法仍然是非常低效的。正如您在下面的代码中所看到的，我在循环中一次又一次地使用read_excel。我觉得应该有一种方法，只阅读整个第1栏，然后从那里开始工作。我的目标是从第0行开始读取5行作为第一个输入。然后再读取5行，但从第1行</

浏览 0提问于2020-05-01得票数 1

回答已采纳

2回答

在Python pandas中使用`read_excel`读取空单元格

、、、

我正在使用Python pandas to read_excel。这就是我正在阅读的专栏。我的问题是read_excel没有将空单元格计算为单元格。当我使用df2=df1.iloc[0:30]时，我希望它包含那些空单元格，这样最后两个数据项就不会包含在我的数据框中(这是因为这些单元格在整个月中每天都被填充，所以这些空单元格将一直存在到这个月的最后一天如何确保pandas read_excel在其数据帧中包含这些空单元格？

浏览 1提问于2017-11-30得票数 1

1回答

从excel创建Dataframe

、

我正在尝试导入excel并使用pandas read_excel函数创建数据帧。谢谢！

浏览 0提问于2020-03-21得票数 0

1回答

熊猫不会打开奇怪的TSV文件

、、

这里的TSV文件来自，它来自，不会在Pandas上打开。我尝试过几件事:使用标签分隔符，用read_excel打开它(网站上说它与所有现代系统兼容)。path = "C:.._reader.read_low_memory(Nrow)文件"pandas_libs\parsers.pyx"，第805行，在pandas._libs.parsers.TextReader._tokenize_rows文件“pandas<

浏览 9提问于2022-09-02得票数 1

回答已采纳

1回答

“DataFrame”没有属性“read_excel”

、

在使用panda库将.xlsx文件转换为html时table = df.to_html() 我面临着下面的错误 AttributeError: type object 'DataFrame' h

浏览 40提问于2017-12-19得票数 0

回答已采纳

3回答

如何将xls中的所有字段作为字符串导入Pandas* dataframe？*

、、、、

因此，对于包含100列的Excel表，我将使用dict理解范围(99)执行以下操作。import pandas as pd非常感谢！

浏览 0提问于2017-01-25得票数 3

回答已采纳

1回答

如何使用read_excel和to_excel格式化excel单元格？

、、、

Sheet 1:第一个工作表'Home'，在第一行中有‘这是一个测试’的句子，从单元格A1开始，以列D1结尾。以下是家庭工作表的一个示例：单张2:Cell: A1"col1“Cell: B1 "col2”Cell: A2 "21“Cell: B1 23”Cell: A3 "22“Cell: B3 "24” 到目前为止，我的代码

浏览 0提问于2018-10-30得票数 0

回答已采纳

2回答

Pandas:如何让openpyxl成为所有read_excel操作的默认引擎？

、

由于较新的pandas版本中的read_excel默认引擎，如何使openpyxl成为我所有pd.read_excel调用的默认引擎？现在，如果我更新pandas，我必须在我所有的pd.read_excel调用中放入参数engine="openpyxl"。这看起来没必要。

浏览 15提问于2021-03-22得票数 0

2回答

当我将我的cvs导入python时，它只显示我的大小为1。

、

我的代码是：import matplotlib.pyplot as plt 在我的excel中，我有60行14列但是它显示了一个大小为(59,1)的Dataframe

浏览 2提问于2021-06-18得票数 0

1回答

熊猫0.19 Read_Excel和UNC地址

、、

当他们安装机器学习时，它用Pandas 0.19安装了Python3.5。我试图在网络驱动器上的文件上使用read_excel。我可以在本地机器上运行脚本，但是我有Python3.9和Pandas 1.35。脚本在本地运行良好，但在通过服务器使用EXECUTE sp_execute_external_script执行时却不能工作。我意识到可能有很多事情会导致dbe产生问题，但我需要首先排除Pandas版本。服务器是locke自己的，它

浏览 9提问于2022-01-12得票数 0

1回答

未实现read_excel的parse_dates关键字

、

当我读取excel文件时，我得到以下错误："NotImplementedError: read_excel的parse_dates关键字未实现“。我在使用read_csv时没有得到这个错误calendar = p.read_excel('../data/testdates.xlsx', parse_dates=['date']) 我使用的是python: 3.6

浏览 1提问于2017-11-16得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Pandas在使用read_excel时不断重复行

相关·内容

Pandas在使用read_excel时不断重复行

Excel (LibreOffice Calc)显示空白单元格，但openpyxl显示值

如何访问Pandas中的重复列

Pandas读取具有多个行、列和合并单元格表头的excel表格

Pandas read_excel方法跳过行

在python中访问excel工作表的单独行

Pandas:如何从excel文件中读取DataFrame文件，其中多行有时用换行符分隔(\n)

为什么Pandas read_excel函数在Pyinstaller .exe中返回一个错误，而不是在Pyinstaller解释器下返回一个错误？

如何在制作DataFrame时忽略电子表格中的空白？

帮助提高我在python中的"read_excel“执行时间。我的代码读起来很慢

在Python pandas中使用`read_excel`读取空单元格

从excel创建Dataframe

熊猫不会打开奇怪的TSV文件

“DataFrame”没有属性“read_excel”

如何将xls中的所有字段作为字符串导入Pandas* dataframe？*

如何使用read_excel和to_excel格式化excel单元格？

Pandas:如何让openpyxl成为所有read_excel操作的默认引擎？

当我将我的cvs导入python时，它只显示我的大小为1。

熊猫0.19 Read_Excel和UNC地址

未实现read_excel的parse_dates关键字

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐