首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Python3 Pandas错误: pandas.parser.CParserError:标记化数据时出错。C错误:第5行应为11个字段,实际为13个

Python3 Pandas错误: pandas.parser.CParserError:标记化数据时出错。C错误:第5行应为11个字段,实际为13个
EN

Stack Overflow用户
提问于 2015-04-21 01:43:14
回答 7查看 35K关注 0票数 4

我检查了这个答案,因为我遇到了类似的问题。

Python Pandas Error tokenizing data

然而,由于某种原因,我的所有行都被跳过了。

我的代码很简单:

代码语言:javascript
复制
import pandas as pd

fname = "data.csv"
input_data = pd.read_csv(fname) 

我得到的错误是:

代码语言:javascript
复制
  File "preprocessing.py", line 8, in <module>
    input_data = pd.read_csv(fname) #raw data file ---> pandas.core.frame.DataFrame type
  File "/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/site-packages/pandas/io/parsers.py", line 465, in parser_f
    return _read(filepath_or_buffer, kwds)
  File "/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/site-packages/pandas/io/parsers.py", line 251, in _read
    return parser.read()
  File "/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/site-packages/pandas/io/parsers.py", line 710, in read
    ret = self._engine.read(nrows)
  File "/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/site-packages/pandas/io/parsers.py", line 1154, in read
    data = self._reader.read(nrows)
  File "pandas/parser.pyx", line 754, in pandas.parser.TextReader.read (pandas/parser.c:7391)
  File "pandas/parser.pyx", line 776, in pandas.parser.TextReader._read_low_memory (pandas/parser.c:7631)
  File "pandas/parser.pyx", line 829, in pandas.parser.TextReader._read_rows (pandas/parser.c:8253)
  File "pandas/parser.pyx", line 816, in pandas.parser.TextReader._tokenize_rows (pandas/parser.c:8127)
  File "pandas/parser.pyx", line 1728, in pandas.parser.raise_parser_error (pandas/parser.c:20357)
pandas.parser.CParserError: Error tokenizing data. C error: Expected 11 fields in line 5, saw 13
EN

回答 7

Stack Overflow用户

发布于 2015-04-21 01:59:32

解决方法是使用pandas内置的分隔符“嗅探”。

代码语言:javascript
复制
input_data = pd.read_csv(fname, sep=None) 
票数 10
EN

Stack Overflow用户

发布于 2016-08-31 04:19:15

对于那些在这里登陆的人,当文件实际上是一个.xls文件而不是真正的.csv时,我得到了这个错误。尝试在电子表格应用程序中重新保存为csv。

票数 5
EN

Stack Overflow用户

发布于 2017-09-22 11:24:05

我也有同样的错误,我用下面的命令读取了我的csv数据:d1 = pd.read_json('my.csv'),然后我尝试这个d1 = pd.read_json('my.csv', sep='\t'),这次它是正确的。所以如果你的分隔符不是',',你可以尝试这个方法,因为缺省的是',',所以如果你没有明确指出,它就会出错。pandas.read_csv

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/29754786

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档