首页
学习
活动
专区
圈层
工具
发布

6个pandas新手容易犯的错误

在实际中如果出现了这些问题可能不会有任何的错误提示,但是在应用中却会给我们带来很大的麻烦。 使用pandas自带的函数读取大文件 第一个错误与实际使用Pandas完成某些任务有关。...实际上,这个对我来说最严重的错误是没有阅读Pandas 的文档。但是一般情况下没人会阅读文档,对吧。有时候 我们宁愿在互联网上搜索数小时也不愿阅读文档。...但是当涉及到 Pandas 时,这个就是一个非常大的错误了。...我今天提到的所有错误都可以在文档中找到。甚至在文档的“大型数据集”部分会专门告诉你使用其他软件包(如 Dask)来读取大文件并远离 Pandas。...其实如果我有时间从头到尾阅读用户指南,我可能会提出 50 个新手错误,所以还是看看文档吧。 总结 今天,我们学习了新手在使用Pandas时最常犯的六个错误。

2.1K20

pandas文件读取错误及解决办法

错误一:‘gbk’ codec can’t decode byte 0x98 in position 2: illegal multibyte sequence 报错代码: data_path=r"G:...\test.csv" f = open(data_path) res = pd.read_csv(f) f.close() 错误解读: Unicode的解码Decode错误(Error),以gbk编码的方式去解码...此种错误,可能是要处理的字符串本身不是gbk编码,但是却以gbk编码去解码 。比如,字符串本身是utf-8的,但是却用gbk去解码utf-8的字符串,所以结果不用说,则必然出错。...from file failed 报错代码:pd.read_csv(r"G:\文件名.csv") 错误解读:文件初始化失败;即:文件路径或者文件名中存在中文,pd.read_csv()需要通过open...,errors 忽略 data=pd.read_csv(f) f.close 错误四:部分带公式的Excel读不出来 解决办法:请移步之前文章,链接如下: 1、https://blog.csdn.net

1.7K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Pandas切片操作:一个很容易忽视的错误

    这是因为Pandas提供了太多方法可以做同样的事情,方法选择不当,可能导致一些意想不到的错误。...Pandas切片 Pandas数据访问方式包括:df[] ,.at,.iat,.loc,.iloc(之前有ix方法,pandas1.0之后已被移除) df[] :直接索引 at/iat:通过标签或行号获取某个数值的具体位置...它们之间的区别不是文本重点,大家可以新建一个dataframe练习一下,本文我们主要来一个错误示范,然后给大家提一些合理的建议。...错误示范 新建一个DataFrame df = pd.DataFrame( {'x':[1,5,4,3,4,5], 'y':[.1,.5,.4,.3,.4,.5], 'w':[11,15,14,13,14,15...value is trying to be set on a copy of a slice from a DataFrame SettingWithCopyWarning 是一个警告 Warning,而不是错误

    2.7K20

    pandas

    pandas的介绍 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。...pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。...1.pandas数据结构的介绍 Series:一维数组,与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近。...2.Series的操作 2.1 对象创建 2.1.1 直接创建 2.1.2 字典创建 import pandas as pd import numpy as np # 直接创建 s = pd.Series...import pandas as pd import numpy as np s = pd.Series(np.random.randn(5), index=['a','b','c','d','e']

    90230
    领券