腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
0
回答
pandas
块
read_csv
中
的
数据类型
问题
当运行此代码以在
块
中加载csv时,dtype0= df_i.dtypesfor df_i in list01:它只返回基于对象
的
。dept int64company
浏览 0
提问于2017-01-06
得票数 0
回答已采纳
3
回答
将大型数据集加载到
Pandas
Python
中
、
、
我想从InstaCart 加载大型.csv (340万行,206k用户)开源数据集 基本上,我在将orders.csv加载到
Pandas
DataFrame时遇到了
问题
。我想学习将大文件加载到
Pandas
/Python
中
的
最佳实践。
浏览 3
提问于2017-06-14
得票数 1
3
回答
在
pandas
.read_csv
中
,dtype和转换器有什么区别?
、
、
、
、
熊猫函数
read_csv
()读取一个.csv文件。它
的
文档是 转换器: dict,默认不对某些列
中
的
值进行转换
的
函数。键可以是整数或列标签。在使用此函数时,我可以调用
pandas
.read_csv('file
浏览 3
提问于2015-12-07
得票数 37
回答已采纳
2
回答
Pandas
读取带有浮点值
的
csv文件时会出现奇怪
的
舍入和小数位数
、
、
、
、
我有一个包含数值
的
csv文件,比如1524.449677。总是恰好有6位小数。 当我通过
pandas
read_csv
导入csv文件(和其他列)时,列自动获得
数据类型
object。我
的
问题
是,这些值显示为2470.6911370000003,而实际上应该是2470.691137。或者,值2484.30691显示为2484.3069100000002。在某种程度上,这似乎是一个
数据类型
问题
。通过将dtype参数设置为{'columnname
浏览 1
提问于2017-11-19
得票数 23
回答已采纳
1
回答
ValueError:计算数据
中
的
列与提供
的
元数据
中
的
列不匹配
、
、
在kaggle竞赛
中
,我正在处理一个有550万行
的
数据集。在熊猫
中
,读取.csv并处理它们需要几个小时。 达斯克进来了。Dask速度很快,但有很多错误。
浏览 6
提问于2018-09-10
得票数 5
4
回答
可以分块读取拼图文件吗?
例如,
pandas
的
read_csv
有一个chunk_size参数,它允许
read_csv
在CSV文件上返回一个迭代器,这样我们就可以分块读取它。拼图格式以
块
的
形式存储数据,但是没有像
read_csv
这样
的
有文档记录
的
方法来读入
块
。 有没有办法以
块
的
形式读取拼图文件?
浏览 3
提问于2019-11-29
得票数 8
2
回答
从Oracle读取包含数百万行
的
大表并将其写入HDF5
、
、
、
我正在使用一个具有数百万行和100+列
的
Oracle数据库。我尝试使用带有索引
的
pytables将此数据存储在HDF5文件
中
。我将在
pandas
DataFrame
中
读取这些数据
的
子集并执行计算。我尝试了以下几种方法: 使用实用程序将表下载到csv文件
中
,使用
pandas
逐
块
读取csv文件
块
,并使用
pandas
.HDFStore附加到HDF5表。但是,现在当我尝试直接从Oracle DB下载数据并通
浏览 2
提问于2013-12-17
得票数 12
1
回答
忽略
pandas
中
数据类型
不匹配
的
行
、
、
在
pandas
中
读取巨大
的
CSV时,我指定了
数据类型
error_bad_lines=False,dtype={'a': str, 'b': np.float64, 'c':np.float64}, 但我<
浏览 21
提问于2016-07-25
得票数 12
1
回答
以numpy数组
的
形式从excel文件导入数据
我有一个包含250个变量(integer和float)
的
.csv文件,这些变量具有给定
的
列名。第一列是序列号,最后一列是'label‘我正在使用github
中
的
代码将其导入为numpy数组:train_data = genfromtxt如何将输出转换为正确
的
numpy数组格式,不包括第一列,并将最后一列存储到不同
的
'Y‘变量
中
。我使用
的
是以下代码: np.reshape
浏览 3
提问于2018-03-27
得票数 1
1
回答
如何解析CSV文件(如用逗号或管道)并将其读入数据帧?
、
我试图循环一个文件夹
中
的
多个CSV文件,并将每个文件解析为一个数据框架,然后获取每个字段
的
数据类型
。在进入循环之前,我尝试解析一个CSV文件,并且遇到了一些
问题
。这就是我现在
的
工作。import
pandas
as pdcsv_file = 'C:\\path\\ARMINDEX.CSV'df
浏览 5
提问于2018-11-01
得票数 1
回答已采纳
2
回答
回顾在if语句中创建
的
变量
、
、
、
、
我正在遍历目录
中
的
文件。但是我只需要有.csv扩展名
的
文件。然后,我需要使用这些文件
的
路径,以便在代码后面使用它们。if file.endswith(ext): datoteka = root + '\\' + subdir + '\\' + file但是
浏览 7
提问于2022-07-23
得票数 0
回答已采纳
3
回答
pd.read_csv优化,减少运行时间
、
、
、
、
我
的
输入文件是20 is
的
.txt文件,所以当我测试运行下面的代码时,它会遇到性能
问题
。pd.read_csv花了3个多小时。需要在阅读阶段进行优化。4 757582821517 001 NaN NaN NaNimport
pandas
浏览 40
提问于2021-06-09
得票数 0
1
回答
Pandas
在使用read_sql时不使用dtype吗?
、
、
我在sql中有一个表,我希望将其读入到
pandas
数据帧
中
。我可以读入表,但所有列
数据类型
都是作为对象读入
的
。当我将表写入csv,然后使用
read_csv
重新读回它时,假定
数据类型
是正确
的
。显然,这个中间步骤效率很低,我只希望能够直接从sql读取数据,并假定
数据类型
正确。 我在df中有650列,因此显然不可能手动指定
数据类型
。
浏览 46
提问于2019-11-14
得票数 0
1
回答
减少内存使用后无法使用to_csv导出csv
、
、
、
、
我已经打开了csv文件(600mb)它非常大,所以我从以下几个方面减少了内存使用:它在Jupter Notebook
中
工作,并显示: optimized_df.info() 现在,我想导出缩减
的
DataFrame当我将新文件读到Jupyter Notebook时,
数据类型
与缩减前相同,内存使用量也是如此(1,6 GB+)。我做错了什么?
浏览 1
提问于2018-03-16
得票数 0
1
回答
VS代码补全很糟糕,是我
的
设置吗?
、
、
VS Code
中
的
代码完成和智能感知对我来说绝对是可怕
的
。在每一种语言中。我有安装和更新
的
扩展,但它总是绝对
的
垃圾。import
pandas
as pddata_all. (press tab)我在python、ruby/rails
中
遇到过这个
问题
,几乎我
浏览 19
提问于2021-03-13
得票数 1
2
回答
如何使用
pandas
将日期作为纯文本处理?
、
我使用
pandas
读取.csv文件,然后将其另存为.xls文件。代码如下:df = pd.read_csv('filename.csv', encoding='GB18030')df.to_excel('filename.xls') 有一列包含类似'2020/7/12‘
的
日期,看起来熊猫把它识别为日期并自动输出到'2020-07-12’。这种转换发生在
read_csv</
浏览 1
提问于2020-07-12
得票数 0
1
回答
从字符串缓冲区读取
pandas
.read_csv
的
代码检查警告
、
我
的
Python环境使用
Pandas
1.4.2。我有以下从字符串缓冲区读取
的
代码:data:
pandas
.DataFrame =
pandas
.read_csv(io.StringIO(response.content.decode("utf-8")), skiprows=2)Expe
浏览 7
提问于2022-05-03
得票数 2
1
回答
达克
read_csv
在熊猫不成功
的
地方失败
、
、
尝试在熊猫
的
read_csv
文件中使用达斯克
的
read_csv
失败,但有以下错误:https://google.com,"<a href=""link"">使sample参数大到足以在内存中加载整个文件似
浏览 0
提问于2017-08-18
得票数 10
2
回答
date_parser: TypeError: TypeError()接受一个位置参数,但给出了2个位置参数
、
、
、
索引(将“日期”和“时间”列合并到一个列
中
)。这是代码
的
一个片段:from datetime import datetime return datetime.strptime],原来
的
日期和时间是这样
的
:25-Apr-17 19},
浏览 0
提问于2020-05-27
得票数 0
回答已采纳
1
回答
熊猫=在excel上正确()
、
、
因此,我基本上尝试对列旁边
的
整个列执行一个=RIGHT()函数。我目前正在引用,但是我得到了一个Can only use .str accessor with string values!错误import
pandas
as pd df['C
浏览 3
提问于2021-11-02
得票数 0
回答已采纳
点击加载更多
相关
资讯
Pandas 的常用数据类型概述
pandas的groupby问题
Pandas常用的两种数据类型之“Series”
盘点一个Pandas实战需求的问题
pandas 入门 1:数据集的创建和绘制
热门
标签
更多标签
云服务器
ICP备案
云直播
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券