腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
如何
从
Dask
dataframe
中
选择
n
个
等
间距
的
行
?
、
、
我想将它们加载到
dask
数据框架
中
,计算一些结果( cumsum ),然后将cumsum显示为图。由于这个原因,我想从cumsum
行
中
选择
等
间距
的
数据子集(一些k
行
),然后绘制这个子集。
浏览 9
提问于2020-02-25
得票数 0
1
回答
如何
在
dask
.
dataframe
中子集一
行
?
、
、
、
我试图使用命令
dask
.
dataframe
从
x.loc[0].compute()
中
只
选择
一
行
。它返回4
行
,所有行都有index=0。我尝试了reset_index,但在重置后仍有4
行
具有index=0。(我认为我重置是正确
的
,因为我做了reset_index(drop=False),我可以在新列中看到原始索引)。我阅读了
dask
.
dataframe
文档,它说明了index=0可能有多个
行</
浏览 0
提问于2019-02-02
得票数 4
回答已采纳
1
回答
KeyError:当尝试
选择
dask
数据框上
的
列时:“没有[索引([‘’,''],dtype='object')]在[列]
中
”
、
我正在使用from_pandas()函数
从
熊猫数据帧创建一
个
dask
数据帧。当我尝试使用方括号[ ]
从
dask
dataframe
中
选择
两列时,我得到了一
个
KeyError。根据
dask
文档,
dask
dataframe
支持像pandas
dataframe
一样
的
方括号列
选择
。# data is a pandas
dataframe</e
浏览 67
提问于2019-10-04
得票数 1
2
回答
如何
在
dask
中使用'loc‘
选择
数据帧
的
列
、
、
、
、
谁能告诉我应该
如何
使用
dask
在数据框中
选择
一列“loc”?> import
dask
.
dataframe
as dd > df = dd.read_csv('filename.csv', header=No
浏览 1
提问于2018-08-26
得票数 4
1
回答
从
dask
dataframe
提供程序收集属性
、
、
TL;DR:我
如何
从
分布式读取
中
收集元数据(解析期间
的
错误)到
dataframe
集合
中
。 目前,我有一种专用
的
文件格式,用于输入
dask
.
DataFrame
。我有一
个
函数,它接受一
个
文件路径并返回一
个
pandas.
DataFrame
,
dask
.
DataFrame
成功地在内部使用该函数将多个文件加载到同一
个
<em
浏览 7
提问于2016-01-26
得票数 2
回答已采纳
1
回答
将熊猫数据
行
分配给
Dask
dataframe
分区
、
、
、
假设有X分区
的
dask
数据帧。假设熊猫
的
数据有相同
的
X行数。熊猫数据
中
的
每一
行
都包含与
dataframe
的
每个分区相关
的
数据。我想将每个熊猫df
行
分配给一
个
新
的
dataframe
分区列import
dask
# default
dask<
浏览 3
提问于2019-10-16
得票数 0
1
回答
为什么默认情况下
dask
()只检查第一
个
分区?
、
、
、
dask
版本1.1.4过滤后
的
dask
.
dataframe
似乎将
行
保留在原始分区
中
。如果一
个
分区
的
所有行都被过滤掉,那么分区将保持为空,但仍保留在生成
的
dask
.
dataframe
中
。如果len(第一
个
分区)<
n</e
浏览 0
提问于2019-07-03
得票数 1
回答已采纳
3
回答
如何
将
Dask
.
DataFrame
转换为pd.
DataFrame
?
、
、
如何
将生成
的
dask
.
DataFrame
转换为pandas.
DataFrame
(假设我已经完成了繁重
的
任务,只想将sklearn应用到聚合结果
中
)?
浏览 27
提问于2016-08-18
得票数 43
回答已采纳
1
回答
用
Dask
DataFrame
计算正向差分?
、
、
、
如何
使用
Dask
DataFrame
计算第一
个
离散差分?或者,在“潘达斯之声”
中
,我
如何
在达斯克做?
从
数学上讲,操作非常简单:
从
其自身
的
副本
中
减去一
个
列向量,移动一
行
或多行。我尝试过以以下方式在
Dask
中
实现diff(),但这些方法都没有工作(目前为止): df - df.shift(periods=1)在潘达斯工作。但是
Dask</
浏览 5
提问于2016-11-08
得票数 3
回答已采纳
1
回答
如何
使用
dask
并行导入hdf5数据并创建
dataframe
?
、
、
、
我完全被困住了,所以我正在寻求善意
的
建议。我
的
目标是并行读取多个hdf5文件,提取内部
的
多个模糊数组,并将每个数组存储在一
个
dataframe
的
一
行
,准确地说是一
个
单元格
中
。我不
选择
熊猫df,因为我相信它会太大。 不可能使用read_hdf()
从
用h5py创建
的
hdf5文件
中
读取。我能做些什么来用paralleL
中
的
da
浏览 0
提问于2021-09-30
得票数 1
回答已采纳
1
回答
dask
.
DataFrame
.apply与变长数据
、
我想将一
个
函数应用到一
个
dask
.
DataFrame
,它返回一系列可变长度。
n
_columns = np.random.randint(100)pdf = pd.
DataFrame
(dict(A=[1,2,3,4,5,6])) ddf = dd.from_
浏览 3
提问于2016-12-13
得票数 2
回答已采纳
2
回答
如何
在
DataFrame
中
创建唯一
的
索引?
、
、
、
、
想象一下,我有一
个
来自
Dask
DataFrame
的
read_csv,或者创建了另一种方式。reset_index在每个分区
中
构建一
个
单调上升
的
索引。这意味着(0,1,2,3,4,5,.)对于分区1,(0,1,2,3,4,5,.)对于分区2,(0,1,2,3,4,5,.)用于分区3
等
等
。我希望为
dataf
浏览 0
提问于2019-06-06
得票数 6
回答已采纳
4
回答
如何
读取一
个
非常大
的
CSV
的
一小部分行。熊猫-时间序列-大型数据集
、
、
、
我在一
个
大
的
文本文件中有一
个
时间序列。该文件超过4GB。df = pandas.read_csv('super_size_file.log',我可能想要一
个
块一
个
块地加载,并重新整理每一块。但在我看来效率很
浏览 0
提问于2019-05-23
得票数 2
回答已采纳
1
回答
将Python系列转换为list或
Dask
DataFrame
or for循环
、
、
、
().tolist()df_f = pd.
DataFrame
(list_1) 是否可以将
N
(即
Dask
系列)垂直附加到空白
的
Dask
中
?这将允许在for循环中构建
Dask
。在此之后(在循环之
浏览 1
提问于2017-05-03
得票数 1
回答已采纳
1
回答
Dask
无法读取整个文件
、
我尝试通过
Dask
读取一
个
很大
的
文件(68.3 GB),如下所示:auth_df = dd.read_csv('data/auth.txt',然后,
从
dataset
中
,我希望看到具有特定时间戳
的
5
行
(150885)。/site-packages/
dask
/
dataframe
/
浏览 5
提问于2021-03-16
得票数 1
3
回答
使用Python读取大型csv文件
、
、
、
、
这是我写
的
代码:import numpy as npfrom
dask
import
dataframe
as df1 以下是我
从
Python得到
的
错误:
dask
_df = df1.read_csv('3SPACK_
N
150_7Ah_PressureDistributionStudy_Data_Matrix.csv
浏览 0
提问于2021-06-17
得票数 0
1
回答
将自定义文件格式读取到
Dask
数据格式
、
、
、
、
我有一
个
巨大
的
自定义文本文件(不能加载整个数据到一
个
熊猫数据),我想读到达克数据。我编写了一
个
生成器来读取和解析数据块,并创建熊猫数据格式。我希望将这些熊猫数据加载到
dask
数据文件
中
,并对结果数据执行操作(比如创建计算列、提取部分数据帧、绘制等等)。我试着用达斯克袋,但没能成功。因此,我决定将结果数据写入HDFStore
中
,然后使用
Dask
从
HDFStore文件
中
读取数据。当我在自己
的
电脑上做这件
浏览 5
提问于2020-01-24
得票数 3
1
回答
Dask
read_csv:跳过周期性锁定
行
、
我想使用
Dask
在多个时间步骤
中
读取一
个
大
的
原子坐标文件。在那之后,原子被列出了他们
的
名字和位置。在列出所有原子之后,在下一
个
时间步骤
中
重复同样
的
步骤。
浏览 0
提问于2018-02-16
得票数 2
回答已采纳
1
回答
使用
dask
.bag和pandas.
DataFrame
将字典
的
dask
.delayed转换为
dask
.
dataframe
、
我正在努力将字典
的
dask
.bag转换为
dask
.delayed pandas.DataFrames,使之成为最终
的
dask
.
dataframe
到目前为止,我一直在使用
dask
.delayed对象来加载、转换和附加所有工
浏览 3
提问于2019-03-22
得票数 5
回答已采纳
1
回答
如何
读取数据并删除坏
行
、
、
、
、
我试图使用
dask
聚合一
个
包含多行坏数据
的
大型(66 of )数据库。导入
dask
.
dataframe
作为dd
从
dask
.distributed导入客户端导入熊猫 #Groups the average Thresholds by
浏览 2
提问于2020-02-21
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
肝了3天,整理了90个Pandas案例
24招加速你的Python,超级实用!
处理数据,大数据甚至更大数据的 17 种策略
利用Python Pandas库从DataFrame中提取最新日期
24式加速你的Python
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券