腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
Dask
compute
()
阻塞
,
不
执行
任何
操作
、
import
dask
.bag as dbaccuracies = seeds.map(lambdaseed: train_and_get_accuracy(seed))
compute
()只会无限期地
阻塞
,并且不会占用CPU。我查看了,并尝试打印accuracies.
dask
。
浏览 1
提问于2017-02-03
得票数 1
回答已采纳
2
回答
嵌套的
dask
.
compute
不
阻塞
、
、
、
dask
.
compute
(...)应该是一个
阻塞
调用。然而,当我嵌套了
dask
.
compute
,并且内部的
dask
.
compute
执行
I/O (如
dask
.dataframe.read_parquet)时,内部的and不是
阻塞
的。return tasks results =
dask
.
浏览 11
提问于2017-08-10
得票数 0
1
回答
计算()在
dask
中做什么?
、
我对
dask
并不熟悉,也不知道
dask
中计算()方法到底做了什么?它是一种打印对象的方法吗?我从它的网站上读过文档,不确定我是否理解“具体价值”和“懒惰的达克”这两个术语。--您可以通过调用.
compute
()方法或
dask
.
compute
(.)将
任何
dask
集合转换为具体值函数。这个函数将被
阻塞
,直到计算完成,直接从一个懒惰的
dask
集合到本地内存中的一个具体值。也就是说,当我创建一个
dask
对象并在spyder控
浏览 5
提问于2019-11-05
得票数 0
回答已采纳
1
回答
在应用函数之前,强制
Dask
延迟对象计算所有参数
、
我真的很喜欢使用
Dask
。def inc(x, y):类似这样的东西 if hasattr(x,
compute
): if hasattr(y,
compute
): y = y.<
浏览 0
提问于2017-01-30
得票数 1
1
回答
异步计算
dask
数组块(
Dask
+ FastAPI)
、
、
、
我正在构建一个FastAPI应用程序,该应用程序将为
Dask
的块提供服务。我想把和结合起来。[block_id].
compute
() async def get_root():]
dask
.
浏览 1
提问于2020-03-02
得票数 3
2
回答
如何使用
Dask
正确地迭代for循环?
、
、
import pandas as pd如果我在最后一行添加.
compute
(): df_
dask
["column__{field}".format(field=field)] = df_
dask
["column"
浏览 1
提问于2019-05-03
得票数 0
1
回答
并行SQL查询
、
def loadsql(sql):df3=results[2]df5=results[4]但是,这会导致引发以下错误:然后
浏览 1
提问于2018-09-06
得票数 2
回答已采纳
1
回答
在
dask
.Array任务图中嵌入前/后计算
操作
、
但是,我不想假设最终用户将如何调用
compute
,我希望避免创建自定义的
dask
Array子类或代理对象,因此我试图将
操作
嵌入到数组的底层__
dask
_graph__中。(旁白:请暂时忽略关于在
dask
中使用有状态对象的警告,我知道其中的风险,这个问题只是关于任务图的
操作
)。 请考虑下面的类,该类模拟必须处于打开状态的文件读取器才能读取块,否则就会出现分段错误。__
dask
_keys__()
不
包含我的键(而且,我也希望避免子类化或要求最终用户使用特殊
浏览 7
提问于2021-11-14
得票数 1
回答已采纳
2
回答
我正在使用
dask
数据文件读取相当大的csv文件。我想从df中提取一些特定的列,对此有什么方法吗?
、
、
、
我想对这个数据
执行
一个
操作
,就是选择一些包含特定数据的列。我想得到df中的所有I。
浏览 2
提问于2022-05-09
得票数 0
1
回答
Dask
多客户端
、
、
、
例如,我是否可以让多个线程与每个线程运行一个客户端,以便当一个线程
阻塞
时,其他线程可以继续运行?在这种情况下,每个客户端都有不相互依赖的任务图。作为一个跟进问题,如果有可能的话,我怎样才能指定在哪里
执行
某项特定的任务?当我
执行
dd.read_csv时,然后调用计算,如何知道哪个客户端及其相关的调度程序/工作人员正在
执行
此
操作
?
浏览 3
提问于2020-05-31
得票数 1
回答已采纳
1
回答
Dask
compute
(捕获错误),但将结果保留在工作进程上
、
、
我想定义一组
操作
并在
dask
worker上运行它们,并捕获
任何
可能出现的错误,而不必调用
compute
并将结果带给客户端。例如,如果我在object列上
执行
了一个类型(Int),这应该会给我一个错误。当我使用client.persist时,这不会返回错误。column = df['string column'].astype(int)但是,client.
compute
确实抛出了这个错误: column =df[
浏览 15
提问于2020-05-30
得票数 0
回答已采纳
1
回答
如何将
dask
.Series中的
dask
.Dataframe乘以行数?
、
、
normalised = data.mul(alpha, axis=1) 在上面的代码片段中,data是一个
dask
.Dataframe,alpha是一个
dask
.Series。
Dask
在
执行
此乘法时会引发ValueError: Unable to mul dd.Series with axis=1错误。如果我计算alpha (例如alpha.
compute
() ),这个
操作
就行了,但是因为alpha是一个大任务,所以我想避免在代码的这个阶段调用
compute
。有没有人
浏览 1
提问于2020-01-09
得票数 0
1
回答
加载多个csv文件后在
dask
中运行
操作
时出现问题
、
、
、
我正在尝试使用
dask
来处理一些ML项目中的大型数据集。将单独的CSV文件加载到
dask
数据帧中工作正常。当我尝试使用多个CSV文件时,
任何
类似“计算”的
操作
都会导致程序无限期挂起。这运行得很好 import
dask
.dataframe as ddimport
dask
shape.
compute
() 输
浏览 11
提问于2019-12-12
得票数 0
1
回答
python中的嵌套
dask
工作流?
、
、
、
我有一个简单的
dask
工作流。at 0x7f1dc5ded730>, }但是,不一定要按顺序
执行
for循环。这可以并行进行。 所以问题是:我该如何处理这件事?我是否应该将for循环转换为工作流,然后在b_func中调用
dask
?基本上,我可以嵌套<em
浏览 0
提问于2018-12-06
得票数 1
回答已采纳
0
回答
通过
dask
使用函数和大的中间体来增加内存
、
、
、
我有一个关于
dask
.
compute
()的一般性问题,这个问题是由我在使用该函数时遇到的内存积累引起的。我使用
dask
.
compute
()和map_partitions() (已经尝试过使用
dask
.distributed和
dask
.multiprocessing (后者使用pool=ThreadPool和pool=multiprocessing.pool))来应用一个函数,该函数对
dask
数据帧的块
执行
一系列
操作
。这让我想知道<em
浏览 5
提问于2018-07-19
得票数 1
1
回答
是否可以使用
dask
.
compute
将
dask
.DataFrame.categorize与另一个
dask
计算结合起来?
、
、
我正在尝试避免重复使用
dask
.
compute
(list_of_
dask
_computations)进行
dask
计算。在我的代码中,我必须在
dask
dataframe中创建一些分类列,并调用
dask
.DataFrame.categorize来使类别成为已知的。但我希望与
dask
.
compute
(list_of_
dask
_computations)提供的其他列上的其他计算同时
执行
该调用。但我不知道该怎么做。mean(
浏览 12
提问于2020-04-15
得票数 0
1
回答
如何使用
Dask
对一个大文本文件进行排序?
我知道如何手工
操作
: 您可以
执行
,这将花费大约30分钟并生成一个20 GB的文件。, sep = ',', header = None).set_index(0) df = ddf.
compute
().sort_values(): f
浏览 2
提问于2020-05-22
得票数 2
回答已采纳
1
回答
Dask
延迟与xarray -计算()结果仍然延迟。
、
、
我尝试使用
Dask
和xarray对两个数据集
执行
一些分析(例如avg),然后计算两个结果之间的差异。return x-y p2 = "/path/to/second/multi-file/dataset" b =
dask
.delaye
浏览 14
提问于2022-05-10
得票数 1
3
回答
如果jupyter笔记本已经准备好了,但
Dask
仪表板仍然显示它正在运行一些任务,我能
执行
我的下一个单元吗?
、
、
、
、
我是
Dask
的新手。我把它和一个xarray数据集一起使用。我将数据集保存在内存中,jupyter单元显示它已经就绪(不再有星号)。但是
dask
仪表板正忙着
执行
任务。我不明白。当这种情况发生时,我应该等到
dask
仪表板稳定下来,还是可以自由运行下一个单元?
浏览 6
提问于2022-02-07
得票数 0
1
回答
如何获取
dask
序列结构中的值?
、
、
、
我将excel表格中的数据(列= 'date‘,'a’,'b‘,'c’)传递给dd.read_csv(),它读取数据并
执行
一些
操作
,从而得到一个
dask
序列结构
Dask
Series StructureName: c, dtype: float64 我知道
dask
的一个.
compute
()函数,但我不想使用它,因为它需要花费很多时间。
浏览 25
提问于2020-08-29
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券