腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
任务:从另一个用户
读取
sql
表
、
、
、
我使用
Python
语言中
的
dask
从已建立
的
连接
中
读取
SQL
表
(我使用cx_Oracle、sqlalchemy)。我自己
的
表
是现成
的
,但我不知道如何访问其他用户提供给我
的
表
。在SQL本身
中
,我只会使用other_user.their_table来引用该
表
。但是,使用
dask
import
dask
.datafr
浏览 10
提问于2019-12-20
得票数 0
1
回答
如
何在
python
中
读取
dask
中
的
表
、
index='filename', columns='code', values='frequency') 我在使用pivot时遇到了问题,因为数据集太大,在pivot之后大约有50,000列 人们建议使用
dask
库 所以我将这段代码构建为 import
dask
.dataframe as dd df_features = dd.read_sql_table(table=&
浏览 7
提问于2020-04-10
得票数 0
回答已采纳
1
回答
如何为超过1亿行
的
数据库
表
修复
Dask
内存错误
、
、
我正在用
dask
.dataframe.read_sql_table连接到Oracle数据库,尝试跨越一些较大
的
表
,其中一些
表
有超过1亿行,然后将它们以拼花格式写到s3桶
中
。但是,即使我试图指定
Dask
建议
的
分区数,我仍然会遇到内存错误。我读过一些关于
dask
.distributed
的
文章,但不知道如
何在
dask
.dataframe.read_sql_table中使用它。如果有人对如何使用
da
浏览 2
提问于2019-11-18
得票数 0
回答已采纳
2
回答
从
dask
读取
并行excel工作
表
、
你好,到目前为止,我看到
的
使用
dask
的
所有示例都是使用
dask
read_csv调用
读取
的
文件夹
中
的
多个csv文件。如果我被提供了一个带有多个选项卡
的
xlsx文件,我可以使用
dask
中
的
任何东西来并行地
读取
它们吗? P.S.我用熊猫0.19.2和蟒蛇2.7
浏览 13
提问于2017-06-20
得票数 4
1
回答
Dataframe "ValueError:数据被压缩为snappy,但是我们没有安装它“
、
、
、
python
似乎已经安装--
Dask
返回一个ValueError。朱庇特和工人
的
舵手: - name: EXTRA_CONDA_PACKAGES - name: EXTRA_PIP_PACKAGES容器显示
python
-snappy (通过conda列表)
浏览 0
提问于2018-05-15
得票数 2
回答已采纳
1
回答
如
何在
python
中使用多个输入文件并进行并行处理?
、
、
、
每个文件都有文件名,
如
fileaa、fileab、fileac、filead、.通常我使用read_csv,但是由于内存错误,'read_csv‘不能工作。/file.csv"所以我想尝试一下
python
2.7
中
的
并行处理。
浏览 1
提问于2017-07-09
得票数 0
回答已采纳
1
回答
哪些压缩类型支持
dask
中
的
分块?
传递压缩
的
gzip文件会给出一个错误,即不支持在gzip
中
查找,因此它不能以块
的
形式
读取
。from
dask
.bytes.compression import seekable_files import lzmaffi/lib/
python
3.5/site-packages
浏览 11
提问于2017-02-10
得票数 1
回答已采纳
1
回答
dask
.delayed对象
的
分布与计算
、
、
dask
.delayed对象是否通过
dask
在集群上分发? 另外,它
的
任务图
的
执行也分布在集群上吗?
浏览 1
提问于2018-06-30
得票数 1
1
回答
R与
Python
之间
的
交叉
读取
拼花文件
、
、
我们已经生成了一个拼花文件,一个用
Dask
(
Python
),另一个用R Drill (使用Sergeant数据包)。他们使用不同
的
parquet 实现。我们无法交叉
读取
文件(
python
不能
读取
R文件,反之亦然)。在R环境
中
读取
parquet文件时,我们会收到以下错误:system error: Illegalstatexception: UTF8 can only annotate binary filed。当在
Dask
浏览 3
提问于2017-08-01
得票数 0
回答已采纳
1
回答
通过
读取
Python
的
dask
模块
中
的
pickle文件来创建
dask
数据帧
、
当我尝试通过
读取
pickle文件来创建
dask
数据帧时,我得到了一个错误ds_df = dd.read_pickle("D:\test.pickleAttributeError: 'module' object has no attribute 'read_pickle' 在大熊猫身上,它一
如
既往地成功了所以,如果我在这里或者在
dask</e
浏览 1
提问于2015-12-14
得票数 7
1
回答
Python
任务模块错误..AttributeError:'_io.TextIOWrapper‘对象没有'startswith’属性
、
我正在尝试学习如何使用
dask
模块来克服脚本
中
的
内存问题。当我
读取
csv并从它创建
dask
数据帧时,我得到了以下错误: File "C:\Users\username\AppData\Local\Programs\
Python
\
Python
39\lib\site-packagespath.startswith("file://"): AttributeError: '_io.TextIOWrapper
浏览 271
提问于2021-02-02
得票数 0
2
回答
使用
dask
合并csv文件
、
我是
python
的
新手。我正在使用
dask
读取
5个大
的
(>1 GB) csv文件,并将它们合并(类似SQL)到一个
dask
数据帧
中
。现在,我正在尝试将合并后
的
结果写入单个csv。我在
dask
dataframe上使用compute()将数据收集到单个df
中
,然后调用to_csv。但是,compute()在
读取
所有分区
的
数据时速度很慢。我尝试在
dask
df上
浏览 5
提问于2017-03-23
得票数 4
1
回答
试着将sqlite数据库读入
Dask
数据
、
、
、
、
我试着用
Dask
从kaggle
的
sqlite数据库
中
读取
一张
表
,import
dask
.dataframe as ddf # Read sqlite query res
浏览 1
提问于2022-04-19
得票数 0
回答已采纳
1
回答
从深层S3路径层次结构
中
的
CSV
读取
Dask
DataFrame
、
、
、
、
我正在尝试在
Dask
DataFrame
中
读取
S3
中
的
一组CSV。存储桶具有很深
的
层次结构,并且还包含一些元数据文件。调用看起来像这样 dd.read_csv('s3://mybucket/dataset/*/*/*/*/*/*.csv') 这会导致
Dask
挂起。真正
的
问题是,s3fs.glob在尝试解析具有那么多星星
的
球状图
浏览 22
提问于2019-06-12
得票数 2
回答已采纳
1
回答
如
何在
线程调度程序
中
利用多线程?
、
、
我对
Dask
的
本地线程调度程序感兴趣。此调度程序可以使用多个线程从多维数组
中
“并行”加载数据块。我对I/O界问题感兴趣,所以暂时不考虑计算密集型应用。使用
Dask
的
存储方法从随机数组加载和保存数据
的
一些速度测试似乎证实了这一事实:随着块大小
的
增加,性能下降(据说是因为最小块增加了并行性)。在这个实验
中
,我使用没有物理块
的
hdf5文件:1包含数组中所有数据
的
数据集。 我面临
的
问题有两个: 1
浏览 4
提问于2019-11-02
得票数 2
回答已采纳
2
回答
Python
/
Dask
支持
的
分布式文件系统
、
、
、
、
Dask
支持哪些分布式文件系统?具体来说,您可以从哪个文件系统
中
读取
dask
.dataframe?从
Dask
文档
中
,我可以看到HDFS当然是受支持
的
。是否支持任何其他分布式文件系统,
如
Ceph等?我可以在这里找到一些关于支持其他文件系统
的
想法
的
讨论:,但没有最后
的
结论,只是HDFS比其他选项“更糟糕”。 谢谢你
的
帮助!
浏览 3
提问于2018-05-11
得票数 3
回答已采纳
2
回答
Pandas read_excel仅获取最后一行
、
、
我有一个excel,这是每天生成
的
,可以有多达50k+行。有没有办法只读最后一行(它是列
的
总和)?df=pd.read_excel(filepath,header=1,usecols="O:AC") df=df.tail(1)
浏览 0
提问于2021-06-01
得票数 0
1
回答
如何合并两个带字符串索引
的
dask
数据帧?
、
我正在尝试
读取
sql
表
并在
dask
中
执行合并。这使用
的
是
dask
版本2.8.0。下面是我
的
代码片段: tdf = dd.read_sql_table('comments', conn_url, index_col='author', divisions=list('1234567890, divisions=list('1234567890')) dd.merge(tdf, adf, how=
浏览 19
提问于2021-08-03
得票数 1
回答已采纳
1
回答
使用脚本
中
的
Dask
、
、
可以从
python
脚本运行
dask
吗?from
dask
.distributed import Client
如
所有教程中所述。但是,如果我将这些代码行写在script.py文件
中
并以
python
script.py方式执行它,它会立即崩溃。我发现了另一个选择,那就是使用MPI:from
dask
_mpi import initialize initialize
浏览 0
提问于2019-08-20
得票数 2
1
回答
从
Dask
数据框列创建列表
的
方法
、
、
我想从
Dask
Dataframe列创建一个列表/集合。基本上,我希望使用此列表通过将值与此数据帧
中
的
列进行匹配来过滤另一个数据帧
中
的
行。我可以使用
dask
.bag或多处理来创建列表吗?
浏览 10
提问于2020-12-31
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何在 Python 程序中读取和写入文件
如何在Excel表格中隐藏工资表中的工资?
如何在Excel中设定工作表
如何在 Rust 中读取和写入文件|Linux 中国
利用Python中xlrd模块读取Excel表格
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券