腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用
apply
函数
在
Dask
中
添加
两
列
、
、
我有一个
Dask
函数
,可以将
列
添加
到现有的
Dask
dataframe
中
,它可以很好地工作: df = pd.DataFrame({ 'weight': [150, 126, 133, 164, 203] df_
dask
= dd.from_pandas(df, npartitions=2)s = ""&
浏览 50
提问于2021-10-21
得票数 1
回答已采纳
2
回答
使用
lambda
函数
添加
列
时
使用
map_partitions元
、
、
、
、
我正在
使用
Dask
应用一个
函数
myfunc,该
函数
将new_col_1和new_col_2
两
个新
列
添加
到dataframe data
中
。该
函数
使用
两
列
a1和a2来计算新
列
。ddata[['new_col_1', 'new_col_2']] = ddata.map_partitions( lambda df: df.
a
浏览 18
提问于2022-01-24
得票数 -1
回答已采纳
1
回答
KeyError:当尝试选择
dask
数据框上的
列
时:“没有[索引([‘’,''],dtype='object')]
在
[
列
]
中
”
、
我正在
使用
from_pandas()
函数
从熊猫数据帧创建一个
dask
数据帧。当我尝试
使用
方括号[ ]从
dask
dataframe中选择
两
列
时,我得到了一个KeyError。根据
dask
文档,
dask
dataframe支持像pandas dataframe一样的方括号
列
选择。']].
apply
(
浏览 67
提问于2019-10-04
得票数 1
1
回答
Pandas-
Dask
DataFrame
Apply
函数
,返回列表
、
、
、
我正在尝试向
dask
数据帧
添加
多个
列
,以存储
apply
函数
的结果。这将是我关于堆栈溢出的第一个问题,我希望这个问题不会太长!ddf = dd.from_pandas(weather,npartitions=nCores) ddf['NewCol1'] = ddf.map_partitions(lambda df: df.
apply
,然后将
函数
'dfFunc’应用到数据帧的每一行。我的困惑在于,如果我希望我的
函数
返回一个列表
浏览 5
提问于2018-10-11
得票数 1
1
回答
dask
.DataFrame.
apply
与变长数据
、
我想将一个
函数
应用到一个
dask
.DataFrame,它返回一系列可变长度。关于这一点,我有
两
个问题: 如果元数据推理失败,如果事先不知道
列
数,我如何提供元数据?背景/ usecase:
在
我的dataframe
中
,每一行代表一个模拟跟踪。我要应用的
函数
从其中提取特定事件的时间点。因为我不知道每个路径的事件数,所以我不知道最终的dataf
浏览 3
提问于2016-12-13
得票数 2
回答已采纳
2
回答
将元组的
列
拆分为
两
列
、
、
、
、
我正在
使用
python2.7和
dask
table[col] = table.
apply
(lambda x: (x[col1],x[col2]), axis = 1, meta = pd.Dataframe) table[[col1,col2]] = table[col].
apply
(pd.Series)
浏览 7
提问于2017-11-19
得票数 4
回答已采纳
1
回答
如何操作
Dask
的group by返回的组?
value category1 20 B3 40 B 我想
添加
一个mean
列
,其中包含每个类别的值的平均值。
中
做同样的事情?我不能按原样
使用
pandas
函数
,因为你不能在
Dask
中
枚举groupby对象。我可以
使用
apply
函数
来计算
Dask
中
的平均值。import
dask</em
浏览 15
提问于2019-10-18
得票数 0
回答已采纳
1
回答
dask
=parallelized和
dask
=allowed
在
xarray的
apply
_ufunc中有什么区别?
、
、
、
、
在
函数
的
apply
_ufunc
中
,它说: 对于大多数已由
dask
包装的NumPy
函数
,通常最好
使用
预先存在的
dask
.array
函
浏览 0
提问于2018-08-07
得票数 5
回答已采纳
1
回答
在
dataframe上进行
Dask
计算以
添加
列
返回AttributeError
、
、
、
、
我有一个
函数
,它
使用
函数
将
列
添加
到DataFrame
中
,例如 resp_data = {'status': '1', 'data': x}return json.dumps(resp_data)import
dask
.dataframe as dd
浏览 2
提问于2022-01-27
得票数 1
回答已采纳
1
回答
尝试将数据分组并将其写入文件
、
我想知道是否有人知道根据
Dask
中
的
列
的值写出一组文件的正确方法。换句话说,如果我想根据
列
中
的值对一组
列
进行分组,并将它们写到CSV
中
。我一直
在
尝试对
Dask
使用
groupby-
apply
范例,但问题是它不返回
dask
.dataframe对象,所以我应用它的
函数
使用
Pandas API。 有没有更好的方法来实现我想要做的事情?
浏览 12
提问于2021-09-21
得票数 1
回答已采纳
1
回答
Dask
中
的基本groupby操作
、
、
我正在尝试
使用
Dask
来处理一个大文件(50 gb)。通常,我会将其加载到内存
中
并
使用
Pandas。我想按
两
列
"A“和"B”分组,每当"C“
列
以一个值开头时,我想为那个特定的组重复该
列
中
的值。
在
熊猫
中
,我会做以下事情: df['C'] = df.groupby(['A','B'])['C']
浏览 7
提问于2016-08-12
得票数 3
1
回答
为什么达克要填写"foo“和”1“
、
、
project/*.csv", blocksize=25e6,然后我坚持
使用
Dataframe (它
使用
7.33GB内存):我设置了一个新的索引,因为我希望我的组
在
该字段上尽可能高效: df = df.set_index('column_a为了测试我的组的运行速度,我尝试了一个定制的应用
函数
,它只打印
浏览 0
提问于2019-02-08
得票数 4
回答已采纳
1
回答
将一
列
随机数
添加
到
dask
数据帧的正确方法
、
、
、
、
将一
列
随机数
添加
到
dask
数据帧的正确方法是什么?显然,我可以
使用
map_partitions将
列
添加
到每个分区,但我不确定当
dask
并行化该计算时,如何处理随机状态。(即,它是否会在所有工作进程中
使用
相同的随机状态,从而在每个工作进程中生成相同的随机数?)
在
dask
.array.random ()
中
似乎有相关的
函数
,但我找不到一个示例来说明如何将这些
函数
与<em
浏览 2
提问于2021-02-09
得票数 1
1
回答
无法
在
dask
worker中加载模块
、
、
在
我的主文件
中
,我定义了一些
函数
,并将它们应用于Dataframe,如下所示dataframe = transformation2,并通过
使用
apply
向其
添加
一个新
列
,如下所示: dataframe['new_column'] = dataframe.
apply
在
浏览 5
提问于2017-06-24
得票数 2
3
回答
在
dask
DF
中
跨多个
列
展开类似列表的
列
、
、
这与前面关于如何跨多个
列
扩展基于列表的
列
的问题类似,但我看到的解决方案似乎不适用于
Dask
。请注意,我正在
使用
的真正的DFs太大,无法保存在内存
中
,因此不能首先转换为pandas。我有一个包含列表的df with
列
: df = pd.DataFrame({'a': [np.random.randint(100, size=4) for _ in range(20)]})
dask
_df=
dask
_df['a']
浏览 27
提问于2021-09-29
得票数 3
回答已采纳
2
回答
Dask
DataFrame:对具有多行的groupby对象进行重采样
、
、
、
、
我从Castra创建了以下
dask
dataframe:2015-08-08 08:10:00 2353 2015-08-08 08:10:00 e 并得到以下错误: TypeError: Only
浏览 6
提问于2015-11-26
得票数 5
回答已采纳
1
回答
将图像加载到
Dask
Dataframe
中
、
、
、
我有一个dataframe,它包含
列
中
的图像路径(称为img_paths)。
在
接下来的步骤
中
,我想要做的是
使用
这些图像路径将图像加载到另一
列
(称为img_loaded)
中
,然后应用一些预处理功能。但是,
在
加载(或,图像读取)过程
中
,我总是得到不同的结果,包括对imread
函数
的一个时间延迟包装,另一个时间正确加载图像(我可以看到数组)和其余时间:FileNotFoundError。除了下面的例子之外,我还
使用
浏览 0
提问于2019-06-16
得票数 1
回答已采纳
1
回答
如何在
Dask
DataFrame
中
按
列
分组并作为一个列表列出另一
列
?
、
、
我有一个
Dask
DataFrame,我想从其中按
列
分组,并将agg作为其他
列
的列表。
浏览 15
提问于2019-06-06
得票数 0
2
回答
如何
使用
Dask
正确地迭代for循环?
、
、
当我
使用
dask
和pandas运行像这样的循环时(见下文),只有列表
中
的最后一个字段会被求值。这大概是因为“懒惰评估”。field in fields:如果我
在
最后一行
浏览 1
提问于2019-05-03
得票数 0
1
回答
当与
dask
dataframe groupby一起
使用
时,`.iloc()`返回奇怪的结果
、
、
、
我有一个包含3
列
的大型数据集:0 103896 1 2.02 103896 1 5.04 103896 1 7.0我需要
使用
groupby-
apply
。::-1].cumsum() == 0) return x.eq(0).sum()/((x.eq(0)&x.shift().ne(0))
浏览 15
提问于2019-11-23
得票数 0
回答已采纳
点击加载更多
相关
资讯
Microsoft在Excel中添加对JavaScript函数的支持
Python数据预处理:使用Dask和Numba并行化加速
python yield在函数中起返回值中的使用
将 Excel 中的数字和文本分成两列,必须弄懂 lookup 函数的查找原理
在视频中怎么添加配乐?两种办法教你解决
热门
标签
更多标签
云服务器
ICP备案
云直播
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券