向量化/优化行上的滚动pandas计算

、、、

df.at[row_num,'sum'] = previous_sum - src2 + src1 1 -2.0 1 63 -2.0 5 4 4 -2.0 1 1 问题是在一个有很多行的大型数据帧上我想优化它，如果可能的话，以某种方式利用一些内置的panda

浏览 26提问于2019-02-06得票数 0

回答已采纳

2回答

熊猫展宽/滚动窗口的p值相关计算

、、、、

假设我有一个DataFrame，在此上我要计算两列之间的滚动或扩展Pearson相关性。(10000), 'y': np.random.rand(10000)})expanding_corr = df['x'].expanding(50).corr(df['y']) rolling_corr = df['x'].rolling(50).corr(

浏览 0提问于2019-06-24得票数 15

回答已采纳

1回答

优化Pandas应用函数

、、、、

我有两个Pandas DataFrames： pd.Timestamp('2022-01-08')然后，将另一列添加到第一个DataFrame中，通过以下应用程序计算days_ago'] = d

浏览 3提问于2022-04-24得票数 -2

1回答

提高大熊猫群的性能

、

当我编写它时，我最初在Pandas DataFrames上进行了数据处理，但是当这导致了糟糕的性能时，我最终用普通的Python重写了它，使用的是for循环，而不是矢量化的操作，列表和切分，而不是DataFrames由于我的手工编码的数据处理代码比原来的Pandas代码要大得多，而且更加混乱，所以我还没有完全放弃使用Pandas，而且我目前正在尝试优化Pandas

浏览 1提问于2017-11-20得票数 37

回答已采纳

1回答

将向量传递给Pandas* rolling_mean()的窗口参数*

、

我想计算时间序列的滚动平均值，但使用不同窗口大小的列表。实际上，我可以使用for循环来实现这一点，如下所示： for i in vals: print (m)其

浏览 3提问于2015-08-18得票数 0

2回答

Python数据框架中的滚动和累积标准差

、、、

是否有一个矢量化操作来计算Python DataFrame的累积和滚动标准差(SD)？例如，我想添加一个列'c‘，它根据列'a’计算累积SD，即在索引0中，它显示由于1个数据点而导致的NaN，在索引1中，它基于2个数据点计算SD，依此类推。i

浏览 59提问于2017-07-03得票数 5

3回答

优化python/numpy中的矩阵写入

、、、、

我目前正试图优化一段代码，其要点是，我们遍历并计算一组值，并将它们写入矩阵。计算的顺序并不重要：mat.fill(MAX_VAL) for j in xrange(最后一行)上。我想知道做这种计算来优化写的最佳方法是什么。我应该写到中间缓冲区并在整行复制等等。我对性能调优或numpy内嵌有点无知。编辑: doACa

浏览 1提问于2013-12-26得票数 1

回答已采纳

3回答

如何对大熊猫每一组进行有效的操作

、、、

所以我有这样的数据框架--import numpy as np k = [0.1, 0.5, 1] d['new_delay'] = pd.Series([0,0]).append(d1 22 22.02 1 44 57.7 3 2 33 33.

浏览 2提问于2021-09-27得票数 1

回答已采纳

1回答

快速计算大量贷款的贷款利率

、

我有一个大数据集(大约200k行)，其中每行都是一个贷款。我有贷款金额，还款次数和贷款付款。我在试着得到贷款利率。R没有计算这个值的函数(至少base R没有，我找不到它)。因为uniroot不是矢量化的，并且rep花费了大量的时间，你最终会得到一个很慢的计算。如果你做一些数学计算，并计算出你正在寻找以下方程的根，你可以使它更快 zerome <- function(r) amt/p

浏览 2提问于2012-12-14得票数 4

回答已采纳

1回答

有没有一种方法可以对当前迭代Pandas数据帧中的行的代码进行矢量化？

、、、

我正在尝试将Pandas数据帧中每一行的加权平方和相加。我想对操作进行矢量化--看起来运行起来要快得多--但是代码中有一个小问题，使我的矢量化尝试失败了。pU.iterrows(): totalDist += (row['distance'][row['schoolChoice']]**2.0*float(row['students'])) 行有'students‘(一个整数)、distanc

浏览 18提问于2021-03-22得票数 2

回答已采纳

1回答

Pandas序列识别连续辅音的个数

、、、

给定一个字符串的Series，我试图计算一个新的Series，它包含原始字符串中最高的连续辅音计数，忽略空格。gerald lambeau 24 mike krzyzewski 5 在pandas'[^aeiou ]+', s)) Out[3]: 5

浏览 11提问于2019-08-27得票数 0

2回答

迭代熊猫系列/列的最快方法

、、、

我一直在寻找迭代、iter.等例子，但想知道是否有更快的方法。我现在的情况是names = df['name'].tolist() i = i.replace(' ','_') newnames.append不太熟悉熊猫的最佳做法，所以我欢迎所有反馈。谢谢

浏览 4提问于2021-06-30得票数 0

回答已采纳

1回答

Pandas使用apply()生成特征向量

、、

我有一个具有两个特性的数据集: class (int)和content (text)。{'email':1, 'phone':0, 'curses':1,....}现在我的代码是： vectorized = data[['content', 'clas

浏览 0提问于2015-07-26得票数 0

1回答

Spark中的用户定义函数(UDF)是否在集群工作节点上并行运行？

、

registerTempTable("test") %sql select id, squaredWithPython(id) as id_squared from test 那么，如果数据分布在工作节点的内存上，squaredWithPython函数是否会在群集的工作节点上运行？如果是，那么矢量化UDF的用途是什么？UDF和vectorized UDF的区别是什么？同样，在DataFrames中使用UDF也是如此。

浏览 33提问于2019-10-10得票数 0

回答已采纳

1回答

顶点着色后的OpenGL三角形退化？

、、、

指的是我现在的想法:做整个量化在顶点-阴影(所有的顶点-数据存在计算和动态LOD切换)。三角形退化应在顶点处理步骤后自动发生。Drawcall(numberOfAllIndices) ->并不真的比

浏览 0提问于2016-05-06得票数 0

1回答

Pandas:计算可变行数上的滚动均值(移动平均值)

、、、、

假设我有以下数据df = pd.DataFrame({ 'distance':[2.0, 3.0, 1.0, 4.0],2.0 10.02 1.0 5.0我如何计算速度列的平均速度与滚动和的距离列使用上面的例子，在最后的N行上创建一个

浏览 3提问于2017-11-24得票数 5

回答已采纳

1回答

用于街道地址的字符串拆分

、、、

York, NY 10016我需要解析和存储部件如下：我试图从regex中分离出来，但速度太慢了，所以我采用了传统的方法except ValueError as e: print(e)df['STREET'],df['CITY'], df['STATE'],

浏览 0提问于2017-09-04得票数 6

回答已采纳

1回答

两个numpy数组之间的排序和索引

、、

0.2,0.1,0.8,0.4],[0.4,0.2,0.5,0.1],[0.4,0.2,0.5,0.1]])我想要做的是获得y1的位置，而不是y2。更清楚的是：y1是标签数据，y2是预测数据，我想知道与实际数据相比，该算法在哪个位置上进行了预测。我所做的工作如下：indexes2 = []sorted_values = np.argsort(-y2)

浏览 3提问于2017-01-20得票数 1

回答已采纳

2回答

如何在pandas中使用向量化而不是for循环

、、、、

我正在尝试为我的工作建立一个机器学习算法。我用于训练和测试的数据有17k行和20列。我试着在另外两个列的基础上添加一个新列，但是我编写的for循环太慢了(需要3秒才能执行) for i in range(0, len(model_olculeri)): model_olculeri["Waist to Hip Ratio&

浏览 59提问于2021-10-25得票数 0

回答已采纳

1回答

我能把矢量化函数应用于熊猫数据吗？

、、、、

我对pandas和numpy非常陌生，我正试图找出最好的方法来做一些事情。我的猜测是，在第一种情况下，numpy使用的是矢量化函数，而不是第二种情况。有办法让pandas使用这种优化吗？基本上，在伪代码中，我认为apply正在做类似于for

浏览 3提问于2016-10-22得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

熊猫展宽/滚动窗口的p值相关计算

优化Pandas应用函数

提高大熊猫群的性能

将向量传递给Pandas* rolling_mean()的窗口参数*

Python数据框架中的滚动和累积标准差

优化python/numpy中的矩阵写入

如何对大熊猫每一组进行有效的操作

快速计算大量贷款的贷款利率

有没有一种方法可以对当前迭代Pandas数据帧中的行的代码进行矢量化？

Pandas序列识别连续辅音的个数

迭代熊猫系列/列的最快方法

Pandas使用apply()生成特征向量

Spark中的用户定义函数(UDF)是否在集群工作节点上并行运行？

顶点着色后的OpenGL三角形退化？

Pandas:计算可变行数上的滚动均值(移动平均值)

用于街道地址的字符串拆分

两个numpy数组之间的排序和索引

如何在pandas中使用向量化而不是for循环

我能把矢量化函数应用于熊猫数据吗？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐