使用pandas在Python中有条件地对DataFrame进行分组

文章/答案/技术大牛

发布

2回答

、、

我想根据特定列中的值有条件地对我的DataFrame进行分组。以下是我正在使用的数据帧的示例： date id height dd/mm/yyyy 2A 4dd/mm/yyyy 2B 1 我希望能够根据id列值中是否包含"A“或"B”<em

浏览 37提问于2019-06-07得票数 0

回答已采纳

1回答

PySpark:带有标量Pandas的无效returnType

、、

我正在尝试从pandas_udf返回一个特定的结构。它在一个集群上工作，但在另一个集群上失败。我尝试在组上运行udf，这需要返回类型为数据框架。from pyspark.sql.functions import pandas_udfimport numpy as np oneCar.loc[1:, 'Lati

浏览 2提问于2018-03-26得票数 5

回答已采纳

1回答

用另一个聚合行在dataframe中聚合行

、、、

以下是我的代码：data = {"uid": ['1','2','3','','3','','4','5'], "pid":['a','b','a','d','c','e','','

浏览 1提问于2020-08-21得票数 2

回答已采纳

1回答

当列介于两个值之间时，汇总Pandas数据

、

在python中，我有一个Pandas dataframe (df)，可以在下面进行复制。import pandas as pd data = [['2021-09-12', 'item1', 'IL', 5], ['2021-09-12', 'item2', 'CA', 7], ['2021startdate = '2021-08-01'

浏览 1提问于2021-09-21得票数 1

回答已采纳

1回答

如何绘制一个事件在时间序列中的频率？

、、、、

我只使用unixTimestamp。对于处理时间序列数据的更好方法的建议非常受欢迎。此外，这是在170行df上运行的。实际数据大约有10M行。还能有人建议表示数据的最佳方式吗？提前感谢！

浏览 19提问于2018-12-27得票数 1

回答已采纳

1回答

如何根据条件对Pandas DataFrame进行分组？

、、

我想在熊猫DF上使用有条件的groupby。test = pd.DataFrame({'A':range(9), 'B':['this','this','this','that','and','the','other','thing','.']}通过是否'B‘== ' this’分组&#

浏览 0提问于2017-03-20得票数 1

回答已采纳

1回答

根据列中的值，有条件地聚合具有不同函数的分组数据框

、

import pandas as pd "group_id进行分组，然后对每个组应用不同的聚合函数。为了确定使用哪个聚合函数，我想设置一个条件，该条件引用df中的另一个列，即condition。具体地说，我想取"ones"组的val中所有元素

浏览 21提问于2021-01-24得票数 1

回答已采纳

1回答

如何使用DataFrame划分Pandas DataFrame

、

我正在编写一个Python脚本来从我的数码相机中导入图片，并且我正在使用Pandas来帮助对输入的图像进行簿记。我正在苦苦挣扎的是如何使用Pandas来根据一组时间戳对图像进行分组，例如，这些时间戳都是在每小时半小时内完成的。举个例子，假设我有六张照片，其中三张是在九分钟内拍摄的，另外三张也是在九分钟内拍摄的，但一小时后。filename': '

浏览 5提问于2014-11-13得票数 3

回答已采纳

1回答

使用Pandas Dataframe - Python对母子数据进行分组

、、、

我有一个数据框架，我想根据同一数据帧中另一列的值对其进行分组。Parent_ID和子ID是链接的，并在层次树中定义了与谁相关的人。Alfred 111 1917 Armin 234 1019 Katya 109 323 我希望根据下面分组中的ID和Parent_ID对此数据框架进行分组，并根据顶级父级生成CSV文件。也就是说，Alfred.csv，Carmen.csv (将只有

浏览 1提问于2019-04-07得票数 0

回答已采纳

2回答

如何根据Python中的多个条件对单个列进行求和？

、、、

最终目标是根据其他列中的多个条件对"Price“列中的值进行求和。不过，我不知道怎么做。import pandas as pd rnd = pd.DataFrame({'Status':['Accepted', 'Denied', 'AcceptedOrange', 'Blueberry', 'Orange', 'A

浏览 5提问于2021-12-07得票数 0

2回答

使用NaNs对Pandas DataFrame进行分组

、、、、

我有一台DataFrame df1 "id": [1, 1, 2, 2, 3, 3],4 3 NaN 7.0 NaN NaN我的目标是通过id对df1进行</e

浏览 0提问于2021-06-17得票数 0

1回答

pandas按产品分组，而不是sum或count

、、

在python pandas中，我想按列对dataframe进行分组，然后取每个ID的行的乘积。df2 = pd.DataFrame({'X' : ['B', 'B', 'A', 'A'], 'Y' : [1, 2, 3, 4]}) print(df2.groupby(['X']).sum())

浏览 9提问于2017-02-17得票数 5

回答已采纳

1回答

如何在python中按相同的签入日期和签出日期对日期数据进行分组/计数？

、、、

我试图根据相同的签入和签出日期对日期数据进行分组，例如：check_in = ['17/07/2021', '2021'] check_out = ['20/07/2021', '20/07/2021','22/07/2021', '24/07/

浏览 3提问于2022-07-17得票数 0

回答已采纳

1回答

不能在pyspark中使用python* eval()作为pandas udf，但在python udf中使用相同*

、、、、

我是pyspark中的pandas udf的新手，需要帮助为大型数据帧(>1亿行)中的每一行应用udf。我的dataframe中有一列，其中包含使用dataframe中的列的多个条件。对每一行应用条件的最好方法是使用python eval。当在python udf中使用python eval时，它工作得很好，但是运行起来需要很长时间，因为我有几百万行。同样，

浏览 29提问于2021-06-25得票数 0

2回答

熊猫在列间操作上的分组和聚合

、

我是一个R和data.table用户，试图使用更多的Python和pandas，当我想在pandas中执行以下操作时，我感到非常沮丧，因为似乎没有一种简单的方法：在R中，如果我想对</em

浏览 3提问于2022-05-02得票数 1

回答已采纳

1回答

通过for循环获取groupby错误

1,1,2,3,3,3,21,1,1,1,5,5,5,5,3,3,2,6] print(key,':',list(group)) 我已经写了上面的代码来按特定的数字分组并获得一个列表

浏览 18提问于2019-03-09得票数 0

1回答

pandas批处理操作的性能是否等同于SQL？

、

我使用Pandas DataFrame是为了在一个大表中进行搜索，基于一些条件，比如df['start_date' > datetime.now()]等。未对DataFrame进行排序或索引。pandas是否为批处理操作提供了类似的性能，就像使用WHERE子句时的SQL一样？

浏览 1提问于2018-08-14得票数 1

1回答

我想知道普通数组与JuliaDB或DataFrame在对大型数据集(大型但仍然适合内存)上的计算性能是否存在差异？我可以使用简单的数组和算法来进行排序、分组、缩减等等，那么为什么我需要JuliaDB或DataFrame呢？我有点理解Python为什么需要Pandas --因为它将缓慢的python转化为快速C，但是为什么Julia需要JuliaDB或DataFrame -- Julia已经快了。

浏览 0提问于2018-03-26得票数 10

回答已采纳

2回答

对pandas中的日期时间值使用groupby

、

我使用此代码是为了按年份df = pd.read_csv('../input/companies-info-wikipedia-2021/sparql_2021-11-03_22-25-45Z.csv')对数据进行分组 df = pd.read_csv('..foundation'])df = df.groupby('foundati

浏览 81提问于2021-11-09得票数 0

回答已采纳

1回答

如何在dask中有效地使用pandas.cut() (或等效)？

、、

在Dask中是否存在与pandas.cut()等价的内容？到目前为止，我可以用熊猫来做这件事，但我想把它并行运行。所以我试着用达斯克。我找到了一个使用pandas.cut()的解决方案，但它需要调用原始

浏览 4提问于2017-02-24得票数 13

回答已采纳

点击加载更多