腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
在
pandas
DataFrame
中
使用
索引
进行
分组
和
聚合
、
我想
聚合
单个列的
DataFrame
并计算元素的数量。然而,我总是得到一个空的
DataFrame
:Empty
DataFrame
Index: [1, 2, 3, 4, 5]pd.
DataFrame
({"A":[1, 2
浏览 13
提问于2020-05-22
得票数 0
1
回答
Pandas
.
DataFrame
.GroupBy.agg,
聚合
函数
中
需要的独立列。如何让它进入agg?
、
、
我有一个带有两级MultiIndex的
Pandas
DataFrame
对象。此外,它显然包含许多额外的列(例如'A','B','C','D','E')。我想对
DataFrame
中
的单个多
索引
执行一些
聚合
函数,这些
索引
来自可用列的子集(例如,'C','D','E')
中
的每个单独列。为此,我只选择了
浏览 4
提问于2020-04-29
得票数 0
1
回答
用另一个
聚合
行在
dataframe
中
聚合
行
、
、
、
以下是我的代码:data = {"uid": ['1','2','3','','3','','4','5'], "pid":['a','b','a','d','c','e','','
浏览 1
提问于2020-08-21
得票数 2
回答已采纳
2
回答
以数据帧的形式返回
聚合
值
、
我有一个按两列
分组
的
pandas
DataFrame
和
一个自定义函数,该函数从每个
分组
的行集计算值的元组。我正在尝试收集数据帧
中
的结果,并
使用
原始的组
索引
进行
索引
。当我
使用
apply()时,我得到了一个带有正确
索引
的Series,但是值是以元组的形式出现的。我应该如何编写我的函数,以使结果成为数据帧,并按每个组的标签
进行
索引
?这是一个基于本教程<
浏览 1
提问于2017-02-27
得票数 0
回答已采纳
1
回答
熊猫群返回多
索引
和
另外两个集合
、
如果按一个列
分组
,并
使用
as_index=False,这种行为
在
熊猫身上是可以预料的。但是,当我
使用
.agg时,as_index似乎不再像预期的那样运行。简而言之,这似乎并不重要。# importsimport numpy as np np.random.seed(834) summary aletter
浏览 2
提问于2020-10-11
得票数 0
回答已采纳
1
回答
每组只有一列()
、
我有一个
Pandas
数据框架,并试图根据许多列来总结这些数据。下面的代码就是我想要的。ndf2.columns此外,行的
索引
显示,这不是我所希望的。
浏览 0
提问于2014-10-01
得票数 1
回答已采纳
2
回答
熊猫合并在
聚合
栏上
、
假设我创建了一个
DataFrame
:df = pd.
DataFrame
({"a": [1,2,3,13,15], "b": [4,5,6,6,6], "c":然后按几个列
进行
分组
和
聚合
..。gb合并,以便在df
中
创建一个新列,其中包含来自gb的相应值?2我试着做了最简单的事情: df.merge(gb, o
浏览 5
提问于2015-02-05
得票数 2
回答已采纳
1
回答
如何在复制或群居熊猫
DataFrame
时保持主要秩序?
、
、
、
、
我怎样才能有序地
使用
或操作(猴子补丁)熊猫,以便在结果对象上始终保持相同的主要顺序,以便
进行
复制
和
群聚?我
使用
pandas
.
DataFrame
作为业务应用程序
中
的数据结构(风险模型),需要快速
聚合
多维数据。熊猫的
聚合
在很大程度上取决于
在
底层的numpy数组上
使用
的主要订购方案。其影响是:案例2: 5分46秒
在
包含45023行
和
100000
浏览 4
提问于2019-05-23
得票数 1
回答已采纳
3
回答
使用
Python Panda
聚合
操作
、
500 利用熊猫,如何对酒店
进行
分组
,计算每家酒店收入的min、中位数
和
最大。
浏览 6
提问于2022-12-04
得票数 0
3
回答
Pandas
: df.groupby()对于大数据集来说太慢了。有什么替代方法吗?
、
、
、
我有一个有380万行
和
一列的
pandas
.
DataFrame
,我尝试按
索引
对它们
进行
分组
。df = df.groupby(df.index).sum()<class '
pandas
.core.frame.
DataFrame
&
浏览 1
提问于2017-06-23
得票数 15
1
回答
如何在
聚合
后将
pandas
数据帧转换为单
索引
?
、
、
我一直
在
玩
pandas
数据帧
中
的
聚合
。','e'], 'c':[4,1,3,4,5,1,3,2]}) 我必须对batch列
进行
聚合
,对列a
使用
mean,对列c
使用
min。我
使用
以下方法
进行
聚合
: agg_dict = {'a':{'a':'mean'},
浏览 21
提问于2020-09-05
得票数 0
回答已采纳
2
回答
使用
Pandas
将行数据组转换为列
、
、
我
使用
Pandas
(
在
Python
中
)从CSV
中
读取数据。
中
,其中每个唯一的
分组
都在一个行
中
,其中当前列
在
列1
中
的属性作为列名。
pandas
.pivot_table,也只是用我想要的列创建了一个空的
dataframe
,但是对于这两种方法,无论是
索引
还是
聚合
,我都遇到了困难。我认为这是因为我没有按任何一个属性
分组
,也没有试图<e
浏览 1
提问于2016-04-25
得票数 1
回答已采纳
1
回答
PySpark:带有标量
Pandas
的无效returnType
、
、
我正在尝试从
pandas
_udf返回一个特定的结构。它在一个集群上工作,但在另一个集群上失败。我尝试
在
组上运行udf,这需要返回类型为数据框架。from pyspark.sql.functions import
pandas
_udfimport numpy as np oneCar.loc[1:, 'Lati
浏览 2
提问于2018-03-26
得票数 5
回答已采纳
1
回答
根据列
中
的值,有条件地
聚合
具有不同函数的
分组
数据框
、
import
pandas
as pd "group_id,方法是对group_id
进行
分组
,然后对每个组应用不同的
聚合
函数。为了确定
使用
哪个
聚合
函数,我想设置一个条件,该条件引用df
中
的另一个列,即condition。 具体地说,我想取"ones"组的val中
浏览 21
提问于2021-01-24
得票数 1
回答已采纳
2
回答
用PySpark
进行
组
索引
、
、
但我在这两点上有困难: 我
在
文件里没有发现任何好的东西。如果你有提示的话,我会非常感激的!
浏览 9
提问于2022-10-04
得票数 0
回答已采纳
1
回答
如何根据一列将其他列
中
的连续值
分组
为范围
、
我有以下数据:我想从
dataframe
获得以下输出
在
熊猫
中
,是否还有其他基于“A”列的“B”、“
索引
”
使用
聚合
函数( pivot_table )对其
进行
分组
。
浏览 1
提问于2019-11-08
得票数 0
回答已采纳
1
回答
Pandas
"Group By“查询HDFStore
中
的大数据?
、
、
在
一个超过60列的HDFStore
中
,我有大约700万行。数据太多了,我放不进内存。我希望根据列"A“的值将数据
聚合
到组
中
。
pandas
的文档假设我已经将所有数据放在一个
DataFrame
中
,但是我不能将整个存储读取到内存
中
的
DataFrame
中
。
在
HDFStore
中
对数据
进行
分组
的正确方法是什么
浏览 2
提问于2013-04-04
得票数 21
回答已采纳
1
回答
更改DataType的GroupBy方法
、
使用
Python3
和
Anaconda,我
在
ipython上导入了
pandas
和
os。我有一个非常大的csv文件。在对文件
使用
read_csv之后,我尝试对两列
使用
.groupby(),但它将数据类型从
DataFrame
更改为DataFrameGroupBy,并且我不能再对其运行数据框方法。import os
浏览 19
提问于2019-06-21
得票数 0
回答已采纳
3
回答
NaN -基于列对行
进行
分组
,并将
Pandas
替换为非空值
、
、
我正在尝试基于目标"group-by“列
在
我的
dataframe
上
使用
字符串创建一些
聚合
。假设我有以下包含4列的数据帧:我希望根据列"Col1“对所有行
进行
分组
,
在
NaN的情况下,
使用
非null的值
进行
分组
。期望的输出如下所示:我也试着
使用
一个普通的:from tabulate import ta
浏览 23
提问于2020-02-11
得票数 2
回答已采纳
1
回答
如何
使用
groupby完成此操作?
、
、
我
在
试着比较
pandas
.
DataFrame
.pivot_table()
和
pandas
.
DataFrame
.groupby。/tests/data/tips.csv' 现在,我只想
聚合
tip_pct
和
大小,并另外按天
分组
。我会把smoker放在表列
中
,把day放在行
中
。通过
使用
pivot_t
浏览 1
提问于2017-03-05
得票数 3
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
11,二维dataframe——类SQL操作
在Pandas中通过时间频率来汇总数据的三种常用方法
每天读一本:利用Python进行数据分析
像写SQL一样用Pandas
Python 数据分析之NumPy与pandas 的功用
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券