腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(4072)
视频
沙龙
2
回答
pandas
:
groupby
和
aggregate
,
不会
丢失
已
分组
的
列
、
、
、
对于每个Id,我可以有多个名称
和
子Id。A 5933276956 C 5935我希望压缩数据帧,使每个id只有一行,并且每个id下
的
所有名称
和
,然后聚合所有其他
列
。df.
groupby
('Id').agg(lambda x: set(x)) 但是在这样做
的
时候,得到
的
数据帧没有Id
列
。当您执行
groupby
时,
浏览 4
提问于2016-09-12
得票数 24
回答已采纳
3
回答
Python:如何仅在
Pandas
中完全相似的情况下才合并重复行?
、
、
、
我有一个包含
列
Items
和
Ranges
的
数据帧。Items Ranges1 A 303 B 20 我想合并重复
的
行并添加范围值,但只针对完全相同
的
行生成
的
数据帧应如下所示: RangesA 60B 20 我尝试了df2 = df1.
groupby
([&
浏览 19
提问于2021-04-05
得票数 1
回答已采纳
1
回答
pandas
groupby
aggregate
用于具有项目列表
的
列
,返回string
和
not list
、
、
、
考虑以下数据帧: sample_DF.tsv 我想按这个数据帧
分组
,所以我应用了以下逻辑: df = pd.read_csv('sample_DF.tsv',sep='\t') df.
groupby
('col3',as_index=False).
aggregate
(lambda x:list(x)).reset_index(drop=True) 但是输出
不会
作为
列
4
和
列
5
的
列表
的</e
浏览 11
提问于2019-09-24
得票数 0
回答已采纳
1
回答
熊猫:将数组求和为具有多个组比
列
的
聚合
、
、
我正在使用Python3.5.1
和
Pandas
0.18.0。
pandas
.core.base.DataError: No numeric type
浏览 3
提问于2016-10-03
得票数 3
回答已采纳
1
回答
dataframe.
groupby
.agg TypeError:_agg_2dim()接受1个位置参数,但给出了2个
、
、
、
我正在尝试按部门
分组
,并将具有相应经度
和
纬度
的
列
保留到部门内人口最多
的
城市。你知道为什么这不管用吗?popDEP = pop.copy().
groupby
("dep", as_index=False)[["dep","lon","lat","total"]].agg({'total': ['max']/core/
group
浏览 0
提问于2021-04-01
得票数 0
1
回答
熊猫-多栏群
、
我试图按多个
列
进行
分组
,并将它们聚合,使它们在
分组
后成为一个列表。(lambda x: list(x)) /usr/local/lib/python2.7/dist-packages/<
浏览 0
提问于2015-11-13
得票数 3
回答已采纳
1
回答
熊猫数据帧
分组
失去
分组
功能
、
我有一只熊猫数据(glob_df),我试图按lga_abbreviated_name字段
分组
如下:lga_abbreviated_name objectcounts int64dtype: object >>> dg=glob_df.
groupby
('lga_abbreviated_name').
aggregate
({'cou
浏览 3
提问于2022-11-07
得票数 0
回答已采纳
4
回答
在熊猫中无法通过DataFrame在组上执行平均聚集
、
、
我下面有数据集我想在“马力”栏上进行平均操作,然后用熊猫对“圆柱体”
和
“模型年”进行
分组
。我在jupyter笔记本上运行代码。下面是我
的
代码:df.
groupby
(['cylinders','model year']).agg({'horsepower':'mean'}) 基本上,我执行第一组
的
列
‘柱体’<em
浏览 6
提问于2021-11-13
得票数 0
回答已采纳
1
回答
dask
groupby
agg加权平均“未知聚合lambda”错误
、
在Dask中,我需要基于第三
列
从两
列
的
分组
值计算加权平均值。我正在这样做: dask_df = dd.from_
pandas
(df, npartitions = 10) wm = lambda x: np.average(x, weights=dask_df.loc() 在
Pandas
中,我耗尽了内存。File "/anaconda3/lib/python3.7/site-packages/dask/dataframe
浏览 35
提问于2019-08-27
得票数 2
1
回答
如何实现熊猫群对象
的
聚合功能?
、
对象,其中组由df
的
第一
列
中
的
值确定。/
pandas
/core/
groupby
.py", line 1757, in _
aggregate
_generic>>> impo
浏览 0
提问于2014-09-04
得票数 2
1
回答
熊猫
分组
和
可视化
、
我必须使用Python3
和
pandas
对一个数据集做一些分析,如玩具示例所示- data location importance agent count 0 London,然后计算每个位置
的
低、中和/或高“重要性”
列
的
数量。到目前为止,我想出
的
代码是- data.
groupby
(['location', 'importance']).
aggregate
浏览 17
提问于2021-02-04
得票数 1
回答已采纳
1
回答
使用Apply
和
Groupby
的
Lambda
、
、
、
、
我正在尝试计算由第二
列
分组
的
pandas
数据帧
的
列
中
的
唯一值,并将结果作为数据帧中
的
新
列
返回。 当我在下面的dataframe上测试这个操作时,它返回空值。
pandas
和
unique,它不再是一个有效
的
转换函数。_selected_obj) File "C:\ProgramData\Anaconda3\lib\site-packages\
pandas</em
浏览 37
提问于2020-11-24
得票数 1
回答已采纳
1
回答
如何按一
列
分组
并对另一
列
的
值进行排序?
、
、
、
这是我
的
数据框df = pd.DataFrame({'A': ['one', 'one', 'two', 'two', 'one'] ,', '11/11/2001', '08/30/2015', '07/3/1999','03/03/200
浏览 0
提问于2016-11-18
得票数 9
回答已采纳
4
回答
在
pandas
中过滤
GroupBy
之后
的
组,同时保留这些组
、
、
在
pandas
中,我想要做
的
是:df.
groupby
('A').filter(lambda x: x.name > 0) - group by
列
A,然后过滤名称为non positive
的
组。但是,当
GroupBy
.filter返回DataFrame时,这会取消
分组
,从而
丢失
分组
。我想按这个顺序来做,因为它应该对计算要求较低,因为filter后面跟着
groupby
会遍历DataFrame两次
浏览 3
提问于2018-04-14
得票数 12
1
回答
通过
GroupBy
获取DataError
的
熊猫平均值:没有要聚合
的
数值类型-
、
、
我知道有很多关于这方面的问题,比如
和
,但我得到了一个奇怪
的
错误。In [74]: df.head().
groupby
(lambda x: x.month).groups{1: [Timestamp('2008-().
groupby
(lambd
浏览 4
提问于2014-08-20
得票数 5
回答已采纳
1
回答
Pandas
Groupby
,用于整数值
的
Group Concat
、
、
我
的
pandas
dataframe看起来像这样,我希望按键对它进行
分组
,并连接id
的
逗号分隔,然后创建一个新
的
dataframe。现在这里
的
问题是id
列
是整数。id 1 abcd 5025923,5096021,5032121df.
groupby</
浏览 5
提问于2017-12-17
得票数 4
1
回答
python group by,传入列以聚合函数参数
、
、
、
、
当我将几个列传递给聚合函数时,我希望了解如何在
pandas
中进行聚合。我习惯了在R中使用dplyr,这是非常简单
的
。grouped_data.
浏览 81
提问于2018-06-17
得票数 2
回答已采纳
1
回答
如何在
Pandas
中创建多索引
、
问题1 sasha 14 0.724720 two 2 asa 76 0.77432
浏览 0
提问于2016-10-25
得票数 10
回答已采纳
1
回答
列
中
的
重复行- python/
pandas
、
、
、
、
我最近开始使用python
和
现在
的
pandas
来读取excel文件。我有点纠结于一个问题,我没有找到任何类似的例子。 假设我有来自不同机器
的
不同分钟
的
数据。发生
的
情况是,一台机器有多个信息。例如,在下图中,如果考虑机器13.5,则在5 5分钟内有5个关于成本
和
温度
的
信息。 我需要成本、温度
和
分钟信息
的
平均值,也就是说,每个machine.Considering只有一行。下面是我
的
代码。import
浏览 14
提问于2021-11-03
得票数 0
1
回答
在
列
*
和
*索引上使用
groupby
和
aggregate
with
pandas
、
、
、
、
87 242 1 88 30 3 23 323 1 33 40如果我想按索引上
的
结果
分组
我还想对这一
列
应用一个函数,但显然这失败了: >>> roll_table = pd_table.
groupby
("A").
aggregate
({"B": max, "C": min, "D": max\
浏览 6
提问于2020-08-01
得票数 5
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python之数据聚合与分组运算
Python数据分析之pandas(六)
Python基础——4 数据可视化(下)
在Pandas中通过时间频率来汇总数据的三种常用方法
Pandas 2.0 vs Polars:速度的全面对比
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券