腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
为
每个
groupby
df
运行
一个
函数
,
并
使用
该
函数
生成
的
值
(
没有
df
返回
)
、
、
我有
一个
或多或少简单
的
问题,因为我目前
的
解决方案正在困扰着我。请注意,提供
的
代码只是
一个
简单
的
例子,我并不真的需要组
的
长度,但希望在未来做一些其他
的
事情。因此,我当前
的
代码如下所示: mylist = [] #do stuff with group e.g. return len
df
_.<em
浏览 11
提问于2021-07-20
得票数 0
回答已采纳
1
回答
选择.
groupby
()以外
的
列
、
、
、
我正在
使用
Python中
的
dataset,
该
数据集有三列: state (ST)、city (City)和证书数量(CERT)。我必须
为
每个
州找到最低数量
的
证书,这是我用以下代码完成
的
:但是,当我还需要输出城市时,它只
返回
州和证书
的
数量。我需要
每个
州
的
城市都
浏览 4
提问于2022-04-05
得票数 0
回答已采纳
3
回答
按字段填充以前
的
值
- Pandas应用功能不填充
、
、
、
我试图用特定子集
的
前一行
的
值
填充新列(前一次)中
的
每一行(满足条件时)。问题是,如果我中断内核
并
检查
值
,就可以了。但是,如果它
运行
到末尾,那么新列中
的
所有行都
没有
填充。如果上一行不存在,我将用第
一个
值
填充它。3 4 5Runner 2 5 8
浏览 2
提问于2020-05-16
得票数 0
回答已采纳
1
回答
循环通过Dataframe以按城市删除异常值(调用
函数
)
、
、
、
我有
一个
异常值
函数
- def detect_discrete_outliers(data): threshold=3 if np.abs(z_score) > threshold: return outliers 现在,我想
使用
这个离群
值
函数
从
df
中删除离群
值
detect_discr
浏览 25
提问于2021-08-11
得票数 1
回答已采纳
1
回答
Dataframe创建列,包含总销售额
、
、
、
、
当
一个
游戏被卖出几次时,它
的
ID会出现好几次。游戏/购买日期/客户/价格/游戏类型/销售总数更新:非常感谢您高效而详细
的
回答!
浏览 1
提问于2022-04-01
得票数 0
1
回答
与单独
运行
相比,具有多个聚合
的
吡火花旋转数据要长/冻结得多。
、
、
我
使用
的
是电火花pivot
函数
。我做错了什么?
该
命令看起来如下:
df
_
groupby
=
df
.
groupby
('user_id
浏览 1
提问于2021-01-28
得票数 1
1
回答
如何在Pandas中通过分区计数
、
、
下面窗口
函数
的
pandas等效项是什么 我可以得到row_number或排名但是,像示例中那样按城市计算分区是我要查找
的
内容
浏览 1
提问于2019-09-11
得票数 4
2
回答
在
使用
groupby
应用
生成
系列时保留DataFrame
的
索引
、
、
当
使用
groupby
+ apply调用
函数
时,我想从DataFrame转到Series
groupby
对象,将
一个
函数
应用到
每个
以Series作为输入
并
返回
Series作为输出
的
组,然后将
groupby
+ apply调用中
的
输出分配
为
DataFrame中
的
字段。默认行为是将来自
groupby
+ apply
的
浏览 2
提问于2017-02-11
得票数 4
回答已采纳
2
回答
Pandas
groupby
操作
返回
对象,但
没有
可视对象
、
刚接触Pandas (2天),并在我
的
学院奖数据集上
运行
了以下
groupby
命令。
df
[(
df
.Award == 'Best Actress') & (
df
.Winner == 1.0)].
groupby
('Name')我期
浏览 1
提问于2017-04-26
得票数 1
0
回答
Pandas-基于另一列
的
行和创建新列
的
正确方法(尝试在副本上设置
的
值
)?
、
、
、
我有
一个
包含日期、名称和
值
的
dataframe,我要做
的
就是创建
一个
列,
该
列是
每个
日期
的
值
的
总和
的
输出,然后用该日期
的
每个
名称
的
值
减去这个和。我已经能够做到这一点,但我得到了常见
的
错误:A value is trying to be set on a copy of a slice from a DataFra
浏览 0
提问于2017-12-01
得票数 0
回答已采纳
4
回答
每一独特
值
取样一条记录(熊猫、蟒蛇)
、
、
、
、
我
使用
python-大熊猫
的
dataframes,我有
一个
包含用户和他们数据
的
大数据。
每个
用户可以有多个行。我想要
每个
用户一行
的
示例。我目前
的
解决方案似乎
没有
效率:
df
1 = pd.DataFrame({'User': ['user1', 'user1', 'user2', 'user3', 'user2&
浏览 4
提问于2016-07-15
得票数 20
回答已采纳
1
回答
如何
使用
自定义熊猫群聚合
函数
将数据帧中
的
行组合起来
、
、
我想将这些重复序列平分到一行中,并将不同(唯一)
的
部门
值
组合到
一个
列表中。因此,取
每个
组
的
第一行,只需将department值更改为
该
组中唯一
的
department
值
的
列表即可。因此,
生成
的
dataframe应该有完全相同
的
列,但是name列中
没有
重复,而department列现在至少有
一个
元素
的
列表。我想
使用
浏览 1
提问于2016-11-20
得票数 2
回答已采纳
1
回答
创建转置和
GroupBy
矩阵数据帧Python Pandas
、
、
、
有了每一行
的
PUSH
值
(在本例中,我只有
一个
ID,但表中包含更多ID),我想创建第二个表(图片中
的
黄色表)。然后目标是:
为
每个
商店创建新
的
列(列出7个adh,ayc,maeg,rot,witz,mar,bud),其中
每个
商店将接收来自PUSH列
的
值
。预期
的
结果是黄色
的
表,我将在用于
生成
ID、STORE、PUSH表
的
相同数据帧中添加
该</e
浏览 35
提问于2021-09-29
得票数 1
1
回答
群
函数
的
系列查询
、
、
我有
一个
名为active
的
数据框架,它有10个唯一
的
POS列
值
。
df
2 = pd.DataFrame({'X'
浏览 3
提问于2015-01-21
得票数 1
回答已采纳
2
回答
比较或区分两个熊猫栏元素
、
Eins我
的
假设是,当A列中
的
值
为
1时,B列中
的
值
总是One。其次,我还假设,如果我
的
第
一个
假设是不正确
的
,这不是
一个
错误,但这是有效
的
(人为
的
)原因。例如,请参见行索引4,其中A-value与B列中
的
Eins (而不是One)相关。正因为如此,我还需要看到和探索我
的
假设不正确
的
情况。 更新问题:这个数
浏览 5
提问于2021-05-25
得票数 1
回答已采纳
1
回答
使用
sklearn查找每组数据帧
的
系数
、
、
我有
一个
包含一些
值
和多个组
的
数据帧(
df
1)。我想对
每个
组执行线性回归,这样我就可以
使用
系数来完成
df
2,然后将它们连接起来(
df
3)。到目前为止,我还在处理我
的
整个数据帧import pandas as pd return linear_model.LinearRegression,
df
2]) 这是可行<
浏览 2
提问于2019-05-03
得票数 0
1
回答
定义
一个
函数
来播放CSV数据中
的
图形- Python熊猫
、
我试着玩数据分析,从我创建
的
带有随机
值
的
简单CSV文件中获取数据。 print type(x)
df
1=dataFrame
df
2=
df
1[['currencyPair','amount']]<e
浏览 1
提问于2016-01-08
得票数 2
回答已采纳
2
回答
使用
自定义
函数
操作熊猫数据
、
、
、
我在将客户
函数
应用于数据访问时遇到了困难。该
函数
工作正常,
并
返回
正确
的
数据。然而,在应用了它之后,我
的
数据仍然是旧
的
。(data = d) 我
为
分组编写了
一个
小
的
测试
函数
,并为
每个
组找到了col2中
的
最高
值
:x = x.<e
浏览 7
提问于2022-04-12
得票数 1
1
回答
查找具有最大行数
的
索引
、
、
我
的
任务:问题5 哪个州有最多
的
县?(提示:仔细考虑sumlevel密钥!你将来
的
问题也需要这个.)这个
函数
应该
返回
一个
字符串<e
浏览 0
提问于2019-07-04
得票数 0
回答已采纳
3
回答
群唯一
的
组过滤器
、
、
在组内执行过滤器
并
遇到麻烦。过滤器用于
groupby
的
每个
dataframe中
的
元素;对于
groupby
的
dataframe来说是唯一
的
。我想按ID上
的
第
一个
df
进行分组,然后在conditions_
df
中显示
的
条件下
返回
一个
过滤后
的
值
。该条件与第
一个
groupby<
浏览 1
提问于2018-08-02
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python之数据聚合与分组运算
pandas入门3-1:识别异常值以及lambda 函数
Python Pandas模块数据统计与分析常用方法
在Pandas中通过时间频率来汇总数据的三种常用方法
Python基础——4 数据可视化(下)
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券