腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
pandas
groupby
创建
新
列
以
指示
特定
列上
的
趋势
、
36 0.9s3 38 0.2 s1 1s3 38 0.2
浏览 12
提问于2020-04-28
得票数 1
回答已采纳
1
回答
基于以上和低于阈值
的
R中
的
数据帧子集
、
、
我搜索了很多类似于我
的
帖子下面,但没有运气,但我有1
列
数据如下(摘自原始大文件,有许多
列
)。C1 1 3 32从这些数据中,我想要生成一个
新
的
列
C2,其中C2中
的
C1
列
值应该
指示
与最大值相比,C1
列
值高于或低于阈值
的
位置。在这种情况下,最大值(C1)为4。因此,如果设置阈值为2,那么
新
的
数据应该如下所示。C1 C2
浏览 1
提问于2015-03-07
得票数 2
5
回答
在熊猫群中计算大于一个值
的
项目
、
、
通过这样做,我得到了评论
的
数量:现在我想得到有超过3颗星
的
评论
的
数量,所以我尝试从获得灵感。reviews.
groupby
('business_id')['stars'].agg({'greater':lambda val: (val > 3).count()}) 但这只会让我像以前一样数数所有的星星我不
浏览 3
提问于2016-11-20
得票数 22
回答已采纳
1
回答
PYTHON DATAFRAME条件组
、
如何重构这个表,并对长度小于2
的
行求和。因此,输出df如下所示 ? 请提出任何建议,我们将不胜感激。 谢谢你,Shei
浏览 22
提问于2020-12-09
得票数 0
回答已采纳
3
回答
使用
pandas
GroupBy
.agg()对同一
列
进行多个聚合
、
、
、
、
pandas
有没有一种内置
的
方法,可以在同一
列
df["returns"]上应用两个不同
的
聚合函数f1, f2,而不必多次调用agg()?示例数据帧:import datetime as dtdf = pd.DataFrame"returns" : 0.05 * np.random.randn(10), "dum
浏览 0
提问于2012-09-26
得票数 190
回答已采纳
1
回答
Python
Pandas
将计算写入
新
的
Csv文件
、
、
使用
: Python 3.6,
Pandas
0.22下面是我想要
的
avg.csv文件
的
输出: GRAND RAPIDS GERALD R FORD INTERNATIONAL().sort_values().to_csv(
浏览 4
提问于2018-02-24
得票数 1
回答已采纳
1
回答
如何在HSQLDB中进行多语言排序?
、
、
我
使用
HSQLDB作为数据库,数据库表包含来自多种语言
的
数据。所以,我想知道在HSQLDB中是否存在多语言排序。类似于在这里所做
的
事情。
浏览 3
提问于2015-08-06
得票数 0
回答已采纳
1
回答
有没有一种方法可以通过指定时间范围将
pandas
中
的
两个表连接到时间
列上
?
、
它们都有表单
的
列
01-06-2013 23:00:0002-06-2013 21:00:0002"hours" xor "days">, df1, df2)join_temporal(range=3, unit="days", df1, df2)join_temporal(range=2, un
浏览 0
提问于2018-12-18
得票数 1
2
回答
熊猫:
使用
group by,将多个
列
值合并为组内
的
一个独立组。
、
、
、
我有一个数据框架,我在
特定
的
列上
使用
pandas
.
groupby
,然后对生成
的
组运行聚合统计数据(均值、中位数、计数)。我希望将某些
列
值处理为由
groupby
生成
的
同一组
的
成员,而不是在用于分组
的
列
中为每个不同
的
值设置一个不同
的
组。我在想我将如何完成这样
的
事情。: >> my_df.
grou
浏览 3
提问于2017-05-01
得票数 1
回答已采纳
5
回答
在原始DataFrame中作为
新
列
的
广播群结果
、
、
、
、
我试图在
Pandas
dataframe中
创建
一个
新
列
,该
列
基于分组数据based中
的
两
列
。: TypeError:一个整数是必需
的
import
pandas
as pd df = pd.DataFrame({'a':[1,2,3,4,5,6(['c'])['a', 'b
浏览 1
提问于2018-12-12
得票数 5
回答已采纳
1
回答
用dataframe解除多索引组中
的
特定
组
、
、
、
我
的
数据df = df.
group
浏览 4
提问于2022-08-31
得票数 0
1
回答
Python -
使用
groupby
和条件语句
、
如何根据一
列
对DataFrame进行分组,检查每个组(或任何其他条件)中另一
列上
的
最高值,并
使用
分组期间找到
的
所有值
的
行
创建
一个
新
的
DataFrame?如果我在感兴趣
的
列上
使用
groupby
,然后检查我想要
的
条件,我将得到
的
唯一结果是一个包含两
列
的
df,但我希望返回原始df
的
浏览 27
提问于2020-04-30
得票数 0
1
回答
Pandas
:
使用
For循环迭代已排序
的
列
的
唯一值
、
、
我已经
以
排序
的
方式构造了一个数据帧,现在需要编写一个代码来迭代每个唯一项,因此假设数据集是 a,1a,3b,2 Id需要代码在df上循环,以便
使用
列
中
的
唯一值形成2个
新
的
dfs。a,1a,3 和 b,1 b,2 这里做了一些类似的事情:
Pandas
: iterate over unique values of a column that is already in sortedorder 但是id需要一个for循环来获得我
浏览 20
提问于2020-06-10
得票数 0
1
回答
Pandas
:
创建
移位
指示
器,省略组
的
第一个值
、
如何
使用
groupby
创建
一个
指示
器变量来检测
列
中
的
更改,从而忽略到达
新
组
的
第一个实例。import
pandas
as pdcase = pd.Series(['A', 'A', 'A', 'A', 'B', 'B',(df.case == df
浏览 17
提问于2021-07-03
得票数 0
回答已采纳
1
回答
使用
Pandas
的
属性合并和计数
、
我对CSV文件(r3 = df.
groupby
(['Predicted_Label', 'Actual_Label']).size().unstack(fill_value=0) print (r3))
的
2
列
进行了分组,
以
获得以下结果: 实际标签
的
第5栏和第6栏应合并为预测标签
的
第1行。产出应采用以下形式: 如何
使用
Pandas
创建
上述
新
列
?
浏览 1
提问于2018-08-26
得票数 2
回答已采纳
0
回答
在
pandas
数据框中为Groups on condition
创建
列
、
我有一个
pandas
dataframe df表格1 13 25 27 3我想
创建
一个包含
列
的
新
数据帧 1 1 2 3 6 7 即,在dataframe df2中为每个ke
浏览 0
提问于2017-06-14
得票数 1
回答已采纳
1
回答
Dask中
的
基本
groupby
操作
、
、
我正在尝试
使用
Dask来处理一个大文件(50 gb)。通常,我会将其加载到内存中并
使用
Pandas
。我想按两
列
"A“和"B”分组,每当"C“
列
以
一个值开头时,我想为那个
特定
的
组重复该
列
中
的
值。在熊猫中,我会做以下事情: df['C'] = df.
groupby
(['A','B'])['C']
浏览 7
提问于2016-08-12
得票数 3
1
回答
pd.pivot_table()无法计算datetime64[ns]上
的
统计信息
下面的代码
创建
一个包含两
列
date和category
的
pd.DataFrame。date
列
被设置为
使用
datetime64[ns]类型。允许在date
列上
计算数字统计数据: >>> df['date'].min()>>> df['date'].median() Timestamp('2021-01-02 00:00:
浏览 41
提问于2021-08-12
得票数 1
2
回答
为多个类别查找最近
的
时间索引
、
、
我正在尝试获取最接近多个独立类别的查询时间戳
的
数据点():df_output = list() latest = df_temp.iloc[i]这种方法
的
问题是它非常慢什么是更快/更正确
的
方法?有没有办法一次获得所有类别的结果?(我在想一些<e
浏览 29
提问于2018-01-02
得票数 0
回答已采纳
3
回答
为每个类别的python选择前10条记录
、
、
如何按
列
分组并获得该
列
中每个类别的前10条记录? 我想要
groupby
的
列有3个类别‘高’,‘中’和‘低’。 我有另一个包含数字数据
的
列
,用于对数据进行排名。Italy Vulkà Bianco 98 Sicily Nicosia 2013 Vulkà Bianco 2013 65 high 我
的
代码在这里返回数字
列
的
前有没有一种方法可以在不丢失其他
列
<em
浏览 45
提问于2019-03-02
得票数 3
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
在Pandas中通过时间频率来汇总数据的三种常用方法
Pandas 2.0 vs Polars:速度的全面对比
肝了3天,整理了90个Pandas案例
利用Python Pandas库从DataFrame中提取最新日期
使用 pandas 进行高效数据分析
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券