腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
使用
pandas
在
Python
中有
条件
地
对
DataFrame
进行
分组
、
、
我想根据特定列中的值有
条件
地
对
我的
DataFrame
进行
分组
。以下是我正在
使用
的数据帧的示例: date id height dd/mm/yyyy 2A 4dd/mm/yyyy 2B 1 我希望能够根据id列值中是否包含"A“或"B”<em
浏览 37
提问于2019-06-07
得票数 0
回答已采纳
1
回答
PySpark:带有标量
Pandas
的无效returnType
、
、
我正在尝试从
pandas
_udf返回一个特定的结构。它在一个集群上工作,但在另一个集群上失败。我尝试
在
组上运行udf,这需要返回类型为数据框架。from pyspark.sql.functions import
pandas
_udfimport numpy as np oneCar.loc[1:, 'Lati
浏览 2
提问于2018-03-26
得票数 5
回答已采纳
1
回答
用另一个聚合行在
dataframe
中聚合行
、
、
、
以下是我的代码:data = {"uid": ['1','2','3','','3','','4','5'], "pid":['a','b','a','d','c','e','','
浏览 1
提问于2020-08-21
得票数 2
回答已采纳
1
回答
当列介于两个值之间时,汇总
Pandas
数据
、
在
python
中,我有一个
Pandas
dataframe
(df),可以在下面
进行
复制。import
pandas
as pd data = [['2021-09-12', 'item1', 'IL', 5], ['2021-09-12', 'item2', 'CA', 7], ['2021startdate = '2021-08-01'
浏览 1
提问于2021-09-21
得票数 1
回答已采纳
1
回答
如何绘制一个事件
在
时间序列中的频率?
、
、
、
、
我只
使用
unixTimestamp。对于处理时间序列数据的更好方法的建议非常受欢迎。 此外,这是
在
170行df上运行的。实际数据大约有10M行。还能有人建议表示数据的最佳方式吗?提前感谢!
浏览 19
提问于2018-12-27
得票数 1
回答已采纳
1
回答
如何根据
条件
对
Pandas
DataFrame
进行
分组
?
、
、
我想在熊猫DF上
使用
有
条件
的groupby。test = pd.
DataFrame
({'A':range(9), 'B':['this','this','this','that','and','the','other','thing','.']}通过是否'B‘== ' this’
分组
浏览 0
提问于2017-03-20
得票数 1
回答已采纳
1
回答
根据列中的值,有
条件
地
聚合具有不同函数的
分组
数据框
、
import
pandas
as pd "group_id
进行
分组
,然后
对
每个组应用不同的聚合函数。为了确定
使用
哪个聚合函数,我想设置一个
条件
,该
条件
引用df中的另一个列,即condition。 具体
地
说,我想取"ones"组的val中所有元素
浏览 21
提问于2021-01-24
得票数 1
回答已采纳
1
回答
如何
使用
DataFrame
划分
Pandas
DataFrame
、
我正在编写一个
Python
脚本来从我的数码相机中导入图片,并且我正在
使用
Pandas
来帮助
对
输入的图像
进行
簿记。我正在苦苦挣扎的是如何
使用
Pandas
来根据一组时间戳
对
图像
进行
分组
,例如,这些时间戳都是
在
每小时半小时内完成的。举个例子,假设我有六张照片,其中三张是
在
九分钟内拍摄的,另外三张也是
在
九分钟内拍摄的,但一小时后。filename': '
浏览 5
提问于2014-11-13
得票数 3
回答已采纳
1
回答
使用
Pandas
Dataframe
-
Python
对
母子数据
进行
分组
、
、
、
我有一个数据框架,我想根据同一数据帧中另一列的值
对
其
进行
分组
。Parent_ID和子ID是链接的,并在层次树中定义了与谁相关的人。Alfred 111 1917 Armin 234 1019 Katya 109 323 我希望根据下面
分组
中的ID和Parent_ID对此数据框架
进行
分组
,并根据顶级父级生成CSV文件。也就是说,Alfred.csv,Carmen.csv (将只有
浏览 1
提问于2019-04-07
得票数 0
回答已采纳
2
回答
如何根据
Python
中的多个
条件
对
单个列
进行
求和?
、
、
、
最终目标是根据其他列中的多个
条件
对
"Price“列中的值
进行
求和。不过,我不知道怎么做。import
pandas
as pd rnd = pd.
DataFrame
({'Status':['Accepted', 'Denied', 'AcceptedOrange', 'Blueberry', 'Orange', 'A
浏览 5
提问于2021-12-07
得票数 0
2
回答
使用
NaNs
对
Pandas
DataFrame
进行
分组
、
、
、
、
我有一台
DataFrame
df1 "id": [1, 1, 2, 2, 3, 3],4 3 NaN 7.0 NaN NaN我的目标是通过id
对
df1
进行</e
浏览 0
提问于2021-06-17
得票数 0
1
回答
pandas
按产品
分组
,而不是sum或count
、
、
在
python
pandas
中,我想按列
对
dataframe
进行
分组
,然后取每个ID的行的乘积。df2 = pd.
DataFrame
({'X' : ['B', 'B', 'A', 'A'], 'Y' : [1, 2, 3, 4]}) print(df2.groupby(['X']).sum())
浏览 9
提问于2017-02-17
得票数 5
回答已采纳
1
回答
如何在
python
中按相同的签入日期和签出日期对日期数据
进行
分组
/计数?
、
、
、
我试图根据相同的签入和签出日期对日期数据
进行
分组
,例如:check_in = ['17/07/2021', '2021'] check_out = ['20/07/2021', '20/07/2021','22/07/2021', '24/07/
浏览 3
提问于2022-07-17
得票数 0
回答已采纳
1
回答
不能在pyspark中
使用
python
eval()作为
pandas
udf,但在
python
udf中
使用
相同
、
、
、
、
我是pyspark中的
pandas
udf的新手,需要帮助为大型数据帧(>1亿行)中的每一行应用udf。我的
dataframe
中有
一列,其中包含
使用
dataframe
中的列的多个
条件
。
对
每一行应用
条件
的最好方法是
使用
python
eval。当在
python
udf中
使用
python
eval时,它工作得很好,但是运行起来需要很长时间,因为我有几百万行。同样,
浏览 29
提问于2021-06-25
得票数 0
2
回答
熊猫
在
列间操作上的
分组
和聚合
、
我是一个R和data.table用户,试图
使用
更多的
Python
和
pandas
,当我想在
pandas
中执行以下操作时,我感到非常沮丧,因为似乎没有一种简单的方法:
在
R中,如果我想
对</em
浏览 3
提问于2022-05-02
得票数 1
回答已采纳
1
回答
通过for循环获取groupby错误
1,1,2,3,3,3,21,1,1,1,5,5,5,5,3,3,2,6] print(key,':',list(group)) 我已经写了上面的代码来按特定的数字
分组
并获得一个列表
浏览 18
提问于2019-03-09
得票数 0
1
回答
pandas
批处理操作的性能是否等同于SQL?
、
我
使用
Pandas
DataFrame
是为了
在
一个大表中
进行
搜索,基于一些
条件
,比如df['start_date' > datetime.now()]等。未
对
DataFrame
进行
排序或索引。
pandas
是否为批处理操作提供了类似的性能,就像
使用
WHERE子句时的SQL一样?
浏览 1
提问于2018-08-14
得票数 1
1
回答
JuliaDB或
DataFrame
比平面数组快吗?
我想知道普通数组与JuliaDB或
DataFrame
在对大型数据集(大型但仍然适合内存)上的计算性能是否存在差异?我可以
使用
简单的数组和算法来
进行
排序、
分组
、缩减等等,那么为什么我需要JuliaDB或
DataFrame
呢?我有点理解
Python
为什么需要
Pandas
--因为它将缓慢的
python
转化为快速C,但是为什么Julia需要JuliaDB或
DataFrame
-- Julia已经快了。
浏览 0
提问于2018-03-26
得票数 10
回答已采纳
2
回答
对
pandas
中的日期时间值
使用
groupby
、
我
使用
此代码是为了按年份df = pd.read_csv('../input/companies-info-wikipedia-2021/sparql_2021-11-03_22-25-45Z.csv')对数据
进行
分组
df = pd.read_csv('..foundation'])df = df.groupby('foundati
浏览 81
提问于2021-11-09
得票数 0
回答已采纳
1
回答
如何在dask
中有
效
地
使用
pandas
.cut() (或等效)?
、
、
在
Dask中是否存在与
pandas
.cut()等价的内容?到目前为止,我可以用熊猫来做这件事,但我想把它并行运行。所以我试着用达斯克。我找到了一个
使用
pandas
.cut()的解决方案,但它需要调用原始
浏览 4
提问于2017-02-24
得票数 13
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券