腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
避免
Pandas
groupby
导致
的
数据
丢失
、
、
、
我有一个
数据
帧类型
的
数据
,大小为7689行×114列。其中包含datetime、float类型
的
数据
等。我尝试使用“
groupby
”方法将原始
数据
分成4个部分,在分别处理了一些基本
的
减法运算后(不改变
数据
结构),并使用“pd.concat”方法将这4个部分合并为一个部分。最重要
的
是,当我将DateTime可视化为时间线时,它会显示
丢失
的
数据
,最初是半年一致
浏览 33
提问于2020-09-24
得票数 0
1
回答
pandas
groupby
重采样
导致
数据
丢失
、
我有一些基于每3小时
的
数据
,我尝试通过使用 df = df.
groupby
(df.index.date).resample('1h').pad() 然而,它停在每天21:00
的
最后一个
数据
,最后三个小时不在那里我该
如何
解决这个问题?
浏览 35
提问于2020-10-29
得票数 2
回答已采纳
1
回答
如何
将
pandas
.core.
groupby
.
groupby
.DataFrameGroupBy转换为dataframe?
、
、
我在DataFrame上应用了
groupby
,之后它将DataFrame转换为
pandas
.core.
groupby
.
groupby
.DataFrameGroupBy格式。
如何
将
pandas
.core.
groupby
.
groupby
.DataFrameGroupBy转换为常规DataFrame,或者
如何
从
pandas
.core.
groupby
.
groupby
.DataFrameGr
浏览 7
提问于2018-10-27
得票数 1
2
回答
在dask中遍历
GroupBy
对象
、
、
是否可以遍历dask
GroupBy
对象来访问底层
数据
帧?我试过了:import
pandas
as pdddf = dd.from_
pandas
(pdf, npartitions = 3) gro
浏览 21
提问于2016-09-28
得票数 10
回答已采纳
1
回答
如何
避免
作业表运行时出现死锁情况,
避免
重启,是否会影响事务或
导致
数据
丢失
?
、
、
、
如何
避免
作业表运行时出现死锁情况,
避免
重启,是否会影响事务或
导致
数据
丢失
?
浏览 49
提问于2021-09-22
得票数 0
2
回答
如何
在Python DataFrames中按3列分组并给出计数
、
、
、
我有3列,我想根据3列中
的
公共值进行计数。df.
groupby
(["Date", "Name"]).size() 15-Jul Joe 5]).size() 我就是这样加载
数据
的
(["Date", "Nam
浏览 0
提问于2019-07-26
得票数 0
回答已采纳
1
回答
为什么熊猫在聚合不存在
的
列时会为列值提供NaN?
、
NaNC NaN 这
导致
了我们
的
团队进行了相当大
的
追逐,以确定错误在哪里。('letter')['numberrrrr'].sum() /usr/local/Anaconda/lib/python2.7/site-packages/
pandas
/core/
groupby</em
浏览 3
提问于2014-05-27
得票数 1
回答已采纳
2
回答
如何
将
数据
集与熊猫群相结合
、
、
、
、
我有一个dataframe df和一个列df['table'],这样df['table']中
的
每一项都是具有相同标题/列数
的
另一个
数据
same。我想知道是否有办法像这样做
groupby
:name tableJoe
Pandas
df2Bob, df3, and df4 Joe
Pa
浏览 0
提问于2020-10-07
得票数 7
回答已采纳
2
回答
Dask Dataframe
groupby
在
pandas
序列中
的
结果,我
如何
返回dask dataframe?
、
、
、
我正尝试在Dask中执行
groupby
函数来创建一个新
的
Dask
数据
帧。然而,当我做
groupby
时,结果是一个熊猫系列。当我在
Pandas
中执行相同
的
操作时,我确实返回了一个新
的
数据
帧。
如何
返回新
的
dask
数据
帧?返回:和返回当我在
Pan
浏览 4
提问于2019-10-09
得票数 0
1
回答
熊猫石斑鱼vs时间石斑鱼
、
、
、
新
的
pandas
版本不推荐使用TimeGrouper,所以我们应该使用常规
的
Grouper。老代码:在旧版本
的
pandas
中运行良好。但是,以下两项均不适用: df.
groupby
(pd.Grouper(key='column_name', freq="M")).mea
浏览 0
提问于2017-10-30
得票数 8
回答已采纳
1
回答
我能用潘达斯Dataframe.assign(.)吗?具有可变名称
、
我编写了这段代码,这样我就可以组任何
Pandas
DataFrame,并获得组大小和
数据
的
一个示例行作为一个快速结果。它工作得很好,但有一个问题:新列/索引"Size“
的
name是固定
的
,因为.assign( ... )命令不接受变量。因此,如果我
的
DataFrame有一个名为"Size“
的
列,它就会
丢失
。我
的
计划是检查是否存在名为"Size“
的
列,如果存在,则为索引使用不同<
浏览 0
提问于2020-01-22
得票数 2
1
回答
绘图和
GroupBy
方法
、
、
我正在学习
如何
在
Pandas
中利用DataFrames,我想使用
GroupBy
方法来生成以下图:B 100 non-null valuesd
浏览 0
提问于2013-07-11
得票数 1
回答已采纳
1
回答
使用最频繁
的
值按组填充缺失值
、
、
、
、
我试图使用使用Python中
的
pandas
模块
的
组使用最常见
的
值来推断缺少
的
值。在检查了堆栈溢出
的
一些帖子之后,我成功地实现了以下目标:import
pandas
as pd df1 =
浏览 1
提问于2021-04-11
得票数 2
回答已采纳
1
回答
groupby
.sum()稀疏矩阵在熊猫或枕木中
的
应用:寻找性能
、
、
、
、
我有以下
数据
集dfimport
pandas
df2 =
pandas
.DataFrame(X) df2['ids'] = df['ids
浏览 2
提问于2015-05-18
得票数 4
回答已采纳
1
回答
如何
提高
pandas
GroupBy
filter操作
的
性能?
、
、
、
我正在处理一个大型
的
CSV
数据
集(它包含超过1500万行,大小超过1.5 GB )。我正在将摘录加载到运行在Jupyter Notebook中
的
Pandas
dataframes中,以基于
数据
集推导出一个算法。我根据MAC地址对
数据
进行分组,这
导致
了1+百万组。我
的
算法开发
的
核心是运行这个操作:
pandas
.core.
groupby
.DataFrameGroupBy.filter 根据
数据
浏览 22
提问于2019-02-10
得票数 6
回答已采纳
4
回答
在
pandas
中过滤
GroupBy
之后
的
组,同时保留这些组
、
、
在
pandas
中,我想要做
的
是:df.
groupby
('A').filter(lambda x: x.name > 0) - group by列A,然后过滤名称为non positive
的
组。但是,当
GroupBy
.filter返回DataFrame时,这会取消分组,从而
丢失
分组。此外,克隆分组中
的
组(到字典或其他东西)将失去无缝返回到
数据
帧
的
功能(就像在.filter
的
示例中,您直接获取D
浏览 3
提问于2018-04-14
得票数 12
1
回答
如何
使用python大熊猫群或.DataFrameGroupBy对象创建唯一
的
组合列表
、
、
是否有更有效
的
方法使用熊猫群或
pandas
.core.
groupby
.DataFrameGroupBy对象创建一个独特
的
列表,系列或
数据
,在这里,我想要两个独特
的
组合N列。例如,如果我有列:日期、名称、购买
的
项目--我只想知道唯一
的
名称和日期组合--这很好:y = y.reset_index()[['Dat
浏览 1
提问于2014-08-27
得票数 4
2
回答
如何
在固定间隔内对第二列定义
的
某一列
的
元素求和?
、
、
我有两列A和B
的
DF,我想根据A
的
三个不同值对B元素求平均值: A= [id1 id1 id1 id1 id2 id2 id2 id2 id3 id3 id3 id4 id4 id4 id4] B=[1 2 3 4 4 2 1 1 1 3 3 4 4 4] 对于A
的
每个值,我想对B
的
两个值求和,每次我用1值移位意味着:对于id1 :第一个值必须是1 +2,第二个值必须是2+3,第三个值必须是3+4,
浏览 29
提问于2019-02-04
得票数 0
回答已采纳
1
回答
选择
pandas
数据
框列中
的
值,对应于其他列中
的
值
、
、
所以我是python
的
新手,我正在使用
pandas
处理
数据
帧(除了
pandas
之外不能使用包),我已经为6种不同
的
汽车接受了用户输入(制造商,型号,类型,评级):4 ford taurus sedan B我想要这些
数据
的
条件概率,我使用value_counts
数据
帧实现了
浏览 1
提问于2018-06-14
得票数 2
1
回答
在Pyspark中,当您
groupBy
与partitionBy中使用
的
列相同
的
列时会发生什么?
、
、
我有一个按列ID分区
的
数据
集,并将其写入磁盘。这会
导致
每个分区在文件系统中获得自己
的
文件夹。现在我正在读回这些
数据
,并想先调用
groupBy
('ID'),然后再调用一个
pandas
_udf函数。我
的
问题是,既然
数据
是由ID分区
的
,那么
groupBy
('ID')会比没有分区
的
数据
快吗?例如,使用文件夹结构一次读取一个ID是不是
浏览 1
提问于2019-11-07
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
数据恢复退坑指南,避免数据丢失的几个方法
存储Cache丢失导致数据库无法open的案例分享
如何快速恢复丢失的文件数据?
因数据丢失导致倒闭的企业高达50%,你敢轻视数据的重要性吗?
采样率与带宽的关系:如何避免欠采样导致的波形失真?
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券