腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(54)
视频
沙龙
1
回答
Pandas
合
并无
重
复列
的
混合
长度
数据
集
、
我正在尝试合并几个
混合
的
数据
帧,将一些有时存在于其他
数据
帧中
的
缺失值合并到一个组合
数据
集中,一些
数据
帧也可能包含额外
的
列,然后这些列应该被添加,并且所有其他行都有NaN作为值。这基于一个或几个列,行索引没有意义,真正
的
dataset有许多列,因此手动删除任何内容都是不可取
的
。因此,本质上,基于一个或多个列合并多个
数据
帧,确定任何非NaN值
的
优先级,或者如果存在两个冲突
的</
浏览 17
提问于2020-11-27
得票数 0
回答已采纳
2
回答
如何将
混合
数据
类型
的
制表符分隔文件加载到numpy或
pandas
中?
、
、
我有一个制表符分隔
的
数据
集
,它加载到Excel中,在
数据
类型方面看起来像这样,但维度为83x 23275。正如您所看到
的
,此
数据
集
是
混合
类型,第0行和第0列
的
类型为string。或numpy,我如何加载这类
数据
并访问与其正确标签相关联
的
数字?我甚至可以使用
数据
类型字符串
的
两个标签向量(行和列
的
长度
分别为83和23275 ),然后
浏览 0
提问于2015-11-12
得票数 0
2
回答
如何消除潘达斯DataFrame行中
长度
3或更长
的
重复?
、
我有一个
数据
集
,它完全由表示空间
数据
的
浮点值组成(基本上是一个曲面的水平切线)。有时,产生这些值
的
传感器会错误地这样做,并会在一行中重复多个值。我希望删除
长度
3或更长
的
重复序列,同时保留重复值
的
第一个值和值
的
所有其他实例(包括
长度
2
的
序列)。在行
的
开头有一个4长
的
0.2
重
复,在末尾有一个长达2
的
0.2
重
复。我想
浏览 5
提问于2020-06-23
得票数 1
回答已采纳
1
回答
如何从受另一列约束
的
数据
库中提取一列
数据
、
、
这是在Python 2中完成
的
,我使用
的
是
Pandas
。虽然我喜欢用SQL来做这件事,这可能会让我
的
生活变得更容易,但这不是一个选择。 我有两个
数据
帧,x和y。x(BuyerNames)‘和’y (Buyer)‘中
的
条目属于同一
集
合
,并且共享列中
的
数据
通常是一致
的
。我想创建一个dataframe,它是y
的
子集,称为y*,这样对于具有相应索引
的
行,'Buy
浏览 10
提问于2019-01-10
得票数 0
2
回答
在DataFrame中爆炸相同
长度
的
多个列表
、
我有一个
Pandas
DataFrame,在我想要分割
的
列中有几个列表。每个列表都有相同
的
长度
,它们必须在相同
的
索引中被分割。我现在使用
的
是来自
的
建议,但我无法让它发挥作用:import
pandas
as pd split_size我认为问题在于chain.from_iterable
的
用法,但没有它,我只需要重
复列
表列
浏览 0
提问于2019-08-28
得票数 2
1
回答
从长到宽重新塑造
数据
集
(或用信息丰富主
数据
集
的
不同方法)
、
来自STATA
的
我很难重塑我
的
数据
,或者我在如何处理python /a ML问题上弄错了。我有多个
数据
集
,我将在这里简要描述: +-----------------------------------------|多个附加
数据
浏览 4
提问于2020-11-29
得票数 1
回答已采纳
2
回答
ValueError:取值
长度
与索引
长度
不匹配|计算日期差异
、
、
我有一个
数据
集
/
pandas
df,大约有50列--列是字符、数字和日期
的
混合
。其中5列是日期,标签为Meeting1-Meeting5,我正在尝试计算会议日期之间
的
天数。我
的
df一般是这样
的
:123456789datetime from datetime import
浏览 3
提问于2017-09-18
得票数 0
2
回答
比较两个
长度
不等
的
数据
帧
的
行
、
、
我试图从两个
长度
不等
的
数据
帧中计算两列
的
值,以找到两种情况: (这是我不确定这是否是最佳方法
的
地方)--获取id1、id2组<
浏览 0
提问于2017-10-08
得票数 1
回答已采纳
3
回答
数据
帧中可变
长度
时间片
的
高效提取
、
我想用一个DataFrame有效地分割一个DatetimeIndex (类似于
重
采样或groupby操作),但是所需
的
时间切片是不同
的
。通过循环(请参阅下面的代码)来实现这一点相对容易,但是随着时间序列
的
增加,多个片段很快就会变慢。对此/提高速度有什么建议吗?import
pandas
as pd, datetime as dt, numpy as np idx = pd.DatetimeIndexrow.star
浏览 5
提问于2017-10-24
得票数 1
回答已采纳
3
回答
如何将dask.dataframe与自定义dsk图一起使用
、
我将尝试重新表述我
的
问题:id,names,amount387,Tim,208129,Patricia
浏览 5
提问于2015-10-21
得票数 2
回答已采纳
3
回答
Pandas
.resample为非整数倍频
、
、
、
为了使
数据
集
与另一个
数据
集
同步,我必须将
数据
集
从10分钟间隔
重
采样到15分钟间隔。基于我在堆栈溢出
的
搜索,我有一些如何继续
的
想法,但是没有一个能提供一个清晰清晰
的
解决方案。可能
的
解决办法 将所有
数据
<e
浏览 3
提问于2014-10-27
得票数 2
回答已采纳
2
回答
基于查找更改
pandas
中
的
行值
、
我有两个熊猫
数据
帧。一个包含实际
数据
,第二个包含行索引,我需要用一些值替换它。I3 43455467 40 014 I3 # # 014 I 所以要根据record_id查找来改变相应
的
行索引值这里(1 2 4 011)
浏览 0
提问于2017-04-05
得票数 1
2
回答
如何将
数据
从长转换为宽,并在索引中按年对值进行分组?
、
、
、
、
下面的代码与我使用
的
前一个csv一起工作,两个csv
的
列数量相同,列
的
名称也是相同
的
。没有的csv
数据
from
pandas
import DataFramefrom matplotlib importprint(group
浏览 3
提问于2020-09-20
得票数 6
回答已采纳
4
回答
使用财务
数据
从
数据
帧计算回报
、
我有一个包含每月财务
数据
的
数据
框架:Out[89]: In [90]: returns = (vfiax_monthly.open[1:] - vfiax_monthly.open[:-1])/vfiax_monthly.open[1:]In [103]: returns = (vfiax
浏览 1
提问于2012-11-15
得票数 24
回答已采纳
1
回答
使用索引从XArray
的
DataArray中提取值到列
、
、
所以,我做
的
事情可能有点不正统,我有90亿像素光栅地图,基于NLCD,我想从这些栅格中得到像素
的
值,这些像素大约有5亿:上面的代码为我提供了一个
数据
帧,因为
长度</em
浏览 0
提问于2022-06-02
得票数 0
2
回答
日内TimeSeries
的
多指标结构(10 min价格
数据
)
、
、
、
、
我每十分钟有一份日内价格
的
文件。一天0:41次。每次约会重复42次。下面的多个索引应该会将重复
的
日期“折叠”为一个时间。 换句话说,09:30是每天
的
第一次,16:20是最后一次:I不能在16:20-09:30之间
的
价格天之间
的
重叠差。差异应该从09:40-09:30开始,然后结束为16:20 - 16:10,对于datafr
浏览 1
提问于2012-11-16
得票数 3
1
回答
神经网络与随机森林性能差异
、
、
、
、
我想用PyTorch对神经网络进行一些实验,所以我尝试了一个简单
的
热身练习,但我无法完全理解结果。该
数据
集
上
的
简单线性回归
的
均方误差
浏览 0
提问于2019-12-11
得票数 1
回答已采纳
2
回答
熊猫DataFrame从不规则时间序列索引中重新采样
、
、
、
我想将一个DataFrame
重
采样到每5秒一次,其中原始
数据
的
时间戳是不规则
的
。很抱歉,如果这看起来是一个重复
的
问题,但是我对
数据
时间戳
的
内插法有问题,这就是为什么我在这个问题中包括了我
的
DataFrame。显示了我想要
的
结果,但我不能使用这里建议
的
traces包。我用
pandas
0.19.0。只是
重
采样到1s已经产生了错误
的
结果。40000.000000 19
浏览 0
提问于2018-03-09
得票数 6
回答已采纳
1
回答
变长输入序列Keras中
的
GRU/LSTM
、
、
我所面临
的
问题是以以下形式提供
的
数据
:>>> import
pandas
as pd >>> pd.DataFrame([[1, 2, 3],[1, 2,我
的
整个
数据
集
要大得多,但我想先了解概念部分,然后再抛出模型。我想要学习
的
任务是给出一个互动
的
顺序,哪一组是由人选择
的
。更具体一点,我希望有一个包含所有组(有3个组
浏览 0
提问于2019-04-02
得票数 6
回答已采纳
2
回答
字符串中包含
的
10大数
的
最佳压缩
、
、
、
我正在为包含基数10位
的
字符串编写压缩和解压缩函数。我认为,由于仅对10个字符进行操作,所以存在一个可以表示大字符串
的
小得多
的
字符串。例如,我想要一个表示1000位数字
的
字符串(例如)并“压缩它”。这些
长度
的
数字超过了我正在使用
的
语言JavaScript中
的
数字类型。因此,数字操作/转换是不可能
的
。我使用
的
压缩软件()不压缩数字。是否有某种可以用来压缩数字
的
算法?我不是在寻找执行速度,而是
浏览 4
提问于2016-02-13
得票数 3
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
FX某飞学城Python开发+AI人工智能工程师(完结)
Python 数据分析精选
Python之Pandas使用教程(一)
Python使用pandas使数据可视化笔记
一文学会在Python中利用过滤器方法进行深度学习特征选择
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券