腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(3216)
视频
沙龙
1
回答
你
能从
numpy
array
或
pandas
dataframe
中
提取
超过
阈值
的
数据
索引
吗
?
、
、
、
、
这是我能设计出
的
最快
的
方法,但它会产生一个非常大
的
2D数组。我可以看一看,看看我想要什么。理想情况下,我希望设置一个
阈值
,并将每个值
的
索引
拉取到该数字之上。更复杂
的
是,我不希望
索引
将字符串与自身进行比较,而且字符串可能会在其他地方重复,所以我想知道是不是这样,所以我不能忽略1。sql.get_corups()返回一个字符串列表,当前为1600左右
的
字符串。 我想要
的
可能
吗
?我尝试过使用Levensh
浏览 42
提问于2021-02-27
得票数 1
回答已采纳
3
回答
熊猫-有效地从列表
中
搜索
数据
帧列
、
、
、
、
我试图找出在
Pandas
中
搜索
数据
帧
的
最有效方法,其中包含其他值
的
列表(
dataframe
),而无需使用蛮力方法。有办法把它矢量化
吗
?我知道我可以循环列表
中
的
每个元素(
或
dataframe
),并使用loc方法
提取
数据
,但我希望得到更快
的
结果。我有一个有100万行
的
数据
框架,我需要在其中搜索以
提取</em
浏览 4
提问于2017-04-05
得票数 0
回答已采纳
2
回答
在熊猫
数据
框架
中
包装切片指数
的
好方法
、
、
、
我希望使用iloc按行
或
列对
数据
帧进行切片,同时在绑定
索引
之外进行包装。Slice the rows from 2 to 4, which the
dataframe
only have 3 rows
数据
框架: a b c0 1 2 3 在
numpy
中
,可以使用
numpy
.take来包装绑定
索引
之外
的
浏览 0
提问于2018-11-15
得票数 3
1
回答
如何在复制
或
群居熊猫
DataFrame
时保持主要秩序?
、
、
、
、
我使用
pandas
.
DataFrame
作为业务应用程序
中
的
数据
结构(风险模型),需要快速聚合多维
数据
。熊猫
的
聚合在很大程度上取决于在底层
的
numpy
数组上使用
的
主要订购方案。不幸
的
是,当我创建副本
或
使用groupby和sum执行聚合时,熊猫(版本0.23.4)改变了底层
numpy
数组
的
主要顺序。我通常使用45000行和100000列
的</
浏览 4
提问于2019-05-23
得票数 1
回答已采纳
3
回答
如果我使用python
pandas
,还需要结构化数组
吗
?
、
、
既然
pandas
提供了
数据
帧结构,那么
numpy
中
还需要结构化/记录数组
吗
?我需要对需要这种结构化数组类型框架
的
现有代码进行一些修改,但从现在开始,我正在考虑使用
pandas
代替它。我会不会发现我需要一些
pandas
不提供
的
结构化/记录数组
的
功能?
浏览 2
提问于2012-08-21
得票数 22
回答已采纳
2
回答
如何从
Pandas
创建(正确)
NumPy
数组
、
、
、
我正试图从熊猫
数据
帧
中
为"label“列创建一个
NumPy
数组。我
的
df:0 0 1:0.044509422 2:-0.03092437正如你所看到
的
,我有两个目标:标签和向量。对于col标签,我使用了以下解决方案: print(y.astype(float).to_<em
浏览 6
提问于2020-04-19
得票数 0
回答已采纳
8
回答
如何将
pandas
序列
或
索引
转换为
Numpy
数组?
、
您知道如何以
NumPy
数组
或
python列表
的
形式获取
DataFrame
的
索引
或
列
吗
?
浏览 3
提问于2013-06-22
得票数 280
回答已采纳
2
回答
在
dataframe
列名和行
索引
中
提取
特定值
、
、
、
我有一个形状为(5,7)
的
数据
。列
索引
和行
索引
分别命名为0~6和0~4。这个
dataframe
(矩阵)只包含4个值,如5、7、8和9。例如,前七(2,1)->(列名,行
索引
)第二七(2,2)import
pandas
as pd a
浏览 3
提问于2021-12-17
得票数 2
回答已采纳
1
回答
将二维
numpy
数组累加到三维张量
中
,然后将它们按元素方向进行平均。
、
、
、
、
蓄积期from
numpy
.random import randomt = 5 #trials X = ran
浏览 1
提问于2020-09-23
得票数 1
1
回答
如何根据日期标题对二维数组列进行平均
、
、
我正在处理一些玻璃钻孔温度
数据
,该
数据
由大约1000行乘700列组成。垂直
索引
是深度(即,当您向下移动时,数组深度增加),列标题是日期时间值(即,当您沿着数组向右移动时,您将在时间上向前移动)。如果能够将采样作为输入,并基于该采样率
提取
数据
,这将是一件好事,这样我就可以看到哪一个效果最好。如果我选择比方说3小时采样,如果间隔
超过
3小时,这将被忽略,并且在这种情况下不会对
数据
进行任何更改(即,10分钟
的
日期时间间隔是平均
的
,但6小时<e
浏览 13
提问于2019-10-14
得票数 0
1
回答
Pandas
第N个最后一行切片
、
我希望对多个
数据
帧进行切片,以从每个df
中
获取(比方说)最后第五行
数据
。根据采样
数据
的
持续时间,每个df具有不同
的
长度。例如,df是264行,另一个是237行。我目前可以看到一种使用两步过程获得结果
的
方法,其中第一步获得尾部,然后我可以从那里
提取
第一行,但我认为可能会有更好
的
方法。我当前
的
第一步是df = data.iloc[-5:,2:128:2],然后我可以简单地删除其中
的
第一行,为我想要<em
浏览 41
提问于2020-09-14
得票数 1
回答已采纳
1
回答
带堆叠模型
的
熊猫
数据
、
我在一个ML项目中工作,我想预测足球比赛
的
最终结果。有三个输出类别:本地赢,领带,游客赢。为了做到这一点,我使用堆叠模型。首先,我想预测一支球队是否会赢(1/0),并在最后
的
模型中使用这个输出作为输入,有三个输出类别。我
的
问题是,我有一个匹配
数据
库(假设有400场比赛,每个比赛都有一个match_id),从那里,我组成了一个队(有800个队,因为每场比赛有两个队,所以两个样本将有相同
的
match_id)。一旦完成,我想回到我
的
原始
数据
库,但添加两个新列与我刚才
浏览 0
提问于2022-10-30
得票数 1
2
回答
朱莉娅
中
数据
帧
的
多级
索引
?
、
、
我能知道如何在Julia
中
对
数据
帧应用多层次
索引
吗
?或者是否有其他方法、方法
或
一揽子措施来实现这一目标。更新import
numpy
as nparrays = [np.
array
(["bar", "bar", "baz", "baz","foo", "foo", &
浏览 5
提问于2021-04-14
得票数 1
回答已采纳
1
回答
如何计算Pearson相关矩阵而只保留重要值?
、
、
、
、
例如,from scipy.stats.stats import pearsonr 我想知道是否有更简单
的
方法。我知道在
Pandas
中
,我可以在一行
中
创建相关矩阵C: import
pandas
浏览 1
提问于2019-12-19
得票数 2
回答已采纳
2
回答
如何在python中使对象成为
dataframe
、
、
我已经实现了以下部分代码:它应该是由从先前导入
的
数据
集中
提取
的
两个向量组成
的
数据
帧。我使用参数i,因为这段代码是循环
的
一部分,循环使用一个预定义
的
函数来分析一个固定变量[0]和其他变量之间
的
相关性-每次迭代都会检查与不同变量[i]
的
相关性。当我将括号改为四舍五入时,Python将此对象视为列表
浏览 1
提问于2019-07-09
得票数 0
1
回答
如何将python并行计算(ipython-并行
或
多处理)
的
结果输出给熊猫
数据
?
、
、
、
、
简单问题:我读过
的
所有教程都向您展示了如何使用ipython.parallel
或
多重处理将并行计算
的
结果输出到列表(
或
至多是字典)。
你
能给我举一个简单
的
例子,用两个库将计算结果输出给共享
的
熊猫
数据
吗
?
浏览 3
提问于2015-05-21
得票数 2
1
回答
查找多个系列中低于
阈值
的
元素
我有许多时间序列(10,000个
数据
点各有3到10,000个
数据
点),每个时间序列都有一个不同
的
阈值
。我需要知道哪些值包含低于
或
超过
某个
阈值
的
值。我知道我可以将
数据
加载到
Pandas
DataFrame
中
,然后比较每个
数据
点,如下所示: COL_NAME, COL_THRESHOLD = 'Name', 'Threshold'
浏览 6
提问于2022-11-15
得票数 0
3
回答
如何在python
中
拆分空格和以下字符
、
、
、
我正在使用
pandas
,试图通过将列(团队)分成Home和Away来实现文本到列
的
转换,但我得到了以下错误: "ValueError: Columns must be same length as key
浏览 0
提问于2020-03-31
得票数 1
1
回答
有没有一种方法可以从这个特定
的
字典创建一个多
索引
数据
帧来维护
数据
的
完整性?
、
、
、
、
我有以下字典,我希望将其转换为多
索引
(在列上)
DataFrame
: fdict = {}fdict['banana'] = {} 'banana': {'light_yellow': 10}, 'appraisal round': 1} 我已经成功地将它转换为我想要
浏览 35
提问于2020-01-30
得票数 0
1
回答
从多
索引
Pandas
DataFrame
中导出/writing到Excel标签
、
、
、
我想通过第一个
索引
'0‘将多
索引
数据
帧拆分/切片为第一个
索引
的
每个级别的
数据
帧(例如,下面将有4个
数据
帧)。然后,我想将每个
数据
框导出到EXCEL
中
的
单独选项卡
中
。我希望得到帮助
的
最重要
的
问题是如何编写循环
或
列表理解,将多
索引
数据
帧拆分成单独
的
数据
帧。示例
浏览 17
提问于2019-01-27
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
12种高效Numpy&Pandas使用技巧!
8,二维dataframe——类Series操作
Python中使用数组(Array)给列命名的方法
9,二维dataframe——类array操作
7,一维Series
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券