腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
打印
数据
帧
中有
异
常值
的
列
、
我有一个
数据
帧
(250x25),其
中有
20
列
具有数值( int64和float64
的
混合)。 我想
打印
其
中有
异
常值
的
列
。df[((df < (Q1 - 1.5 * IQR)) |(df > (Q3 + 1.5 * IQR))).any(axis=1)] print(df.columns) 我通过excel发现我只有4
列
有异
常值
浏览 15
提问于2020-06-27
得票数 0
1
回答
ggplot -在图例中显示
的
额外标签
、
在运行我
的
代码时-我有x
数据
和y
数据
,以及我称之为FILLCOL
的
列
标识符。在我
的
dataframe中,我只有两个
数据
集,所以
列
FILLCOL只有两个惟一
的
标识符。然而-当我生成绘图时,一个额外
的
标签出现在图例中。感谢任何洞察力。 所以-我整个早上都在研究这个。我能够通过删除空
的
数据
单元格来解决这个问题。我猜这个问题
的
修改是如何在不修改
数据
框架<
浏览 18
提问于2020-07-19
得票数 0
1
回答
打印
散点图熊猫
的
异
常值
、
、
、
在对
数据
帧
中
的
两
列
进行散点绘制后,
数据
帧
的
最后一行显然给出了一个异
常值
,我尝试
打印
它,但这段代码总是
打印
“无异
常值
”。这看起来很简单,但不知何故,我不能理解为什么这段代码没有检测到这个异
常值
。
浏览 8
提问于2021-03-10
得票数 0
1
回答
创建自定义参数以查找pandas
数据
帧
中
的
异
常值
、
、
、
我有2个
数据
帧
是我用熊猫构建
的
。如果你看下面的图表,你可以看到我
的
两个
数据
框遵循几乎相同
的
数据
模式。当我
的
数据
超出某个参数时,我想让pandas告诉我。例如:假设我想知道x轴上
的
数据
何时低于2,或者y轴上
的
数据
何时大于4。我知道我可以让pandas使用标准偏差曲线消除异
常值
,我还可以将异
常值
打印
到excel文件
浏览 3
提问于2017-08-07
得票数 0
回答已采纳
2
回答
如何模拟R中每组有异
常值
的
分组
数据
分布
、
、
我需要模拟一个在R
中有
3
列
的
数据
帧
。dataframe应该如下所示:col3中
的
数字只是说明性
的
。重要
的
是,col1 (即第一个范畴变量)应该提供两个可能
的
值(在我
的
示例中是"A“和"B”),而col2 (即第二个范畴变量)应该显示另外两个可能
的
值(在我
浏览 2
提问于2021-12-22
得票数 -3
回答已采纳
1
回答
当自变量
列
具有特定值时,从目标
列
中移除异
常值
、
、
、
、
我有一个
数据
帧
,如下所示(点击下面的点击): df.head(10) https://ibb.co/vqmrkXb 我想要做
的
是,当day
列
的
值等于6时,从目标
列
(occupied_parking_spaces,而不管自变量是什么,但我只想从occupied_parking_spacs
列
中删除异
常值
,例如,其中
的
day值等于6。我可以做
的
是创建一个不同
的
数据</
浏览 28
提问于2019-09-17
得票数 0
回答已采纳
1
回答
使用函数返回R中分组
数据
的
转换
数据
、
、
、
我有一个包含多个分组
的
大型
数据
集。我已经创建了一个函数,它返回没有任何异
常值
的
数据
。因此,如果您有100个观察值,它将用NA填充离群值,并返回100个观察值。)我有一个包含两
列
的
数据
帧
,其中包含分组变量(例如,男性/female已就业/失业)。第三
列
将包含需要删除异
常值
的
实际
数据
(例如salary)。有没有什么函数可以用来返回一个
数据<
浏览 3
提问于2016-01-06
得票数 0
1
回答
使用Tukey方法python从
数据
集中检测异
常值
、
、
、
我有1,000个观测值
的
数据
框,6
列
我尝试了许多代码来检测异
常值
,但由于我
的
数据
帧
中
的
字符串
数据
类型,我面临着错误消息。
浏览 17
提问于2019-11-10
得票数 0
2
回答
测试
数据
帧
中
的
离群值
我是R
的
新手,我尝试使用一个函数来测试包含600多个变量
的
大型
数据
帧
中
的
异
常值
,除了最后两
列
之外,所有变量都是数字。我尝试了outliers包中
的
离群值函数,一次测试一
列
,最后得到了一个我无法使用
的
数值向量。有没有更好
的
方法来识别
数据
帧
中
的
所有异
常值
。
浏览 2
提问于2013-03-05
得票数 1
1
回答
我申请离群点调查
、
我使用这段代码来查找
数据
帧
中
的
异
常值
。第一
列
只是名称(这就是我跳过它
的
原因)。我发现这种方法可以检测出异常点
的
特定位置。out_ind <- which(df$col1 %in% c(out)) 但在我
的
示例中,对象"out“不是单个boxplot.stats(x)$out,因此不能运行哪个公式。我如何编写它来查找每一个
浏览 3
提问于2022-06-29
得票数 0
回答已采纳
1
回答
For循环遍历函数
的
DataFrame Python
、
、
、
、
我编写了一个函数来删除表中每一
列
的
异
常值
:(我附上了一张表
的
照片) def remove_outliers(df_in, col): return df_out 现在我想做一个"for循环“或任何其他循环,代码运行在表
的
每一
列</em
浏览 18
提问于2020-06-04
得票数 0
回答已采纳
1
回答
pandas:检测和
打印
数据
帧
中
的
离群值
、
、
、
我正在尝试识别并
打印
包含异
常值
的
数据
帧
的
行。作为一个实验,我正在考虑对
列
'xy‘下与
列
'x’下
的
类别'C‘相对应
的
6到10之间
的
所有值进行异
常值
。我不知道为什么,我
的
代码
打印
了一个空输出。
浏览 19
提问于2021-06-28
得票数 0
2
回答
如何找出哪两列有较大
的
差异/异
常值
python
、
、
、
、
我有这两个数组:(创建了两个随机示例数组)y = [8,14,26,47,44,35,23]编辑: Aplogoies。以下是
数据
框架: df = pd.DataFrame({'x':x, 'y':y})
浏览 1
提问于2021-10-01
得票数 1
回答已采纳
3
回答
如何从pandas
数据
帧
的
每一
列
中一次性检测和删除异
常值
?
、
、
我有一个有6
列
的
pandas
数据
框,我知道每个column.So中都有一些异
常值
,我有这两行代码,它几乎完成了我想要做
的
事情。但它只从
数据
帧
的
一
列
中删除了异
常值
。那么,如果我想一起删除每
列
中
的
异
常值
呢??np.random.normal(size=533)}) df = df[np.abs(df.stlines-df.stlines.mean()) <= (
浏览 0
提问于2018-08-16
得票数 7
回答已采纳
1
回答
从pandas dataframe python中删除异
常值
、
、
我有一段使用pandas创建
数据
帧
的
代码import numpy as np y = (g[0].data.f-0.704239 7.4000214 -0.825279 7.496021 这很棒,但我知道这些
数据
中有
一些我想要删除
的
异
常值
,你看不到它,但可能有300个异
浏览 5
提问于2017-08-02
得票数 3
回答已采纳
3
回答
R函数在
列
中寻找离群值
的
百分比?
、
、
我需要创建一个函数来计算
数据
帧
列
中异
常值
的
百分比。对于离群点,我指的是任何
数据
点与平均值
的
3个以上
的
标准差。 我查看了包,但这并没有将我分类,因为所有的函数似乎都面向查找异
常值
,而不是计算异
常值
。有我可以用
的
函数吗?
浏览 4
提问于2015-09-05
得票数 2
回答已采纳
1
回答
如何计算Python中所有
列
的
离群值?
、
我在Python notebook
中有
一个包含三
列
的
数据
集。似乎IQR
的
1.5倍
中有
太多
的
异
常值
。我在想如何计算所有
列
的
离群值? 如果有太多
的
异
常值
,我可能会考虑删除被视为多个特征
的
异
常值
的
点。
浏览 1
提问于2016-08-22
得票数 6
回答已采纳
2
回答
从训练
数据
中删除异
常值
、
、
、
假设我有一个pandas
数据
帧
,我使用以下内容来删除异
常值
: y = df['Label']new_df = df[(np.abs(stats.zscore(df)) < 3).all(axis=1)] 由于我不想在流程中包含'Label'
列
,如何也删除异
常值
标签?
浏览 17
提问于2020-10-01
得票数 1
回答已采纳
1
回答
0
列
0行
的
数据
框错误
、
、
我正在编写一个方法来查找异
常值
,并将它们与指示异
常值
类型
的
特殊符号一起
打印
给用户。离群值可以用两种方法计算:工程师
的
方法或Tukey
的
方法。该函数接受两个参数:一个包含一
列
随机数
的
数据
帧
和一个确定用于计算异
常值
的
方法
的
选项值。该函数将返回一个包含两
列
的
数据
框,即异
常值
的
值及其
浏览 4
提问于2013-06-14
得票数 0
回答已采纳
2
回答
使用rm.outlier函数
的
data.frame中出现错误
、
、
我有一个1488
的
数据
帧
。和400var。我正在尝试记录表中
的
所有值,然后通过命令rm.outlier使用包异
常值
,我正在尝试删除异
常值
。唯一
的
问题是我得到了这个错误: Error in data.frame(V1 = c(-0.886056647693163, -0.677780705266081, -1.15490195998574,differing number of rows: 1487, 1480, 1481, 1475, 1479, 1478, 1483,
浏览 2
提问于2012-12-03
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
R语言Outliers异常值检测方法比较
在Python中进行探索式数据分析
如何利用 pandas 根据数据类型进行筛选?
Excel小技巧1:Excel工作表打印技巧
pandas系列学习(五):数据连接
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券