腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
从
数据
集中
检测
和
丢弃
离群
值
、
我需要
检测
数据
集中
的所有异常值并删除它们。我已经成功地通过IQR
和
Z得分定位了异常值,并最终得到了一个真
和
假的列表。这很好,只是我不知道如何访问显示为False的特定行来定位异常
数据
的确切行,以便将其
从
数据
集中
删除。我已经在网络上搜索了几个小时,堆栈溢出,我只是完全被困在这个问题上。任何帮助都是非常感谢的。错误: IndexingError:作为索引器提供的不可对齐的布尔级数(布尔级数
和
索引对象的索引不匹配).ent
浏览 24
提问于2020-09-13
得票数 0
1
回答
如何替换时间序列分析中的异常
数据
?
、
、
我应用了隔离森林算法来识别我的时间序列中的异常
数据
。现在,我想在将这些
离群
值
送入机器学习模型之前替换它们。我们如何在时间序列分析中替换这些异常值?
浏览 9
提问于2021-07-23
得票数 0
4
回答
为异常值标记创建一个新变量
、
因此,我正在对给定的
数据
集进行异常值
检测
。顺便说一句,这是在R中完成的。Var1 Var2dsa 15aas 9dd
浏览 3
提问于2016-10-26
得票数 1
回答已采纳
2
回答
sklearn:利用隔离林进行异常
检测
、
、
我有一个没有异常值的训练
数据
集:(588649, 896)print(np.count_nonzero(y_pred_train == -1)) 588649 58878y_pred_test = clf.predict(test_vectors)
浏览 7
提问于2017-07-12
得票数 0
回答已采纳
2
回答
在使用scikit-learn时,获取每个新的观测
值
为异常值的概率
、
我对一般的科学学习
和
支持向量机方法都很陌生。我已经让我的
数据
集在scikit中很好地工作--学习OneClassSVM以
检测
异常值;我使用观察来训练OneClassSVM,所有这些都是“不稳定
值
”,然后使用predict()在我的测试
数据
集上生成二进制的inlier/
离群
值
预测。然而,为了继续我的分析,我想得到与我的测试
集中
的每一个新的观察相关联的概率。与每一次新观测相关联的
离群
值
的概率。我注意到了scik
浏览 3
提问于2015-02-08
得票数 2
3
回答
使用无监督的隔离森林,如何
从
异常分数中识别出最佳的
离群
点数量?
、
我正在使用一个无监督的隔离林算法
和
计算异常分数从一个二维玩具
数据
集中
检测
出异常值。
从
散点图中,我能够
检测
/可视化异常分数最高的
数据
点(例如:
数据
中的前10位或前15位异常值)作为我的异常值。异常值的数量是否主观地决定了用户的决策(例如: 0.5>S>1的异常分数是一个异常值,所有小于0.5的事物都不是),还是有一种方法可以根据异常分数来
检测
出最优的
离群
点数量? 📷
浏览 0
提问于2019-04-09
得票数 4
1
回答
异常值
检测
-缺失
值
、
我面临一个
数据
科学挑战,其中提供了两个
数据
集,第一个
数据
集包含数天的天气
数据
(温度、风速
和
降水),另一个
数据
集包含同一天的飞行信息(飞行时间
和
乘客人数)。飞行
数据
集可以包含同一天的多个航班。首先,我们被要求合并这两个
数据
集。因此,天气
数据
值
可以重复,因为同一天可以有多个航班。我有几个关于
离群
点
检测
的问题: 由于许多天气
数据
值
将在
浏览 0
提问于2022-01-15
得票数 0
1
回答
在拟合凸包前除去孤立点
、
、
我有一些
数据
集,我想用凸包可视化(并从凸包中得到一些统计
数据
)。但是,每个
数据
集都包含一些噪声。因此,凸包不仅覆盖了主
数据
云中的点,而且覆盖了所有的异常点,使得凸包的面积很大,而且
数据
集之间的差异不大。
数据
集的一个例子如下:整个区域不是单峰,但我们肯定可以观察到一些异常点(特别是在左边),它扰乱了凸包的形状。估计的KDE如下: 因此,我想移除那些
离群
点。用什么算法可以将最小面积凸包拟合成
数据
集中
的n-k点,其中k被设
浏览 1
提问于2019-08-20
得票数 0
3
回答
是否可以测试DBSCAN聚类算法?如果是,怎么做?
、
、
、
、
我想使用DBSCAN clustering algorithm来
检测
数据
集中
的异常值。由于这是一种无监督的学习方法,我是否需要在培训
和
测试
数据
中拆分
数据
集,还是不可能测试DBSCAN algorithm?出于
离群
点
检测
的原因,我是否应该向DBSCAN model提供整个
数据
集?
浏览 1
提问于2019-08-02
得票数 0
回答已采纳
1
回答
孤立点
检测
的邻域计算
、
、
、
、
我正在使用R编程语言,并试图了解用于异常值
检测
的以下函数的细节: 这个函数(来自"dbscan“库)使用本地
离群
值
因子(LOF)算法计算异常值:。LOF算法是一种无监督的、基于距离的算法,它定义了
数据
集中
相对于观测的“可达性
和
邻域”的异常值。一般说来,相对于邻里的其他观测而言,“很难到达”的观测被认为是一个“
离群
点”。基于这些属性(用户指定这些属性,例如邻域(由“k”表示)可以是"3"),该算法为
数据
集中
浏览 7
提问于2021-02-22
得票数 0
3
回答
哪些算法或方法可用于
从
该
数据
集中
检测
异常值?
、
假设我有一个
数据
集:Amount of money (100, 50, 150, 200, 35, 60 ,50, 20, 500)。我让谷歌,网络寻找技术,可以用来寻找一个可能的
离群
点在这个
数据
集中
,但我结束了困惑。PS:假设
数据
不服从正态分布。谢谢。
浏览 0
提问于2015-10-31
得票数 8
回答已采纳
1
回答
在Sklearn Outlier Detection methods中将‘Detection’参数设置为'auto‘会做什么?
、
、
、
、
我有一个
数据
集,我需要能够在多大程度上控制
离群
值
检测
模型(孤立森林,椭圆包络,OneClassSVM...)将给定点视为异常值或非异常值(类似于Z分数或IQR分数)。这意味着我不想预先指定
数据
集中
离群
点的百分比,更为人所知的是contamination参数,但我希望这个百分比取决于我希望我的模型有多“挑剔”。
浏览 31
提问于2020-07-24
得票数 3
回答已采纳
1
回答
生成仅由大型
数据
集的
离群
值
组成的
数据
帧
、
、
我不是试图
从
数据
集中
删除
离群
值
,而是尝试创建一个新的
数据
框架,该框架仅由其中包含异常值的行组成。Outliers <- Sample[((Sample$x - Sample$Averages)/Sample$StDevs) > 2.00,] 此过程正在运行我
从
<
浏览 3
提问于2014-02-21
得票数 0
回答已采纳
2
回答
利用局部
离群
因子得分
检测
运行时异常值
、
、
我使用LOF (局部
离群
系数)来
检测
数据
中的异常值。我得到LOF分数作为
离群
点的距离。这种无监督的学习无助于在运行时
检测
出
离群
点。所以我想用我的
数据
点
和
LOF分数来建立一个有监督的回归/分类模型。我的问题是,哪一个应该
从
在运行时,如何使用任何聚类/异常
检测
(使用群集)?
浏览 0
提问于2018-05-18
得票数 1
1
回答
概率/频率分布中的孤立点
检测
、
、
、
、
我有二维
数据
集。(X
和
Y)都是连续随机变量。Z= (X,y) = {(1,7),(2,15),(3,24),(4,25),(5,29),(6,32),(7,34),(8,35),(9,27),(10,39)} 我想
检测
有关y变量的
值
的异常值。Y变量的正常范围是10-35.因此,上述
数据
集中
的第1对
和
最后对是
离群
值
,其他则是正常的巴黎。我想把变量z= (x,y)转化为异常值(第一对
和
最后对)在标准差1之外的概率
浏览 2
提问于2013-12-05
得票数 0
回答已采纳
3
回答
文本
数据
集中
的异常值指的是什么。如何发现他们?
我知道
数据
中存在异常值,但它们的行为与其他
数据
点有很大不同。但是今天,他们在学习朴素贝叶斯的同时,也提到了朴素贝叶斯会受到
离群
点的影响。但是,
数据
集中
的哪些点被称为
离群
值
,我们如何识别它们?
浏览 0
提问于2019-07-01
得票数 2
1
回答
IQR异常值
检测
背后的逻辑
为什么我们使用IQR来
检测
数据
集中
的异常值,该方法背后的逻辑是什么?还有其他方法来
检测
异常值吗?
浏览 0
提问于2022-01-04
得票数 0
1
回答
R指挥官有不在
数据
集中
的异常值
、
、
、
我已经在R指挥官中创建了一个盒子图,它用一些不在
数据
集中
的异常值生成。
数据
集中
的最高
值
是20.5,但它表示有高达572的
离群
值
。
浏览 7
提问于2022-08-24
得票数 1
2
回答
如何使用箱线图将生成的已移除异常值应用于
数据
集
、
日安,outliers <- boxplot(dataset, outline=FALSE); 现在,由于
离群
值
变量具有所有信息,我如何在
数据
集上应用删除
浏览 0
提问于2017-05-04
得票数 0
2
回答
去掉不合逻辑的观察,我能做吗?
所以我的
数据
有一些不合逻辑的条目,在下面的图片中你可以看到一个在公司工作了11年的人,他拿了100美元,这肯定是错误的,应该删除对吗?我是否应该根据服务年限
和
薪水来消除这些糟糕的观察结果呢?或者我应该保留它们,它们是正常的吗?
浏览 0
提问于2021-10-06
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
怎样识别数据集中的异常值
浅谈离群点检测方法及其应用
任昱衡:去腐生肌,说说大数据中的异常数据删除
大数据分析数据清洗的价值和意义
通过SketchRNN、PCA和t-SNE从Google QuickDraw数据集中显示矢量图的潜在空间
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券