腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
查找
数据
的
离群
值
、
、
、
我正在尝试找出具有标准差
的
秒
的
异常值。我有两个
数据
帧,如下所示。我试图找到
的
异常值与每周
的
平均值有1.5个标准差吗?当前代码在
数据
帧下面。
浏览 0
提问于2017-01-08
得票数 1
回答已采纳
1
回答
R列中某些
值
的
离群
值
离群
值
数据
Color | NumberRed | 20Green | 15 Green |只想取“绿色”数字
的
值
,然后为它们绘制并
查找
异常值。你是怎么做到
的
?
浏览 7
提问于2022-12-04
得票数 0
3
回答
查找
循环
数据
中
的
离群
值
、
我有一组
数据
,它有一个圆形刻度(角度从0到360°)。我知道
数据
集中
的
大多数值都很接近,但也有一些是异常值。我想确定他们中
的
哪些必须被淘汰。圆形刻度
的
问题如下(使用示例):data = 350,0,10是一个包含度数
的
数组。这个数组
的
绝对平均值是123.33。但考虑到它们
的
单位,350°,0°和10°
的
平均值为0°。
浏览 5
提问于2021-10-18
得票数 2
1
回答
目标变量有异常值:机器学习回归
、
、
、
我目前正在处理一个回归问题,其中目标变量有接近2000个
离群
值
,而非异常值为54000。 将80%
的
离群
点组合在列车
数据
中--得分提高
浏览 1
提问于2019-01-13
得票数 1
1
回答
如何使用Weka来
查找
基于SD
的
异常值?
、
、
我想使用Weka通过定位属性
值
来
查找
离群
值
,这些属性
值
与平均值
的
标准差超过3。我肯定有办法
的
。我已经知道如何使用InterquartileRange过滤器搜索
离群
值
--在这种情况下,这不是我想要做
的
。Weka给了我平均值和SD,所以计算出我
的
阈值是很容易
的
。我只是不知道该使用什么过滤器,搜索也没有用(我得到了更高级问题
的
答案)。
浏览 7
提问于2022-04-13
得票数 0
回答已采纳
1
回答
如果
数据
只有一个类,我们如何通过聚类方法找到
离群
值
?
、
、
我希望通过聚类找到
数据
中
的
离群
值
。我
的
意思是在聚类之后,最远
的
样本被认为是异常值。我计算出我
的
数据
只有一个类,所以在这种方式下,聚类是否有助于找到
离群
值
,或者当
数据
只有一个类时,是否有其他方法找到
离群
值
?
浏览 0
提问于2017-11-02
得票数 0
1
回答
使用using可视化异常值
、
、
我试图用three来可视化我
的
数据
中
的
异常值,看起来这些异常值看起来像是三个不同
的
集群。原始
数据
有7个不同
的
列,但我选择在二维图上绘制异常值。我预计
离群
点会聚成一个组,但我
的
图上有三个不同
的
星系团(红色点)。看到不同
的
离群
值
是正常
的
吗?例如,最左边
的
红色簇是一组特征A
的
离群
值
,中间
的<
浏览 0
提问于2021-11-17
得票数 2
3
回答
使用标准化方法处理异常值?
、
、
、
、
我有一个60列和5K记录
的
数据
集。很少有列有
离群
值
。我知道有多种方法来处理异常值。实际上,我不想放弃这些
数据
,因为它是一个异常值,因为我不确定它是一个异常值还是一个有意义
的
值
(比如收入如何被扭曲)。我确实提到了几个帖子(post1,post2),但是我想不出来 这就是标准化所做
浏览 0
提问于2019-12-26
得票数 1
回答已采纳
1
回答
预处理-去除异常值
、
我有两个文件,一个带有标签字段
的
培训
数据
和一个没有标签字段
的
测试
数据
。我在列车
数据
中绘制了一个"A“字段:看起来
离群
值
是4,5,6,应该移除。现在,在测试文件中绘制字段"A“也显示了与所显示
的
图像有些相似的结果。在这种情况下,我是否应该将4,5,6视为异常值,并将其从列车
数据
中删除,还是保留这些
数据
?任何指点都会受到赞赏。
浏览 0
提问于2020-04-25
得票数 0
1
回答
高图表:如何绘制不同方框图
的
相邻散点点
、
、
、
在上面的图像中,我有两个盒子图序列,它们各自
的
离群
点散点点。但由于这两个系列
的
数据
是相同
的
,一个盒图系列
的
离群
值
与其他盒图系列
的
离群
值
重叠。我能实现这样
的
目标,就像每个盒子
的
离群
点正好在它们下面,而不是合并成一个点。也就是说,散点点应该并排放置,就像放置盒子一样,不应该重叠。
浏览 5
提问于2017-02-14
得票数 0
回答已采纳
1
回答
ResultWriter中
的
n个异常值
、
、
我正在处理高维和大
数据
集,所以我需要从ResultWriter
的
输出中得到顶级N个
离群
值
。在elki中有一些选项可以从这个输出中得到最高
的
N个
离群
值
?
浏览 5
提问于2015-03-03
得票数 2
回答已采纳
1
回答
孤立点检测
的
邻域计算
、
、
、
、
我正在使用R编程语言,并试图了解用于异常值检测
的
以下函数
的
细节: 这个函数(来自"dbscan“库)使用本地
离群
值
因子(LOF)算法计算异常值:。LOF算法是一种无监督
的
、基于距离
的
算法,它定义了
数据
集中相对于观测
的
“可达性和邻域”
的
异常值。一般说来,相对于邻里
的
其他观测而言,“很难到达”
的
观测被认为是一个“
离群
点”。基于这些属性(用户指定这些属性,例如邻域(由“k”表示
浏览 7
提问于2021-02-22
得票数 0
1
回答
分类
数据
中
的
异常值?
、
、
、
我无法找到在分类data.My
数据
中
查找
异常值
的
解决方案,该方法由一行组成
的
cmbinations组成,我希望标记不同组合
的
异常值。在上述问题中,如所述,我不能将
数据
聚为非孤立点
数据
行和异常
数据
行组成相同
的
频率。我
的
数据
看起来是这样
的
->row1-> A B C ,Drow3-&
浏览 4
提问于2020-07-09
得票数 1
回答已采纳
1
回答
找出比r中
数据
帧
的
平均值
的
某些标准差更远
的
异常值
、
、
、
我知道要在
数据
框中
查找
满足特定条件
的
行(即,过滤
数据
)我会使用类似如下
的
代码:但是,我会去尝试寻找那些'age‘
值
与平均值
的
标准差为+或-1
的
离群
值
吗
浏览 2
提问于2017-05-06
得票数 0
2
回答
基于无监督算法
的
孤立点检测:欺诈检测
、
、
、
、
我已经设置了300,000行信用卡交易,我
的
工作是在这些
数据
集中
查找
异常值(可疑交易)。我需要返回所有看上去可疑
的
交易id
的
列表。我试过什么我想尝试一个类别的支持向量机,但我没有看到任何好
的
教程让我开始。我尝试了科学学习官方教程,但它已经添加了
离群
点,他们只是在策划它。onec
浏览 0
提问于2017-03-05
得票数 3
3
回答
文本
数据
集中
的
异常值指的是什么。如何发现他们?
我知道
数据
中存在异常值,但它们
的
行为与其他
数据
点有很大不同。但是今天,他们在学习朴素贝叶斯
的
同时,也提到了朴素贝叶斯会受到
离群
点
的
影响。但是,
数据
集中
的
哪些点被称为
离群
值
,我们如何识别它们?
浏览 0
提问于2019-07-01
得票数 2
1
回答
如何评估k-均值聚类中
的
距离?
、
例如,如果我们考虑欧几里得距离构成星系团
的
中心,如果对于相同
的
数据
集,不同大小
的
簇会发生什么?大星系团中
的
“正常”点
的
距离要高于小星团中
的
“
离群
点”。它与每个簇
的
中心/尺度欧氏距离相关吗?(然后将
离群
值
视为具有最大标度距离
的
离群
值
) 还有其他
的
距离需要考虑吗?
浏览 0
提问于2016-04-28
得票数 2
回答已采纳
3
回答
多维孤立点
的
发现
、
、
、
、
我正在处理一个非正态分布
的
数据
集。
数据
集包含成本、折扣和利润三个维度。Zscore(cost) + Zscore(profit) - Zscore(discount) 负号,因为我想找到折扣低
的
离群<
浏览 0
提问于2016-04-30
得票数 2
1
回答
离群
点
的
困惑
、
、
我无法区分
离群
点:什么时候跟性病一起去。dev.或者当我们需要用中间
值
。所以我不知道该选哪一个。 你们能帮我理解吗?
浏览 0
提问于2019-11-19
得票数 0
1
回答
IQR异常值检测背后
的
逻辑
为什么我们使用IQR来检测
数据
集中
的
异常值,该方法背后
的
逻辑是什么?还有其他方法来检测异常值吗?
浏览 0
提问于2022-01-04
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Excel查找重复值
满足条件查找最大值
Excel表格如何查找重复值
Excel高效绝技之四——3秒实现数据重复值查找
006 如何查找列表中最大或最小的值
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券