腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
尝试
创建
一个
程序
,
将
数据
集
的
离群
值
添加到
新
列表
中
(
这样
我
就可以
确定
数据
集
中有
多少
离群
值
)
、
、
、
、
我
正在
尝试
创建
一个
程序
,它根据您给出
的
数字生成
一个
数据
集
,然后根据该
数据
集
绘制
一个
直方图。
我
需要查看
数据
集中异常值的确切数量,
我
试图通过
创建
一个
包含所有非异常值
的
“干净”
列表
,然后只留下原始
数据
集数组
中
的
浏览 18
提问于2020-10-20
得票数 0
2
回答
删除后:接近最大
值
的
离群
值
,保留在R盒图中
、
在R
中
创建
了
一个
函数,该函数应该返回
一个
用NA来替换某些
数据
的
离群
值
向量,之后,
我
得到了在最大
值
附近保留
的
离群
值
:killed[x > (q[2] + intq)] <- NA 假设它是少
的
或相等
的</em
浏览 3
提问于2020-05-07
得票数 0
回答已采纳
3
回答
Python海运-如何在盒图中
确定
异常值
、
我
想知道用什么算法来
确定
海运
中
的
盒图分布
中
的
“
离群
点”。在他们
的
网站上,他们简单地说:
我
真的很想知道他们用了什么方法。
我
从
一个
浏览 1
提问于2017-04-06
得票数 11
回答已采纳
1
回答
多变量
离群
点
的
剔除
、
、
问题 友好
的
用户在这里注意到,
我
需要
的
可能是异常值。
浏览 2
提问于2017-07-24
得票数 4
回答已采纳
1
回答
生成仅由大型
数据
集
的
离群
值
组成
的
数据
帧
、
、
我
不是试图从
数据
集中删除
离群
值
,而是
尝试
创建
一个
新
的
数据
框架,该框架仅由其中包含异常值
的
行组成。Outl
浏览 3
提问于2014-02-21
得票数 0
回答已采纳
4
回答
在决策树
中
处理异常值和空
值
、
、
、
离群
值
:据我所知,决策树对异常值是稳健
的
。有人能证实
我
的
假设是否正确吗?(如果
我
的
特征从0到9不等,但存在
一个
值
为10000
的
异常值,那该怎么办?)它是否为这个
离群
点样本
创建
了
一个
单独
的
叶子,还是会与其他树
的
叶子合并? 空
值
:在使用决策树建立模型之前,我们需要替换空
值
吗?还是由决策树技术自动处
浏览 0
提问于2018-05-09
得票数 6
回答已采纳
1
回答
如何
将
非高斯分布转化为高斯分布?
、
、
、
假设
我
有
一个
数据
集
,其中没有几个维度
的
分布是非高斯
的
,这意味着,偏斜度是非零
的
(正
的
或负
的
)。这是由我
的
数据
中
的
一些异常值造成
的
,这些异常值不可能手动排除。现在
我
的
问题是,如何能够
将
这个
数据
集
转换成
一个
高斯(零偏斜度),
这样</em
浏览 0
提问于2019-09-03
得票数 0
回答已采纳
1
回答
如何替换时间序列分析
中
的
异常
数据
?
、
、
我
应用了隔离森林算法来识别
我
的
时间序列
中
的
异常
数据
。现在,
我
想在
将
这些
离群
值
送入机器学习模型之前替换它们。我们如何在时间序列分析
中
替换这些异常值?
浏览 9
提问于2021-07-23
得票数 0
2
回答
验证无监督二进制分类
、
、
、
我
在研究
一个
完全没有监督
的
异常检测问题。由于它完全没有监督,所以我很难定义一些度量来验证结果(
我
运行了几个算法,但最终
的
结果是二进制分类)。
我
正在考虑做
一个
Mann测试,以检查
我
标记
的
异常样本和非异常样本之间
的
显着差异。当然,这并不能告诉
我
分类是否正确,但至少
我
可以假设
我
的
分类方法将我
的
数据
分割成两个显著不同<
浏览 0
提问于2022-08-30
得票数 1
1
回答
如何随机
创建
异常
数据
集
?
、
我
正在
尝试
创建
一个
异常
数据
集
,其中包含8列,一些列包含分类
值
,另一些列包含正数值。该
数据
只包含两种类型
的
数据
点:普通
数据
点和异常值。
我
想知道您是否知道有什么工具或库,或者某些方法可以帮助我自动
创建
这种类型
的
数据
集
。
我
听说numpy有生成标准发行版
的
工具,但我认为它不能创造绝对
浏览 3
提问于2019-12-10
得票数 1
回答已采纳
2
回答
利用局部
离群
因子得分检测运行时异常值
、
、
我
使用LOF (局部
离群
系数)来检测
数据
中
的
异常值。
我
得到LOF分数作为
离群
点
的
距离。这种无监督
的
学习无助于在运行时检测出
离群
点。所以我想用
我
的
数据
点和LOF分数来建立
一个
有监督
的
回归/分类模型。
我
的
问题是,哪
一个
应该从 1)分类(取LOF评分
的
浏览 0
提问于2018-05-18
得票数 1
1
回答
良好
的
预处理
数据
集
、
、
我
注册了一门
数据
挖掘
的
研究生课程,
我
的
任务是编写
数据
挖掘预处理器
的
代码。
我
可以自由选择编程语言和
数据
集
。
我
想知道是否有人能提出
一个
很好
的
数据
集
供使用。
我
一直在浏览,
我
找到了更多
这样
的
资源。但作为
一个
初学者,
我
不
确定
浏览 2
提问于2011-10-31
得票数 3
回答已采纳
1
回答
为
数据
集中
的
每个变量提取异常值
、
、
我
有
一个
很大
的
数据
集
,
我
试图为每个变量获取它
的
离群
值
,以便过滤掉它们。> dataset$variable <- !dataset$variable %in% boxplot.stats(dataset$variable)$out 但是,对于具有多种
数据
类型
的
大型
数据</em
浏览 1
提问于2022-08-18
得票数 0
1
回答
如何下载Power
数据
集
而不发布到web
、
、
、
、
我
使用
的
是
一个
计算过
的
列,这是
一个
平均值。问题是,平均值高于可能
值
的
范围,这应该是不可能
的
。所以一定有
一个
异常值导致平均值高于可能
值
的
范围,但它不在Power BI提取
的
原始
数据
源
中
。原始
数据
源显示
的
平均值为4.1,在预期范围内。但是Power BI
的
数据
集
浏览 5
提问于2021-04-07
得票数 1
回答已采纳
1
回答
在Sklearn Outlier Detection methods中将‘Detection’参数设置为'auto‘会做什么?
、
、
、
、
我
有
一个
数据
集
,
我
需要能够在多大程度上控制
离群
值
检测模型(孤立森林,椭圆包络,OneClassSVM...)将给定点视为异常值或非异常值(类似于Z分数或IQR分数)。这意味着
我
不想预先指定
数据
集中
离群
点
的
百分比,更为人所知
的
是contamination参数,但我希望这个百分比取决于我希望
我
的
模型有多“挑剔”。这是否等同于
将
参数c
浏览 31
提问于2020-07-24
得票数 3
回答已采纳
2
回答
sklearn:利用隔离林进行异常检测
、
、
我
有
一个
没有异常值
的
训练
数据
集
:(588649, 896)from sklearn.ensemble import IsolationForestclf.fity_pred_train == 1)) print
浏览 7
提问于2017-07-12
得票数 0
回答已采纳
1
回答
删除r
中
的
异常值
、
我
有
一个
很大
的
数据
集
从
一个
excel文件(保存为csv),其
中有
审判(X)和时间(Y)。
我
知道有
一个
代码可以通过使用卡方测试代码来剔除试验
中
的
单个
离群
值
。但是,
我
希望能够删除在
数据
集
中有
异常值
的
整个列,同时
将
文件
中
的
其他
数据</em
浏览 0
提问于2012-08-03
得票数 1
2
回答
创建
一个
确定
异常值影响
的
函数
、
我
的
总体目标是演示
离群
值
在
数据
集
平均值上
的
差异。
我
正在
尝试
创建
一个
使用异常值"k“
的
大小作为输入并输出平均值
的
函数。基本上,函数需要接受任何
值
" k“(这是异常值),如果x
的
第
一个
值
被替换为k,则返回向量x
的
平均值。例如,假设
数据
浏览 26
提问于2020-09-03
得票数 0
回答已采纳
3
回答
如果本地
离群
点因素需要没有异常值
的
训练
数据
,为什么它被归类为无监督
的
?
、
在Scikit-Learn
中
,局部
离群
因子(LOF)算法被定义为一种无监督异常检测方法。 所以我不明白为什么这个算法需要预先过滤
的
训练
数据
。也许这里
的
“培训
数据
”仅仅意味着“
数据
开始?”但是SciKit- training提供
的
示例代码清楚地显示了没有异常
的
培训
数据
。这是否意味着,如果培训
数据
包含异常,该模型
将
无法工作?更重要
的
是,如何使用该算法在训练
数据
浏览 0
提问于2019-02-04
得票数 0
回答已采纳
1
回答
用极端异常值对
数据
进行规范化以进行预测
、
、
、
假设
我
有
一个
输入
值
,表示从每个时间步骤到下
一个
步骤
的
股票份额
的
变化。现在
我
想把这些
值
输入到LSTM神经网络
中
。
我
的
问题是,大多数值在-0.000001到0.000001之间,但有些
值
会上升到0.1或-0.1。如何有效地缩放
这样
的
数据
集
。
我
尝试
应用
一个
日志函数
浏览 0
提问于2020-08-22
得票数 0
点击加载更多
相关
资讯
PYTHON中用PROPHET模型对天气时间序列进行预测与异常检测
怎样识别数据集中的异常值
机器学习算法原理系列详解-机器学习基础与实践(一)-数据清洗
超棒教程!在Python中使用PyOD进行异常值检测
浅谈离群点检测方法及其应用
热门
标签
更多标签
云服务器
ICP备案
实时音视频
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券