据我所知,大多数常见的异常检测算法(例如,OneClass支持向量机)需要估计数据集中异常的百分比;例如,1%,0.1%等。然后它列出前1% (或0.1%,等等)。从输出中获得最高分数,并将其归类为异常。在某些情况下,可能无法准确估计百分比。
是否有不需要预先确定的异常率的算法?
发布于 2020-02-26 06:10:51
您可以尝试使用IsolationForest并设置contamination=0.0
。另一种选择是Autoencoder with reconstruction error。在这两种情况下,假设在您的训练集中几乎没有异常。您应该查看您的异常得分,并根据您的要求设置阈值。
https://stackoverflow.com/questions/59777685
复制相似问题