我正在努力寻找天气相关数据中的统计异常值。更具体地说,我有在特定时间记录温度的10000个数据点的温度和位置(经度和纬度)。定位与地理天气相关的异常值并以异常值主要可见的方式可视化数据的最佳方法是什么?对于可视化部分,python工具将是最受欢迎的,而定位离群值部分的算法或技术将是最有用的。(我在考虑集群)
发布于 2021-06-18 13:23:05
这真的取决于你将如何使用它。您确实提到了异常值,因此可以使用DBSCAN (它本质上是创建集群,而不在集群中的点被认为是异常值)。
如果你只关心哪些点是异常值,而不是哪些点是聚类的,你可以使用例如Isolation Forrest
https://stackoverflow.com/questions/68029433
复制相似问题