我有17k向量,每个矢量有6分,我想根据点的性质对向量进行聚类,例如。线性增长到一个簇,凸在另一个簇,凹在另一个,在另一个下降等等。做这件事的好策略是什么?我需要它来检测离群点向量。
发布于 2018-06-05 20:25:54
首先,大多数聚类方法在正确使用时都会很好。例如,具有相关性,或适当的归一化。
其次,如果你已经有模式在脑海中,使用分类。
第三,为了找出异常值,聚类并不太有帮助。因为它不够可靠。而是使用一种聪明的孤立点检测方法,如KNN,LOF,循环。
不要忘记详细的、面向问题的预处理,以便尽可能好地准备数据。
发布于 2018-08-05 08:22:35
尝试拟合几个回归模型,然后收集系数。
首先,建立简单的线性回归模型(对每个向量),收集系数。然后拟合多项式回归模型,收集模型系数,然后对比例数据或归一化数据进行拟合。
收集模型系数并对其进行聚类分析。
在R中,您可以使用broom::tidy()方法从17k模型拟合中收集模型系数。我不知道是否有一个与broom等价的python。
https://datascience.stackexchange.com/questions/32680
复制相似问题