我正在尝试将机器学习应用于Kaggle.com数据集。我的数据集的维度是244768 x 34756。现在,在这种规模下,所有的scikit算法都不起作用。我想我会应用PCA,但即使这样也不能扩展到这个数据集。
有什么方法可以减少我的训练数据集中的冗余数据吗?我可以通过应用PCA来降维,但如果我可以应用
我有几个大的栅格,我想在PCA中进行处理(以生成摘要栅格)。我见过几个例子,人们似乎只是简单地调用prcomp或princomp。vectorfiles<-list.files() # a set of rasterspca我需要提供什么方法来提供命令才能将栅格数据转换为矢量格式?我知道有一些方法可以采样栅格并从中运行PCA,但我真的很想了解为什么