k_model = KMeans(n_clusters = 3).fit(actor_w2vec)
cluster_dict = {i: np.where(k_model.labels_ == i)[0] for i in range(k_model.n_clusters)} 我已经在word2vec矢量(3411x128)上应用了KMeans。cluster_dict包含集群标签(即0,1,2)作为关键字,索引号(1,2,3,4)作为值,使得这些值分布在三个集群之间。现在我想要可视化这些集群,所以我使用TSNE将128维向量减少到2维 n
我将我的聚类中心投影到两个主成分上,但给出的图不在我的两组数据点的正确中心位置。我的代码如下所示。有没有人看到我哪里错了?PCA很好,但是集群的一个数据点还差得很远。我要提到的是,我的质心数据点有一半是负的。我已经尝试过反pca变换,真的不确定错误是从哪里来的。任何帮助都是非常感谢的!import PCA
data