我使用集群实现,我希望数据X形成我在算法中定义的集群数量(我相信这就是它的工作方式)。但这种行为令人困惑。
cm = FCM(n_clusters=6)
cm.fit(X)
此代码生成一个带有4个标签的图- 0,2,4,6
cm = FCM(n_clusters=4)
cm.fit(X)
此代码生成一个带有4个标签的图- 0,1,2,3
当我初始化簇号时,我期望标签0,1,2,3,4,5为6。
代码:
from fcmeans import FCM
from matplotlib import pyplot as plt
from seaborn import scatterplot as s
我建立了一个GMM模型,并使用它来进行预测。
bead = df['Ce140Di']
dna = df['DNA_1']
X = np.column_stack((dna, bead)) # create a 2D array from the two lists
#plt.scatter(X[:,0], X[:,1], s=0.5, c='black')
#plt.show()
gmm = GaussianMixture(n_components=4, covariance_type='tied')
gmm.fit(X)
我需要根据推文之间的相似性对它们进行聚类,我使用dec2vec对它们进行向量化,现在我需要一种方法来对这些向量进行聚类,而且我尝试了 this ,这对我来说不是一个很好的模型,因为我不知道集群的数量。我尝试在gensim库中使用函数相似,但是每次结果都不一样,是不正确的!那么,有什么方法可以将其聚在一起吗?