斑点鱼最近在学《白话大数据与机器学习》,刚学完聚类一章节,整理了下KMEANS算法实例,跟大家分享哈~~
注:三维聚类的图斑点鱼还不会画,有大神看到并且会的话,记得联系斑点鱼,么么哒~~(づ ̄ 3 ̄)づ
附code:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
%读取数据
import os
os.chdir('C:\Users\E440\Desktop\PythonStudy')
os.getcwd()
X= pd.read_csv('input/userid2.csv')
X.head()
X=X.dropna()
x2=X.loc[:,['staytime','bounce','page']]
x2=X.loc[:,['staytime','bounce']]
#转换成numpy array
x2=np.array(x2)
#聚成5类
n_clusters=4
cls=KMeans(n_clusters).fit(x2)
cls.labels_#X中每项所属分类的一个列表
X['cluster']=cls.labels_
#画图
markers=['^','x','o','*']#,'+''
for i in range(n_clusters):
members=cls.labels_ == i
plt.scatter(x2[members,0],x2[members,1],s=60,marker=markers[i],c='b',alpha=0.5)
plt.title('')
plt.show()
X.to_csv('output/userid.csv')
一起学习的小伙伴如果有什么想法或者意见,欢迎沟通~
领取专属 10元无门槛券
私享最新 技术干货