Python之用K-means聚类进行网站人群分析

文章来源：企鹅号 - 斑点鱼要成为伟大的数据分析师

斑点鱼最近在学《白话大数据与机器学习》，刚学完聚类一章节，整理了下KMEANS算法实例，跟大家分享哈~~

注：三维聚类的图斑点鱼还不会画，有大神看到并且会的话，记得联系斑点鱼，么么哒~~(づ￣ 3￣)づ

附code：

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

from sklearn.cluster import KMeans

%读取数据

import os

os.chdir('C:\Users\E440\Desktop\PythonStudy')

os.getcwd()

X= pd.read_csv('input/userid2.csv')

X.head()

X=X.dropna()

x2=X.loc[:,['staytime','bounce','page']]

x2=X.loc[:,['staytime','bounce']]

#转换成numpy array

x2=np.array(x2)

#聚成5类

n_clusters=4

cls=KMeans(n_clusters).fit(x2)

cls.labels_#X中每项所属分类的一个列表

X['cluster']=cls.labels_

#画图

markers=['^','x','o','*']#,'+''

for i in range(n_clusters):

members=cls.labels_ == i

plt.scatter(x2[members,0],x2[members,1],s=60,marker=markers[i],c='b',alpha=0.5)

plt.title('')

plt.show()

X.to_csv('output/userid.csv')

一起学习的小伙伴如果有什么想法或者意见，欢迎沟通~

相关快讯