腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
首页
标签
sample
#
sample
关注
专栏文章
(665)
技术视频
(0)
互动问答
(2)
R中的聚类分析:如何确定聚类的最佳数量?
2
回答
data
、
frame
、
sample
、
集群
、
数据
习惯痛苦
看腾讯云笑笑就好
为了确定聚类方法中的最优k-聚类。 我通常使用Elbow方法伴随着并行处理来避免时间混淆。 这段代码可以像这样采样: Elbow method elbow.k <- function(mydata){ dist.obj <- dist(mydata) hclust.obj <- hclust(dist.obj) css.obj <- css.hclust(dist.obj,hclust.obj) elbow.obj <- elbow.batch(css.obj) k <- elbow.obj$k return(k) } Running Elbow parallel no_cores <- detectCores() cl<-makeCluster(no_cores) clusterEvalQ(cl, library(GMD)) clusterExport(cl, list("data.clustering", "data.convert", "elbow.k", "clustering.kmeans")) start.time <- Sys.time() elbow.k.handle(data.clustering)) k.clusters <- parSapply(cl, 1, function(x) elbow.k(data.clustering)) end.time <- Sys.time() cat('Time to find k using Elbow method is',(end.time - start.time),'seconds with k value:', k.clusters)...
展开详请
赞
0
收藏
0
评论
0
分享
为了确定聚类方法中的最优k-聚类。 我通常使用Elbow方法伴随着并行处理来避免时间混淆。 这段代码可以像这样采样: Elbow method elbow.k <- function(mydata){ dist.obj <- dist(mydata) hclust.obj <- hclust(dist.obj) css.obj <- css.hclust(dist.obj,hclust.obj) elbow.obj <- elbow.batch(css.obj) k <- elbow.obj$k return(k) } Running Elbow parallel no_cores <- detectCores() cl<-makeCluster(no_cores) clusterEvalQ(cl, library(GMD)) clusterExport(cl, list("data.clustering", "data.convert", "elbow.k", "clustering.kmeans")) start.time <- Sys.time() elbow.k.handle(data.clustering)) k.clusters <- parSapply(cl, 1, function(x) elbow.k(data.clustering)) end.time <- Sys.time() cat('Time to find k using Elbow method is',(end.time - start.time),'seconds with k value:', k.clusters)
相关
产品
热门
专栏
程序编程之旅
749 文章
29 订阅
CSDN旧文
667 文章
36 订阅
以终为始
391 文章
33 订阅
Reck Zhang
579 文章
36 订阅
数据结构与算法
1.8K 文章
135 订阅
领券