首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >OPTICSXi - ELKI ResultWriter

OPTICSXi - ELKI ResultWriter
EN

Stack Overflow用户
提问于 2013-12-03 17:21:07
回答 2查看 652关注 0票数 2

我使用ELKI以分层的方式使用OPTICSXi对地理位置数据集进行聚类。该算法的执行结果是一组文件。

文件的内容可以是:

代码语言:javascript
运行
复制
# Cluster: nameOfCluster
# OPTICSModel
# Parents: nameOfParents (this element doesn't exist for the root cluster)
# Children: nameOfChild_0, nameOfChild_1 ... nameOfChild_n, (optional) 
ID=1 lat0 lon0 reachability=?
ID=3062 lat1 lon1 reachability=1.30972586 predecessor=1
ID=7383 lat2 lon2 reachability=2.56784445 predecessor=3062
ID=42839 lat3 lon3 reachability=4.05510623 predecessor=1

我不明白每个文件中的元素(在示例中有四个元素)是属于同一个集群,还是属于不同的集群。在后一种情况下,我需要编写一些构建集群的代码(例如查看每个节点的前身),或者可以在Elki中指定一些参数来获取每个集群?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2013-12-03 20:32:43

默认情况下,ELKI将生成一个目录,其中包含每个集群一个文件。除非输出文件已经存在,否则在这种情况下,您将得到写入同一个文件的所有集群,如上面所示,以注释分隔。

但是,使用分层结果(如OPTICSXi ),您还应该将子集群的所有成员也视为父集群的一部分。这些是嵌套在父级中的集群。它们不会在父级中重复,以减少输出中的冗余。

OPTICSXi输出与OPTICS输出进行比较。Xi方法所做的是,根据可达距离的突然下降,为您拆分数据。西安的所有星系团都应该是原光学团簇顺序的子序列。

在您的示例中,如果集群只有4个元素,则可能选择minPts太小。(尽管如此,您可能已经截断了该文件,或者您可能在子集群中有很多元素;因此输出可能很好)。

还要注意,通常需要验证集群的第一个元素是否属于集群;类似地,最后一个元素。OPTICSXi倾向于在第一个元素上出错,但不是以一种系统的方式进行修复。第一个也是最后一个元素是那些将差距从一个集群连接到另一个集群的元素。您确实应该手动验证这些(这是选择minPts太小的一个很好的理由)。

我强烈建议为您的特定用例构建/使用可视化。然后,您可以将这样的集群加载到可视化中,并直观地检查结果对您是否有意义。我在地理数据上使用了OPTICSXi,对我来说效果很好。

票数 2
EN

Stack Overflow用户

发布于 2013-12-04 09:40:56

所以,如果我已经很好地理解了,在上面的例子中,集群是由元素ID=1, ID=3062, ID=7383, ID=42839, and all the elements in nameOfChild_0, nameOfChild_1 ... nameOfChild_n组成的。也许,我不必加入根元素中的子元素,因为我想我将获得一个包含所有地理位置的独特的大集群,实际上我有903个子元素和18795节点(ID)。

我做了很多测试,选择了minPoint = {2,5,10}xi = {0.1, 0.01, 0.001, 0.0001, 0.00001, 0.000001}。我使用我的集群可视化,但我找不到一个好的结果。我遇到了很多麻烦。

感谢您的答复,我理解我对元素的拆分太多了,因为对我来说,每个文件都是一个集群,因此我不考虑父元素中的子元素,但我认为它们是分开的集群。

此外,我注意到第一个和最后一个元素有时是错误的,我想验证这些元素是集群中至少一个元素的前身,还是集群中至少有一个元素是这些元素的前身。这有道理吗?

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/20357625

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档