腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
R:用离散小波变换比较新陈代谢模型之间
的
差异
、
、
、
每个模型都有一组代谢物及其在200个时间点
的
浓度。我正在对这些模型进行比较,以便根据它们
的
相似性对它们进行
聚
类
。我遵循
的
一种方法是使用欧几里德
距离
对两个模型
中
的
每个代谢物对进行成对比较。下面是我
的
数据
的
样子。这是一个。我计算了模型A
中
的
Met1
和
模型B
中
的
Met1
的
成对欧几里德
距离
浏览 4
提问于2015-08-01
得票数 0
2
回答
Python
中
基于
字符串
/
整数
序列
的
聚
类
和
距离
/
相异
矩阵
、
、
、
、
我有顾客在店里逗留
的
数据。商店有4个区域:区域1、2、3
和
4。现在每隔2分钟,我就会根据他所在
的
区域得到他
的
10个数字。例如: 1-1-1-1-1-1-1-1-3-3-23-4-1-2-2-3-1-4-2-1-4 基本上,我预计大多数客户都在特定
的
区域中,并相应地进行了集群。因此,在第一个
序列
中
,客户似乎更喜欢区域1,下一个区域3,最后一个类似于噪声。 我给程序提供
的
只是一堆
序列
(未标记<
浏览 19
提问于2019-09-09
得票数 1
回答已采纳
1
回答
在R中使用hclust进行加权观测频率
聚
类
、
、
、
我有一个包含500K观察值
的
大型
矩阵
,需要使用分层
聚
类
进行
聚
类
。由于大小,我没有计算
距离
矩阵
的
计算能力。为了克服这个问题,我选择聚合我
的
矩阵
来合并那些相同
的
观察值,从而将我
的
矩阵
减少到大约10K个观察值。我有这个聚合
矩阵
中
每一行
的
频率。我现在需要将此频率作为权重合并到我
的
分层
浏览 15
提问于2017-07-25
得票数 1
2
回答
给定每天只有事件ID标签(字母
字符串
)
的
事件
序列
,什么算法可以用来检测异常值
序列
?
、
、
、
、
Sequence N: ["DEF", "AAA", "ZZ123", "YYZZZ45", "AABBCC"]在数据集中,每天都会有数千个这样
的
序列
。补充问题: 如何计算具有这样标签
序列
的
序列
之间
的
相似性(或差异)度量?如果是这样的话,我将如何在
Python
<e
浏览 0
提问于2022-03-31
得票数 1
回答已采纳
1
回答
R:有没有一种方法可以只生成
相异
矩阵
的
热图并按
聚
类
排序?
、
、
我正在使用hclust在266个观察值
中
寻找集群。所有的变量都是绝对
的
。我正在尝试创建从daisy函数创建
的
相异
矩阵
的
热图,以可视化集群内
的
相似性。我尝试使用data.matrix(data, metric="gower")输入
相异
矩阵
,但当我这样做时,它会将
矩阵
视为数据集。函数heatmap.2 (可能有一些附加设置)在我使用
的
R版本
中
不可用。 我
的<
浏览 2
提问于2019-09-09
得票数 0
1
回答
是否可以使用分块
距离
矩阵
运行
聚
类
算法?
、
、
我有一个
距离
/
相异
矩阵
(30K行,30K列),它是在循环中计算并存储在ROM
中
的
。Mydata<-read.csv("Mydata.csv")Results<-hclust(Mydata) 但是当我将
矩阵
转换成我可以在循环/分块
中
运行hclust算法吗?我
浏览 6
提问于2018-10-28
得票数 1
1
回答
如何从diana (diana,cluster R package)输出
中
获得最优
聚
类
数?
、
我正在尝试从集群软件包
和
diana方法(使用欧几里德
相异
度)获得
的
树状图中获得最佳集群数量,如下所示: mydatad <- diana(mydata, stand = FALSE)## use factoextra and ggplot2 for visualization 然后我尝试在NbClust中使用
相异
矩阵
,对于相同
的
元素,dissim
矩阵
浏览 69
提问于2020-08-17
得票数 2
3
回答
用
python
进行文本数据
聚
类
、
、
、
目前,我正尝试使用
python
根据
序列
的
相似性对
序列
列表进行
聚
类
。DLFKFKDLD..。 我已经尝试过使用,但是收敛性有点不可预测,我想谈谈这个问题。 有人对这种情
浏览 3
提问于2021-03-31
得票数 1
回答已采纳
2
回答
R
中
的
聚
类
时间
序列
-K均值是否准确?
、
、
、
、
我
的
数据集是由105个国家(行)
的
14年(列)相同指数
的
测量结果组成
的
。我想根据这些国家随时间变化
的
指数趋势对其进行
聚
类
。我正在尝试使用DTW
距离
矩阵
(dtw包)
的
层次
聚
类
(hclust)
和
K Medoids (pam)。 我还尝试了K均值,使用DTW
距离
矩阵
作为函数kmeans
的
第一个参数。我也在考虑直接使用
浏览 7
提问于2020-03-03
得票数 0
1
回答
如何使用相关性而不是R
中
的
欧几里德
距离
来创建用于
聚
类
的
距离
矩阵
?
、
目标我所知道
的
: 我见过使用R
中
的
dist()函数使用欧几里德
距离
等创建
距离
矩阵
的
示例。我还看到相关性用于在变量(列)之间创建
相异
(或相似性度量)。我想使用相关性为数据
中
的
行创建一个
距离
矩阵
。因此,我希望使用每行之间
的
相关性,而不是dist()<
浏览 0
提问于2015-05-18
得票数 5
回答已采纳
4
回答
基于
Levenshtein
距离
的
文本
聚
类
、
、
、
、
我有一组(2k - 4k)
的
小
字符串
(3-6个字符),我想对它们进行集群。由于我使用
字符串
,以前在上
的
答案告诉我,很适合用作
字符串
的
距离
函数。而且,由于我事先不知道集群
的
数量,所以是要走
的
路,而不是k-方法。 虽然我得到了抽象形式
的
问题,但我不知道如何才能真正做到这一点。例如,MATLAB或R是使用自定义函数(Levenshtein
距离
)实现分层
聚
类
的</
浏览 4
提问于2014-02-02
得票数 37
回答已采纳
1
回答
内存问题:使用Gower
距离
和
k-medoid对R中非常大
的
多尺度数据进行聚类分析
、
、
、
我有一个非常大
的
数据帧,名为'data‘,有350000行
和
138列,我想将其用于k-medoids
聚
类
。:2)寻找最优
聚
类
数4)使用Rtsne可视化
聚
类
以可视化多维数据 该代码适用于最多10000行
的
数据子集。因此,我
的
问题不是关于编
浏览 16
提问于2017-07-25
得票数 1
1
回答
太多独特
的
序列
我有一个超过200万个
序列
的
大型数据集,其中包括大约18万个独特
的
序列
。我正在使用seqdist命令来测量
距离
,并且我最终还将尝试识别
序列
簇。下面是我得到
的
错误消息: 有没有什么方法可以设置不同
的
最大
序列
数,或者其他一些解决方法?非常感谢您
的
提前!
浏览 4
提问于2020-07-14
得票数 1
2
回答
CLARA
和
Gower用于混合数据类型
、
、
、
、
我有相当大
的
数据(1140万条记录
和
9个变量)。变量由顺序、标称
和
连续数据类型混合组成。因此,我选择Gower方法来计算
相异
矩阵
来处理混合数据类型。然而,数据
的
大小太大而无法计算。然后,我发现了另一个有趣
的
方法,称为CLARA,它使用样本来计算
聚
类
,然后将
聚
类
分配给其他数据点。问题是我找不到合适
的
度量来计算混合数据类型
的
距离
。换句话说,在clar
浏览 1
提问于2018-05-28
得票数 0
1
回答
将
距离
矩阵
传递到学习
中
的
k-均值
聚
类
、
、
、
按照
的
说法,k-指的是shape=
的
矩阵
(n_samples,n_features)。但我提供了shape=(n_samples,n_samples)
的
距离
矩阵
,其中每个索引保存两个
字符串
之间
的
距离
。时间
序列
已使用表示转换为
字符串
。 当我用
距离
矩阵
进行
聚
类
时,它得到了很好
的
结果。可能
的
原因是什
浏览 2
提问于2017-04-20
得票数 5
1
回答
如何在数据集(包括时间
序列
和
离散点变量)上执行
聚
类
?
、
、
、
、
我试图对数据集进行
聚
类
,包括时间
序列
(例如,传感器记录数秒)
和
离散值变量(例如年龄)。我已经尝试将原始变量
和
标准
聚
类
结合起来,有效地解决了时间
序列
和
离散值变量
的
问题。现在我想使用动态时间翘曲(DTW)
距离
来执行时间
序列
聚
类
,但我不确定如何将离散值变量合并起来。我
的
第一次尝试是计算时间
序列
变量
的
浏览 6
提问于2022-07-08
得票数 0
4
回答
在
Python
中
对大约100,000个短
字符串
进行
聚
类
、
、
、
我想通过q-gram
距离
或简单
的
"bag
距离
“或
Python
中
的
Levenshtein
距离
来
聚
类
大约100,000个短
字符串
。我计划填写一个
距离
矩阵
(100,000选择2个比较),然后使用进行分层
聚
类
。但我还没上路就遇到了一些记忆问题。例如,
距离
矩阵
对于numpy来说太大了。这看起来是合理
的<
浏览 8
提问于2010-11-22
得票数 15
1
回答
如何将余弦
距离
矩阵
用于均值移位、DBSCAN
和
光学等
聚
类
算法?
、
、
、
、
我试图比较不同
的
聚
类
算法对我
的
文本数据。首先计算了余弦
距离
矩阵
(余弦相似度).然后用这个
距离
矩阵
进行K均值
和
层次
聚
类
(ward
和
树状图).我想用
距离
矩阵
来表示平均位移、DBSCAN
和
光学.下面是显示
距离
矩阵
的
代码
的
一部分。sklearn.metrics.pa
浏览 0
提问于2020-03-05
得票数 2
2
回答
在R
中
执行
基于
向量
的
聚
类
的
函数和数据格式
、
、
、
、
我需要对数据行向量
的
相关性运行
聚
类
,也就是说,我打算使用数据行之间变量向量之间
的
相关性,而不是使用单个变量作为
聚
类
预测器变量。 在R
中
是否有一个
基于
向量
的
聚
类
函数。如果不是这样,我需要手动完成,什么是正确
的
数据格式,以馈入一个函数,如cmeans或kmeans?假设我有m个变量
和
n个数据行,m个变量构成每个数据行
的
一个向量。所以我有一个n×n<e
浏览 0
提问于2012-03-07
得票数 0
1
回答
使用预定义
的
距离
/相似
矩阵
进行r数据
聚
类
、
、
、
、
提出了一种新
的
文档相似度度量(一种计算文档间相似度/
距离
的
方法)。我要知道这个措施有多好?
聚
类
是一个
基于
距离
/相似性度量
的
应用程序。因此,我决定在不同
的
数据
聚
类
算法
中
评估所提出
的
测度
的
有效性。我读过关于
的
文章。假设我有一个文档集合D,它包含n文档,组织在k集群
中
。我想评估我
的</e
浏览 0
提问于2014-02-19
得票数 0
回答已采纳
点击加载更多
相关
资讯
MATLAB用改进K-Means(K-均值)聚类算法数据挖掘高校学生的期末考试成绩
《数据挖掘:概念与技术》笔记
16s分析之PCoA分析学习笔记
【机器学习与数据科学全领域速查表】
数据挖掘干货总结(四)-聚类算法
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券