腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
根据
相似
度
矩阵
对
大量
字符串
进行
聚
类
?
、
我需要
根据
500K+
字符串
的
相似
性
对
其
进行
聚
类
。 我已经计算了它们成对的Levenshtein距离,并制作了一个稀疏
相似
矩阵
。此
矩阵
包含二进制
相似
性:较小距离的值设置为1.0,其他距离的值为0.0。 我不知道什么样的集群
对
我有好处。我事先不知道
聚
类
的数量,但它可能相当大,因为
相似
度
矩阵
非常稀疏
浏览 38
提问于2021-01-14
得票数 0
回答已采纳
2
回答
当在Scikit的光谱
聚
类
中使用预先计算的亲和力
矩阵
时,KNN?
、
、
、
、
我有一个
相似
度
矩阵
,我计算了
大量
对象之间的
相似
度
,每个对象可以与任何其他对象具有非零的
相似
度
。我为另一个任务生成了这个
矩阵
,现在想
对
其
进行
聚
类
以
进行
新的分析。看起来方法可能是一个很好的选择,因为我可以传入一个预先计算的亲和
度
矩阵
。我还知道,在构建亲和
度
矩阵
时,谱
聚</
浏览 1
提问于2016-10-20
得票数 0
3
回答
基于距离
矩阵
的词
聚
类
、
、
、
我的目标是
根据
单词与文本文档语料库的
相似
度
对
单词
进行
聚
类
。我已经计算了每对单词之间的Jaccard
相似
度
。换句话说,我有一个可用的稀疏距离
矩阵
。有没有人能给我介绍一些以距离
矩阵
作为输入的
聚
类
算法(可能还有它的Python库)?我事先也不知道集群的数量。我只想
对
这些单词
进行
聚
类
,并获得哪些单词聚
浏览 0
提问于2013-04-27
得票数 24
1
回答
如何
使用K-medoid算法
根据
不确定数据的概率分布
相似
性
对
其
进行
聚
类
?
什么是不确定数据
聚
类
?
如何
根据
不确定数据的概率分布
相似
度
对
其
进行
聚
类
?
如何
根据
不确定数据的概率分布
相似
度
使用K-medoid算法
对
不确定数据
进行
聚
类
?
浏览 0
提问于2013-09-27
得票数 0
1
回答
scikit通过预计算学习谱
聚
类
亲和力
、
、
我有一个
相似
度
矩阵
,它考虑了80个用户中每两个用户之间的
相似
度
。我想
根据
这个
相似
度
矩阵
对
用户
进行
聚
类
。label = SpectralClustering(n_clusters=5 ,affinity='precomputed').fit_predict(lena) 这是调用
相似
度
矩阵
并获得
浏览 5
提问于2015-12-10
得票数 0
2
回答
从
相似
矩阵
执行
聚
类
、
、
我计算了每个向量之间的
相似
度
分数,并将其存储在一个
相似
矩阵
中。我想
根据
这个
相似
矩阵
对歌曲
进行
聚
类
,以尝试识别集群或某种类型的歌曲。我使用networkx包从
相似
矩阵
中创建了一个力有向图,使用了弹簧布局。然后,我将KMeans
聚
类
用于该图中节点的位置,这就产生了有意义的集群。我也尝试在
相似
矩阵
上运行谱
聚<
浏览 0
提问于2021-04-15
得票数 1
1
回答
相似
度
矩阵
的
聚
类
技术
、
、
我想
根据
他们选择的功能创建不同用户组的集群。我在这些二进制数据上尝试了一些
聚
类
算法,比如模糊
聚
类
和层次
聚
类
,但它没有给我任何好的结果,而且创建的
聚
类
真的很糟糕。因此,现在我已经将骰子系数
相似
度
矩阵
应用于数据w.r.t响应者,这基本上给出了每个响应者与所有其他响应者的
相似
度
得分。是否有可能在这个
相似
度
矩阵
浏览 5
提问于2017-03-07
得票数 0
1
回答
什么是光谱
聚
类
?
什么是光谱
聚
类
?我几乎没有统计学的背景。我试着在网上搜索笔记,但他们假设了很多知识。 如果你能在网上找到一些关于光谱
聚
类
的基础知识和数学基础的笔记,那就更好了。
浏览 0
提问于2018-06-21
得票数 4
3
回答
python中的单词
聚
类
列表
、
、
、
假设我有一个单词列表'car','dog','puppy','vehicle',我想把单词
聚
成k组,我希望输出是['car','vehicle','dog','puppy']。我首先计算每个成对单词的
相似
度
得分,得到一个4x4
矩阵
(在本例中) M,其中Mij是单词i和j的
相似
度
得分。在将单词转换为数字数据后,我利用不同的
聚
浏览 19
提问于2017-01-31
得票数 5
1
回答
聚
类
中的
相似
矩阵
、
、
我正在编写一种
聚
类
算法,这在这中得到了解释。
根据
本文提出的算法,该算法通过结构
相似
度
和属性
相似
度
进行
聚
类
。 在使用属性
相似
性
进行
聚
类
时,我有问题。我认为,首先用结构
相似
性
聚
类
,然后在顶点之间用属性
相似
度
划分
聚
类
。但是,我不
浏览 0
提问于2016-12-08
得票数 -4
1
回答
聚
类
算法
、
、
我有稀疏向量,并且发现余弦
相似
度
是度量
相似
度
的有效方法。现在我想
根据
相似
性
对
这些向量
进行
聚
类
。因此,有人能建议/推荐使用余弦
相似
性的
聚
类
算法吗? P.S.:我没有预先定义好的簇数,而是希望
聚
类
算法自己来决定它。
浏览 0
提问于2017-07-03
得票数 0
回答已采纳
1
回答
在通过networkx生成的图上使用scikit学习
进行
谱
聚
类
、
、
、
、
我有一个3000x50特征向量
矩阵
。我使用sklearn.metrics.pairwise_distances获得了一个
相似
度
矩阵
,名为' similarity _ matrix‘。现在,我使用上一步生成的
相似
度
矩阵
G=nx.from_numpy_matrix(Similarity_Matrix),使用networkx创建了一个图。我现在想在这个图G上执行光谱
聚
类
,但几次谷歌搜索都未能在这个图上提供一个像样的scikit学习
浏览 13
提问于2014-05-16
得票数 5
1
回答
CLUTO
聚
类
时输入数据的数据预处理
、
、
、
我正在尝试
根据
一些单词(两个单词之间)的
相似
度
对
它们
进行
聚
类
,我的数据的一部分如下所示(它只是一个例子"animal.txt",它与邻接
矩阵
相似
)。2horse 3 1 5 4数字越大,表示两个单词之间的
相似
度
越高基于这种格式的数据,我想做
浏览 3
提问于2013-12-28
得票数 0
1
回答
基于亲合传播的
聚
类
doc2vec
、
、
、
、
我希望使用关联传播对文档向量(doc2vec)
进行
聚
类
。使用余弦
相似
性来
聚
类
我的doc2vec文档向量正确吗? 此外,我希望使用to可视化我的集群结果。然而,我看到t-sne需要距离
矩阵
作为输入。因此,我的第二个问题是;
浏览 0
提问于2018-01-04
得票数 1
1
回答
当我使用余弦
相似
度
时,为什么我得到的邓恩指数是负值?
、
、
、
我使用k-means
对
归一化数据
进行
聚
类
。我使用了不同的
相似
度
矩阵
,如欧几里得、曼哈顿和余弦,当我使用余弦
相似
度
时,Dunn指数为负值。我读到过邓恩指数的取值范围从0到无穷大。使用余弦
相似
度
计算Dunn指数是正确的吗? 我用过this implementation of Dunn Index。
浏览 94
提问于2019-06-12
得票数 1
回答已采纳
1
回答
为什么降维能提高电影海报的无监督
聚
类
性能?
、
、
、
、
我正在写一篇论文,试图
根据
电影海报的视觉特征
对
它们
进行
聚
类
。我们的目标是将看起来类似的电影海报聚集在一起。这些特性存储在一个带有尺寸的
矩阵
中(#电影海报,25088)。 我将使用的
聚
类
算法是K-均值,我已经用剪影系数评估了<
浏览 1
提问于2018-10-30
得票数 0
2
回答
给定每天只有事件ID标签(字母
字符串
)的事件序列,什么算法可以用来检测异常值序列?
、
、
、
、
补充问题:是否可以使用群集?我该怎么做?给定一个部分序列,我
如何
预测事件序列的其余部分? 我很感激你的意见。
浏览 0
提问于2022-03-31
得票数 1
回答已采纳
1
回答
相似
度
矩阵
聚
类
、
、
我尝试对文本数据
进行
聚
类
,数据清晰,标记化等。我
如何
在Kmeans或其他
聚
类
模型中输入
相似
度
矩阵
?
浏览 3
提问于2020-09-01
得票数 0
1
回答
文档间n*n
相似
度
的doc2vec
聚
类
、
、
我希望
对
想要生成n*n
相似
度
矩阵
的
相似
文档
进行
聚
类
,我可以在该
矩阵
上运行我的
聚
类
算法。 我使用gensim.similarities尝试了这个链接的指令,但是500k记录的输出是500k*150
矩阵
。
浏览 0
提问于2017-11-08
得票数 1
1
回答
基于多词
相似
度
的
聚
类
、
、
、
我正在尝试实现
对
银行事务数据的群集。数据集包含关于Vendor和MCC的列,它们是string。这些列中有太多不同的值,我想
根据
一些指标(如cosine similarity for Vendor or MCC )
进行
集群。(例如,'Hotel A'和'Hotel B'可以在同一个集群中。)我考虑为MCC找到一个语料库,并建立一个模型来查找单词之间的
相似
性。这个方法
对
这个问题有好处吗?如果没有,我
如何
处理这些列?如果是,是否有这样的语料库? 数据源
浏览 4
提问于2020-08-08
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python 谱聚类算法从零开始
数据分享|R语言谱聚类社会化推荐挖掘协同过滤电影社交网站Flixster数据集应用研究
MATLAB用改进K-Means(K-均值)聚类算法数据挖掘高校学生的期末考试成绩
云平台 | 怪不得越来越多的人都去使用这几款小工具了
菜鸟入门数据挖掘的必备知识
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券