腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
基于
python
的词袋模型的简单k-means
聚
类
、
、
、
、
0', '0', '1'], '888': ['1', '0', '0']} 我们如何实现一个简单的函数来根据这些向量彼此之间的相似性对它们进行
聚
类
浏览 3
提问于2017-07-03
得票数 2
回答已采纳
1
回答
创建包含相似
文本
的
文本
聚
类
、
、
、
最近,我从事图像
聚
类
工作,找到相似的图像并将它们分组在一起。我使用了
python
的skimage模块来计算SSIM,然后根据确定的阈值对所有图像进行
聚
类
。 我想对
文本
做类似的操作。我想创建包含相似
文本
的自动
聚
类
。例如,cluster-1可以包含代表职业母亲的所有
文本
,cluster-2可以包含代表人们谈论食物等内容的所有
文本
。我知道这必须是无监督的学习。我们有没有类似的
python
浏览 1
提问于2018-06-11
得票数 0
5
回答
术语
聚
类
库?
、
、
、
有没有人知道做术语
聚
类
的开源\自由库? 谢谢,亚尼夫
浏览 0
提问于2009-12-24
得票数 3
3
回答
Python
中的
文本
聚
类
、
、
我需要对一些
文本
文档进行
聚
类
,并且一直在研究各种选项。看起来LingPipe可以在没有事先转换的情况下
聚
类
纯
文本
(到向量空间等),但它是我见过的唯一一个明确声称可以在字符串上工作的工具。有没有可以直接
聚
类
文本
的
Python
工具?如果不是,处理这个问题的最好方法是什么?
浏览 0
提问于2009-11-24
得票数 23
回答已采纳
1
回答
在
Python
中实现文档间语义相似度的
聚
类
、
、
、
我有大约1000个文档(类似段落的
文本
)。我希望找到文档之间的相似性,以便对文档进行
聚
类
。最后,我想做分层
聚
类
。我想用
Python
实现。如何处理这件事。
浏览 6
提问于2018-08-09
得票数 0
回答已采纳
1
回答
从没有标签或目标的
文本
数据中推断
、
、
我有一个用例,在这个用例中,审批者在批准某些贷款时输入了
文本
数据。这是一种非英语语言。
文本
聚
类
有帮助吗??是否可以使用
python
库对非英语语言的
文本
进行
聚
类
?
浏览 0
提问于2020-08-19
得票数 0
1
回答
文档
聚
类
基础知识
、
、
我的问题源于文档
聚
类
的过程。假设我从一个只包含有趣单词的文档集合开始。这里的第一步是什么?解析每个文档中的单词并创建一个巨大的“词袋”类型的模型?然后,我是否继续为每个文档创建字数统计向量?如何使用K-means
聚
类
之类的方法来比较这些文档?
浏览 0
提问于2011-11-09
得票数 1
3
回答
你会用哪种算法来进行
文本
聚
类
分类?
、
如果您被要求使用
聚
类
进行
文本
分类。你会使用哪种算法?为什么?
浏览 0
提问于2015-11-25
得票数 1
1
回答
从
文本
文档中查找主题
、
、
、
、
我有一个
文本
文档,其中包含1000个医学白皮书的摘要。我想从那篇文章中找出主题。自
聚
类
以来,除了
文本
聚
类
之外,任何其他建议都可以帮助我找到在集群中排列的关键字。我试着用
python
中的markovify库自动总结,但是它创建的摘要或句子没有多大意义。欢迎任何合适的建议。谢谢
浏览 0
提问于2017-07-17
得票数 1
回答已采纳
3
回答
基于距离矩阵的词
聚
类
、
、
、
我的目标是根据单词与
文本
文档语料库的相似度对单词进行
聚
类
。我已经计算了每对单词之间的Jaccard相似度。换句话说,我有一个可用的稀疏距离矩阵。有没有人能给我介绍一些以距离矩阵作为输入的
聚
类
算法(可能还有它的
Python
库)?我事先也不知道集群的数量。我只想对这些单词进行
聚
类
,并获得哪些单词聚在一起。
浏览 0
提问于2013-04-27
得票数 24
1
回答
Python
笔划宽度变换
、
、
我正在尝试用
Python
实现Stroke Width转换。我已经在互联网上浏览了许多堆栈溢出问题和答案以及其他资源,但没有找到它的实现。所以我决定自己试一试。
浏览 18
提问于2017-07-08
得票数 2
1
回答
如何分类未贴标签的促销电子邮件数据
、
、
、
、
我有未贴标签的促销邮件数据。我想根据时尚、健康、体育、媒体、娱乐等主题对这些电子邮件进行分类。有谁能让我知道任何有效的方法或任何我可以直接用于对这些电子邮件进行分类的预先培训的模型(任何类似的模型,比如我们用于对象检测的YOLO )。 任何对此的帮助都将是非常值得赞赏的。谢谢!
浏览 0
提问于2020-08-24
得票数 0
1
回答
基于索引的
文本
聚
类
、
、
、
、
目前,我正在开发一个项目,对两百万个
文本
备忘录进行
聚
类
。我的目标是为这些备忘录创建一个标准(实际上,当我说备忘录时,我指的是包含对某事的描述的
文本
)。为此,我希望首先对相似的备忘录进行
聚
类
(收集那些可能具有相同含义的备忘录),然后为每个
聚
类
或组创建一个标签。我可以使用R和
Python
浏览 4
提问于2018-03-23
得票数 0
2
回答
Python
:在NLTK或其他包中的Brown集群?
、
、
、
简单的问题: Brown集群技术(不是经过训练的模型)是NLTK的一部分,还是可以轻松安装在Windows上的另一个包?
浏览 2
提问于2014-05-09
得票数 1
2
回答
如何使用k-means (Flann和
python
)对文档进行
聚
类
?
、
、
、
、
我想根据相似性对文档进行
聚
类
。我已经尝试过ss深处(相似散列),非常快,但是我被告知k-means更快,而flann是所有实现中最快的,所以我尝试用
python
绑定来尝试flann,但是我找不到如何在
文本
上这样做的例子(它只支持数字数组我的问题是: 弗兰是正确的选择吗?如果不是,请建议我使用支持
文本
/文档集群的高性能库,该库具有
p
浏览 9
提问于2012-09-19
得票数 11
回答已采纳
1
回答
python
中的
文本
聚
类
,而不是使用k_means
、
、
、
由于sklearn中的k_means只使用欧几里德距离,而欧几里德距离并不能很好地衡量
文本
之间的“距离”或“相似性”,那么在
python
中有没有其他方法可以用来进行“
文本
聚
类
”呢?
浏览 2
提问于2017-05-18
得票数 0
1
回答
时间序列
聚
类
质量度量
、
、
、
我是
聚
类
时间序列数据集,这些数据集没有标签(没有根据事实),我想衡量集群的质量。你能不能建议一下可以用于时间序列
聚
类
的
聚
类
性能评估方法?
浏览 0
提问于2018-10-06
得票数 1
1
回答
如何收集存在于集群中心或边界的数据?
、
、
在应用
聚
类
算法后,需要提取存在于
聚
类
中心和存在
聚
类
边界的数据。我怎么能通过使用
python
来做到这一点。 采用k均值
聚
类
算法,将数据分成19个
聚
类
.我也在使用scikit学习库。
浏览 0
提问于2018-02-25
得票数 0
1
回答
基于文档
文本
创建文档
聚
类
、
、
、
、
在Elasticsearch中,是否可以将共享最相似
文本
的文档分组,而不提供一个可以比较的初始查询?或 请让我知道找到不同文档
聚
类
的其他方法,例如使用Apache、KNN、无监督学习方法或任何其他算法来查找接近重复的文档或
聚</e
浏览 2
提问于2019-01-25
得票数 2
1
回答
如何将余弦距离矩阵用于均值移位、DBSCAN和光学等
聚
类
算法?
、
、
、
、
我试图比较不同的
聚
类
算法对我的
文本
数据。首先计算了余弦距离矩阵(余弦相似度).然后用这个距离矩阵进行K均值和层次
聚
类
(ward和树状图).我想用距离矩阵来表示平均位移、DBSCAN和光学.sklearn.metrics.pairwise import cosine_similarityprint(dist) 我对
python
我找到了K均值和分层
聚
类
的代码,并试图理解
浏览 0
提问于2020-03-05
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python之K均值聚类
Python、R对小说进行文本挖掘和层次聚类可视化分析案例
聚类模型之Python调参
文本聚类系列教程:(二)jieba中文分词工具进阶
Python机器学习sklearn模块-聚类
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券