腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(6689)
视频
沙龙
0
回答
如何
根据
上下文
对
相似
类型
的
句子
进行
聚
类
,
并从
中
提取
关键字
、
、
、
、
我想
根据
句子
的
上下文
对
句子
进行
聚
类
,
并从
相似
的
上下文
句子
中
提取
共同
的
关键字
。例如1.我要回家2.我正在吃饭3.他明天要回家4.他在餐馆现有的API会很有帮助,就像使用IBM Watson一样
浏览 2
提问于2017-01-07
得票数 1
回答已采纳
5
回答
如何
使用BERT
对
相似
句子
进行
聚
类
、
、
、
、
对于ElMo,FastText和Word2Vec,我平均
句子
中
的
单词嵌入,并使用HDBSCAN/KMeans
聚
类
来
对
相似
的
句子
进行
分组。在这篇简短
的
文章
中
可以看到一个很好
的
实现示例:http://ai.intelligentonlinetools.com/ml/text-clustering-word-embedding-machi
浏览 367
提问于2019-04-11
得票数 23
回答已采纳
1
回答
如何
使用
聚
类
对
意图
相似
的
句子
进行
分组?
、
、
、
、
我正试图用Python开发一个程序,它可以处理原始聊天数据,并
对
意图
相似
的
句子
进行
聚
类
,这样它们就可以作为训练示例来构建一个新
的
聊天机器人。其目标是使其尽可能快速和自动(即不需要手动输入参数)。对于特征
提取
,我标记每个
句子
,停止其单词,并使用Sklearn
的
TfidfVectorizer
对
其
进行
矢量化。 然后我用Sklearn
的
DBSCAN
对
这些
浏览 2
提问于2017-12-14
得票数 0
回答已采纳
1
回答
根据
使用python或SQL
的
类似
句子
对
行
进行
排序?
、
、
、
、
如何
根据
行值对数据帧
进行
排序。也就是说,我有一行包含文本数据,想要提供基于
相似
性
的
排名吗?下面是样本数据集,原始数据集包含约100000条记录。关于,请参考这个问题有一些方法
进行
了测试,
对
相似
句子
进行
聚
类
,小数据集,请参考以上所附链接。输出,我们需要
聚
类
相似
的
句子
,不管长度。 示例-使用python
浏览 13
提问于2022-03-07
得票数 1
1
回答
doc2vec
中
的
文档长度
、
、
、
我有100个
句子
,我想
根据
相似
性
进行
聚
类
。我使用doc2vec将
句子
向量化为20维向量,并应用kmeans
对
它们
进行
聚
类
。我还没有得到想要
的
结果。 我已经读到doc2vec只在大型数据集上表现良好。我想知道是否增加每个数据样本
的
长度,是否会弥补样本数量少
的
问题,并帮助模型更好地
进行
训练?例如,如果我
的
句
浏览 0
提问于2019-08-26
得票数 0
1
回答
黑白图像文档
聚
类
、
、
、
、
我有一些黑白文档(图像扫描),并希望
根据
它们
的
布局
对
它们
进行
聚
类
。为了使事情更具体,假设我有以下三张图片,前两张更有可能落入同一个集群,而不是第三张图像,因为前两张
的
布局比较
相似
。我
的
问题是,对文档
进行
聚
类
的
最佳方法是什么?现在我有几个初步
的
方法: 用主成分分析和几种
聚
类
方法(K
浏览 0
提问于2017-11-23
得票数 5
2
回答
怎样才能得到歌曲
相似
性
的
客观度量?
、
、
我浏览了ML项目的想法,发现了一个有趣
的
想法(只是问题陈述):用歌词检测两首歌是否
相似
。我发现这是一个有趣
的
想法,但我不太确定我将
如何
得到一个分数
的
相似
歌曲。对于我
的
数据集,我有
类型
,艺术家和歌词
的
特点。考虑到一开始就没有这样
的
“训练数据”,什么是评估
相似
性
的
潜在方法。 我遇到过一些嵌入词之类
的
东西,但它们
的
作用
对
我来说并不十分
浏览 0
提问于2019-04-21
得票数 1
2
回答
从
相似
矩阵执行
聚
类
、
、
我有一个歌曲列表,我为每个歌曲
提取
了一个特征向量。我计算了每个向量之间
的
相似
度分数,并将其存储在一个
相似
矩阵
中
。我想
根据
这个
相似
矩阵对歌曲
进行
聚
类
,以尝试识别集群或某种
类型
的
歌曲。我使用networkx包从
相似
矩阵
中
创建了一个力有向图,使用了弹簧布局。然后,我将KMeans
聚
类
用于该图中节点
的
浏览 0
提问于2021-04-15
得票数 1
1
回答
如何
聚
成n克?
、
我只想知道
如何
根据
它们
的
语义
对
n-图
进行
聚
类
。就像通过利用分布假设将语义
相似
的n-图聚在一起,表示
相似
的单词出现在
相似
的
上下文
中。
浏览 0
提问于2019-10-13
得票数 3
1
回答
如何
判断两个网页内容是否
相似
?
、
、
、
、
给定两个html源,我想首先使用之类
的
东西从中
提取
主要内容。有没有 --我特别想找Python/Javascript
的
?一旦我有了两个
提取
的
内容,我想返回一个介于0和1之间
的
分数,表示它们有多
相似
,例如,来自CNN和BBC
的
关于同一主题
的
新闻文章会有更高
的
相似
性分数,因为它们在相同
的
主题上,或者Amazon.com和Walmart.com上关于相同产品
的
浏览 0
提问于2012-04-06
得票数 3
回答已采纳
3
回答
Python:检查
句子
中
是否包含列表
中
的
任何单词(带有模糊匹配)
、
、
我想从给定一个list_of_keywords
的
句子
中
提取
关键字
。我设法
提取
出准确
的
单词是否可以
提取
与给定
的
list_of_keywords具有良好
相似
性
的
单词,即两个单词之间
的
余弦
相似
度大于0.8 例如,给定列表
中
的
<em
浏览 3
提问于2019-02-21
得票数 2
回答已采纳
1
回答
如何
高效地查找
相似
文档
、
、
、
、
我有很多使用
聚
类
算法
进行
聚
类
的
文档。在
聚
类
算法
中
,每个文档可以属于一个以上
的
聚
类
。我已经创建了一个存储document-cluster赋值
的
表和另一个存储cluster-document信息
的
表。我首先检索它所属
的
集群列表(从document-cluster表
中
),然后对于document-cluster<em
浏览 0
提问于2015-05-05
得票数 0
1
回答
基于语义
相似
度
的
分层
聚
类
算法
、
、
我
对
整个集群和其他方面都很陌生,所以我有点迷失在编程
的
最后一步。我正在做一个基于主题语义
相似
性
的
项目,该项目使用层次化算法
对
学生
进行
聚
类
。
如何
用python编写代码,
根据
主题之间
的
浏览 5
提问于2022-02-15
得票数 -1
1
回答
如何
使用Word共现和
聚
类
的
概念来实现POS标签?
、
POS标签,
提取
句子
中一个单词
的
语法角色。
根据
我
的
研究,词共现是一种分析词发生
的
技术,它可以用来构造一个图,其中节点是词,它们之间
的
权重是它们
的
共现权。我想知道是否有一种方法可以将
聚
类
算法应用到这个图形上,
根据
它们
的
语法角色
对
单词
进行
分组?我
的
意思是我想和POS标签师做同样
的
事。其主要思想是,在构造共现图之
浏览 0
提问于2021-01-14
得票数 1
1
回答
为什么降维能提高电影海报
的
无监督
聚
类
性能?
、
、
、
、
我正在写一篇论文,试图
根据
电影海报
的
视觉特征
对
它们
进行
聚
类
。我们
的
目标是将看起来类似的电影海报聚集在一起。为了从数量上描述海报
的
“外观”,我使用预先训练过
的
VGG16 CNN为所有海报
提取
了25088个特征。这些特性存储在一个带有尺寸
的
矩阵
中
(#电影海报,25088)。
根据
提取
的
特征,我想: 创建类似电影海报
的</e
浏览 1
提问于2018-10-30
得票数 0
1
回答
对
具有数字序列
的
不同长度
的
行
进行
分层
聚
类
、
、
我想在我
的
一个项目中做分层
聚
类
。 我最初
的
问题是,我有一个巨大
的
图,我在上面迭代了大量
的
路径,并报告了以下格式
的
路径节点。因此,下面示例
中
的
每个数字表示一个图形节点,行表示一条路径。现在,我想
根据
共享节点
的
数量
对
这些路径
进行
聚
类
,以此来分隔
相似
类型
的
路径。1210, 158,
浏览 0
提问于2016-04-25
得票数 0
2
回答
对
相似
文档
进行
分组
、
、
这个问题涉及到在信息检索
中
对
相似
文档
进行
分组/
聚
类
。 我有一套文档,D1,D2,..Dn。对于每个文档,Di,我还有一组
关键字
,Di_k1,Di_k2,...,Di_km。两个文档Di和Dj之间
的
相似
度由涉及相关
关键字
的
函数给出,即
相似
度(Di,Dj) = f(Di_K,Dj_K)。现在,我希望将这些文档
中
的
每个文档放入一组组/
浏览 0
提问于2011-05-20
得票数 0
1
回答
相似
矩阵/层次聚集聚
类
火花
、
、
、
、
我试图实现一种基于
相似
性阈值
的
聚
类
方法。其思想是为被认为
相似
的事物定义一个阈值,并得到不同
的
集群。我所拥有的数据包含3亿个条目。我一直在找Apache做这件事。然而,几个小时后,我有更多
的
问题,而不是答案: 1-所有在星火中实现
的
方法()都是基于向量
的
相似
性,使得其他
类型
的
对象难以扩展。在我
的
例子
中
,我有一组对象,我想扩展定义两个独立对象是<em
浏览 1
提问于2017-10-29
得票数 1
2
回答
如何
在字符串对象上运行K-均值算法?
、
、
、
、
我正在做一个项目,在这个项目中,我需要
根据
句子
的
相似
程度对
句子
进行
分组。例如,需要将这些
句子
分组为一个组: 标题不断进入,所以我可能需要安排和修改集群
的
动态。目前,我正在使用Monge算法来识别两个字符串有多
浏览 3
提问于2013-01-24
得票数 2
回答已采纳
2
回答
关于自动、基于学习
的
文档摘要,有哪些好
的
资源可供学习?
、
文档摘要可以通过从源文档中
提取
文本来完成,或者您可以使用学习算法来解释文档所传达
的
内容,然后使用语言生成技术(就像人类一样)生成摘要。 对于后一种方法,是否有算法或已有的研究工作?一般来说,有哪些关于文档摘要技术
的
好资源可供学习?
浏览 3
提问于2014-08-31
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
入门 NLP 项目前,你必须掌握哪些理论知识?
论文浅尝 Question Answering over Freebase
如何设置佳信客服系统中智能质检的质检规则和条件
NLP中关键字提取方法总结和概述
一文看懂什么是文本挖掘
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券