腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Elasticsearch:在相关评分中使用密集向量上的距离(在查询时)
我使用elasticsearch来组合不同的东西:-基于密集向量(余弦
相似
度
)的
文本
得分搜索。我的问题是,在查询阶段不
计算
余弦
相似
度
,我在
文本
中的搜索充当预筛选器。我将始终获得结果链接到
文本
搜索,即使余弦
相似
更好。例如,如果一个score函数在
计算
浏览 1
提问于2020-01-29
得票数 1
回答已采纳
1
回答
基于word2vev的句子
相似
度
研究
、
、
基本上,我想知道的是一个特定的句子/文档与我的训练语料库有多
相似
。假设我有一个训练语料库,里面充满了关于狗的
文本
。如果我想检查“飞机有100个座位”这句话与训练语料库的
相似
度
,我希望输出一个低
相似
度
分数。
浏览 12
提问于2019-08-09
得票数 0
1
回答
Python多进程和NLTK wordnet路径
相似
性
、
、
、
、
我正在使用多处理池来加速
文本
语料库上的标题提取过程。在代码的一个阶段,我使用wordnet路径
相似
度
模块来确定两个单词的
相似
度
。如果我按顺序运行我的代码,即不使用多进程池,我会得到
计算
该路径
相似
度
的正常时间。但是,当我使用多处理来同时处理多个文档时,我观察到与顺序相比,在
计算
此路径
相似
度
时存在很大的时间延迟。
浏览 1
提问于2019-01-15
得票数 0
1
回答
DeepLearning4J - ParagraphVectors:为什么
相似
性是负面的?
、
、
、
、
我正在做的是在一组
文本
文档上训练模型,然后
计算
这些文档之间的
相似
度
。 现在,正如参考页面()所说,该工具用来
计算
相似
度
的度量是余弦
相似
度
,它应该包含在0到1之间。但是,对于某些文档对,我得到了负分。
浏览 0
提问于2016-02-29
得票数 0
1
回答
字符串包中Jaccard
相似
度
匹配字符串中的单词
、
、
我想使用字符串函数中的Jaccard
相似
度
来确定词袋的
相似
度
。据我所知,使用Jaccard只能通过字符串中的字母进行匹配。'person')[1] 0 0 1 所以我们在这里看到它
计算
“猫”和“猫”,“狗”和“狗”以及“人”和“ufo”的
相似
<e
浏览 1
提问于2016-05-11
得票数 3
1
回答
如何
计算
TF-IDF
、
我想使用TF-IDF的余弦
相似
度
方法来得到两个单词的语义
相似
度
。首先,我想从wikipedia或word- text中提取这些单词的含义,然后对
文本
进行预处理并找到TF-IDF。如何使用
计算
结果
计算
余弦
相似
度
?
浏览 3
提问于2012-10-06
得票数 1
回答已采纳
1
回答
寻找
文本
中句子之间的语义连贯性
、
、
、
、
我需要一些帮助写一个程序的基础上,从这些链接和的代码,将自动
计算
之间的语义
相似
度
a.连续的句子和b.句子由1个中间短语,在和整个文件(1000句子)。提供的代码已经标记化并可以找到语义
相似
度
,但我不知道如何编写新代码来
计算
(并显示)整个
文本
(a,b)中连续和“插入”句子之间的语义
相似
度
。.I不想一遍又一遍地做同样的事情。
浏览 13
提问于2017-01-11
得票数 0
2
回答
如何使用词性来评估语义
文本
的
相似
度
?
、
、
、
我正在尝试编写一个程序来评估
文本
之间的语义
相似
度
。我已经比较了
文本
之间的n-gram频率(一种词汇测量)。我想要一些不那么肤浅的东西,我认为在句子结构中查看
相似
度
是评估
文本
相似
度
的一种方法。然而,我所能做的就是
计算
词性(例如,每个
文本
4个名词,2个动词,等等)。然后,这类似于只
计算
n-gram(实际上不如ngram好)。如何使用词性来“更深”地衡量语义
文本
的<em
浏览 1
提问于2012-07-12
得票数 1
1
回答
使用序列匹配器比较
文本
相似
性:为什么小写和大写字符串的结果不同?
、
、
、
我在pandas数据框中有一组
文本
(字母数字),我想
计算
成对
文本
(例如
文本
1和2、2和3、3和4...)的
相似
度
分数。 我正在使用序列匹配器进行
计算
,并能够获得分数。我认为在将
文本
转换为小写后,也值得比较它们。我创建了2个分数列来比较结果:分数1=非小写
文本
对的
相似
性分数(保留
文本
的原始大小写)分数2=小写
文本
对的
相似
性分数。我预计小写
文本
对的<
浏览 0
提问于2021-04-05
得票数 0
1
回答
查找某些
文本
文件之间的
相似
度
百分比
、
、
、
、
我用C++编写了一个程序,它根据1到100之间的整数变量v的值序列生成一个
文本
文件。
文本
文件格式如下:1 2 3 4 5 4 5 6 7 8 8 4 5 7 1 如何执行
相似
浏览 2
提问于2016-11-08
得票数 0
4
回答
是否可以使用Google BERT来
计算
两个
文本
文档之间的
相似
度
?
、
、
、
、
是否可以使用Google BERT来
计算
两个
文本
文档之间的
相似
度
?据我所知,BERT的输入应该是有限大小的句子。一些作品使用BERT来
计算
句子的
相似
度
,例如: 是否有BERT done的实现,以便将其用于大型文档而不是句子作为输入(具有数千个单词的文档)?
浏览 1
提问于2019-09-11
得票数 12
1
回答
对问答系统NLP的几点建议
、
、
、
我正在尝试建立一个问题回答系统,其中我有一组预定义的问题和他们的答案。对于来自用户的任何给定问题,我必须查找类似的问题是否已经存在于预定义的问题中,并发送答案。如果它不存在,它必须回复一个通用响应。任何关于如何使用NLP实现这一点的想法都会非常有帮助。
浏览 2
提问于2020-03-15
得票数 0
1
回答
Jaccard
相似
度
计算
相似
度
、
我不清楚如何从这个例子中
计算
出两个产品之间的
相似
性。📷
浏览 0
提问于2019-05-24
得票数 1
回答已采纳
2
回答
特定主题语言模型的评价
、
、
、
“
计算
机”)或一袋袋单词(如:“
计算
机”、“Linux”、“服务器”.)提前感谢您的帮助。
浏览 0
提问于2020-10-02
得票数 2
回答已采纳
2
回答
计算
句子集合之间的语义
相似
度
、
、
、
、
我有两组短消息,我想
计算
这两组短消息之间的
相似
度
,并根据它们的语义
相似
度
来识别它们是否在谈论相同的子主题。我知道如何使用成对
相似
度
,我的问题是我想
计算
两个集合中所有句子之间的总体
相似
度
,而不是两个句子的
相似
度
。有没有办法使用tf-idf或带有余弦
相似
度
的word2vec/doc2vec来
计算
总分?
浏览 4
提问于2019-08-02
得票数 0
1
回答
如何使用TF-以色列国防军或带有gensim的LSA
计算
单词
相似
度
?
、
、
、
、
我知道gensim中的word2vec可以
计算
单词之间的
相似
度
。但是现在我想用TF或者用gensim来
计算
词的
相似
度
.该怎么做呢? 注:使用LSA和gensim
计算
文档
相似
度
很容易:
浏览 6
提问于2016-03-14
得票数 3
1
回答
如何检查两个网站网址之间的
相似
性评分?
、
、
、
我正在做一个经常需要检查两个web url之间
相似
度
的项目,最初我通过从网页中抓取所有
文本
来完成这个任务,然后
计算
出文档的
相似
度
。然而,这真的很费时,相反,我要寻找的是一种方法,可以通过使用url的内容来检测url之间的
相似
性,而不是遍历所有的
文本
。
浏览 13
提问于2022-08-08
得票数 1
回答已采纳
1
回答
使用Gensim更新TF-IDF
、
、
、
您好,我正在使用Gensim来查找文档之间的
相似
度
,因此我对文档进行TF-IDF并
计算
余弦
相似
度
。当我有新文档时,我可以使用index[tfidfvec]
计算
这个文档与以前文档的
相似
度
,但是这样TF-IDF不会更新,并且在
相似
度
计算
中不考虑新词。有没有什么解决方案可以快速更新TF-IDF而无需重新
计算
整个矩阵,或者对我的问题有什么最好的解决方案?
浏览 2
提问于2018-12-26
得票数 2
3
回答
是否有解释字符之间距离的
文本
距离(或字符串
相似
性)算法?
、
、
我感兴趣的是找到一个
文本
距离(或字符串
相似
度
)算法,当字符进一步分开时,该算法
计算
一个更大的距离(或更低的
相似
度
)。像Levenshtein、Jaro和Ratcliff这样的常见算法为这两个示例
计算
相同的值。
浏览 0
提问于2022-09-22
得票数 -1
1
回答
Pytorch余弦
相似
度
NxN元素
、
我有128个嵌入向量 image.shape = torch.Size([128, 512]) text.shape = torch.Size([128, 512]) 我想
计算
包含所有元素之间余弦
相似
度
的张量(即: cosine.shape = torch.Size([128, 128]) 其中第一行是第一图像和所有
文本
(128)之间的余弦
相似
度
,等等。目前我只是这样做,但结果是一个只包含N个余弦
相似
性的一维数组。我试着转置
文本
,但不起作用
浏览 42
提问于2021-04-21
得票数 3
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
文本相似度计算综述
四种计算文本相似度的方法对比
语义文本相似度研究进展
基于ALBERT的文本相似度解决方案
计算图像相似度——《Python也可以》
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券