腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(7183)
视频
沙龙
2
回答
修正
的
余弦
相似
效率
、
、
、
、
问题所在 我试图计算两个数组之间
的
余弦
相似
度,但基本公式略有变化。也就是说,我只关心与“引用”数组重叠
的
组件。例如,如果我们要计算以下两个数组之间
的
余弦
相似
度: A = [1 0 1] B = [1 1 0] [0 1 1] [0 1 1] 假设B是引用数组。:有没有一种方法可以在不显著降低性能
的
情况下引入这种修改(与sklearn.metrics.pairwise.cosine_similarity等内置
的</
浏览 28
提问于2019-10-15
得票数 0
回答已采纳
1
回答
针对多个文档计算文本
相似
度
、
、
、
我试图计算一个搜索词A
的
文本
相似
性,就像“如何使小鸡”与其他搜索词
的
集合一样。为了计算
相似
度,我使用
余弦
距离和TF将A转换成一个向量。我想同时比较一下A与所有文档
的
相似
性。目前,我
的
方法包括迭代计算A
的
余弦
相似
性,每次针对其他文档计算。我有100个与之比较
的
文件。如果cos_sim(A, X) > 0.8
的
结果,我打断并说“酷,这是
相似
的”
浏览 5
提问于2019-11-14
得票数 0
3
回答
非常大数据集
的
余弦
相似
性
、
、
、
我在计算100维向量大列表之间
的
余弦
相似
性时遇到了困难.当我使用from sklearn.metrics.pairwise import cosine_similarity时,我在我
的
16 GB机器上得到了., 103] 我
的
最终目标是得到与父向量有很高
余弦
相似
性
的
顶级N个子向量(包括它们
的
名字,如child_vector_1和相应
的
余弦
分数)。我目前
的
方法(我知道这种方法
浏览 0
提问于2018-12-20
得票数 5
1
回答
词嵌入关系
、
、
、
、
我想学习更多关于我可以在单词嵌入向量上执行
的
代数函数
的
知识。我知道通过
余弦
相似
度,我可以得到最
相似
的单词。但我需要再做一个级别的推断,并得到下面的关系: X1与X2
的
关系类似于X3与X4
的
关系。举个例子,我可以说公主和王子
的
关系就像女人和男人
的
关系。我有到X3
的
X1,我
的
问题是我能以多高
的
效率
弄清楚X4是什么。我试着用
余弦
来求向量
的</e
浏览 2
提问于2017-08-02
得票数 0
回答已采纳
1
回答
最有效
的
R
余弦
计算
、
、
我有两个值
的
向量和一个权重
的
向量,我需要计算
余弦
相似
度。由于复杂
的
原因,我一次只能计算一对
余弦
。但我得做几百万次。of the scaled vectors b = b*wts}> cosine_calc(a,b,w)[
浏览 4
提问于2011-11-17
得票数 7
回答已采纳
1
回答
相似
性评分在gensim中意味着什么?
、
、
、
我使用Gensim库来查找句子与段落集合、文本数据集之间
的
相似
之处。分别使用了
余弦
相似
度、软
余弦
相似
度和移动测度。Gensim返回一个项目列表,包括、docid、和
相似
性评分。对于
余弦
相似
度和软
余弦
相似
度,我猜
相似
度是向量之间
的
余弦
。我说
的
对吗? 在Gensim文档中,他们写道,这是语义
的
关联性,没有额外<em
浏览 0
提问于2021-09-20
得票数 0
回答已采纳
1
回答
python提高列方向
余弦
相似
度
的
效率
、
所以,我有一个矩阵,它
的
维数是19001×19001。它包含大量
的
零,所以它是相对稀疏
的
。如果行中
的
项为非零,我编写了一些代码来计算列
的
成对
余弦
相似
度。我将一行
的
所有两两
相似
值相加,并对它们进行一些数学运算,以便在矩阵
的
每一行最后得到一个值(参见下面的代码)。它所做
的
是它应该做
的
,然而,由于处理大量
的
维度,它确实是缓慢
的
。有没有办法修改我
浏览 3
提问于2017-05-31
得票数 1
回答已采纳
1
回答
项目间
的
余弦
相似
性(购买数据)与标准化
、
、
、
我使用表示产品用户购买行为
的
IndexedRowMatrix,为了构建产品推荐,我使用
余弦
相似
度来计算产品之间
的
相似
性。PySpark提供了一个名为columnSimilarities()
的
函数。我
的
问题是,在使用columnSimilarities()之前,是否需要规范每个产品
的
向量?我读过关于归一化和
余弦
相似
的文章,并且理解
余弦
相似
已经对向量进行了归一化,就好像我们把向量规范化
浏览 0
提问于2018-11-19
得票数 3
1
回答
文档
相似
性-多个文档以相同
的
相似
性评分结束
我一直在处理一个业务问题,需要找到与现有文档
相似
的新文档。我使用了如下各种方法2.TFIDF +
余弦
相似
他们都没有像预期
的
那样工作。最后,我发现了一种更好
的
方法-- Word2vec +软
余弦
相似
性。 但新
的
挑战是,我最终得到了具有相同
相似
性评分
的
多个文档。它们大多是相关
的</
浏览 1
提问于2020-04-16
得票数 0
1
回答
如何使用Gensim doc2vec执行高效
的
查询?
、
、
、
、
我正在用下面的用例研究一个句子
相似
算法:给定一个新句子,我想从给定
的
集合中检索它
的
n个最
相似
的句子。我正在使用Gensim v.3.7.1,我已经培训了word2vec和doc2vec模型。我过去经常使用内置方法model.most_similar()来推断
相似
性,但是一旦我开始使用更多
的
数据进行训练,这是不可能
的
,而我想要对这些数据进行查询。也就是说,我想在我
的
训练数据集
的
子集中找到最
相似
的句子。我
的</e
浏览 0
提问于2019-05-14
得票数 3
回答已采纳
1
回答
python3中
的
余弦
相似
性
我有两份名单我已经定义了字到向量函数和
余弦
相似
,所以我没有在这里提到。.lower()) j = j+1在嵌套循环中,我希望在内部循环运行后选择具有最大
余弦
相似
值
的
字符串tar1
的
第一项是“苹果”,
浏览 0
提问于2018-09-17
得票数 1
回答已采纳
1
回答
我们如何计算由评级表示
的
两个项目的调整后
的
余弦
相似
度?
、
、
、
我想分别为a和b表示
的
两个项目计算调整后
的
余弦
相似
值。我们取两个向量a={2,3,1,0}和b={1,0,4,2}。我知道
余弦
相似
度是如何工作
的
,但我坚持使用调整后
的
余弦
相似
度方法。
浏览 4
提问于2016-02-18
得票数 0
2
回答
使用相同源
的
余弦
相似
和完全不同
的
结果
、
、
、
、
我正在学习单词嵌入和
余弦
相似
性。我
的
数据是由两组相同
的
词组成
的
,但用
的
是两种不同
的
语言。 我是否应该期望获得同样
的
结果?我注意到有时我有两个相反
的
结果。因为我
浏览 3
提问于2019-07-24
得票数 0
回答已采纳
1
回答
生成两个具有给定角度
的
向量
、
、
、
我试图用给定
的
余弦
相似
度生成两个向量。输入将是
余弦
相似
度
的
程度(或者说它取决于它)和向量中
的
维数(D),输出将是D维
的
两个向量,与它们之间给定
的
相似
度,现在我知道如何使用
余弦
相似
函数来计算
相似
度,但当我尝试相反
的
方法时,我迷失了方向。是否有这样
的
过程或算法,它是如何命名
的
?
浏览 6
提问于2022-05-25
得票数 1
回答已采纳
1
回答
提亚诺中
的
余弦
相似
、
、
、
、
用numpy和theano计算
余弦
相似
性
的
最简单方法是什么?向量作为numpy数组给出。哦,救命啊!)
浏览 4
提问于2016-02-15
得票数 2
回答已采纳
1
回答
在没有方向
的
情况下,如何利用文档特征向量上
的
余弦
相似
度公式?
、
在数据科学中,为了识别文档
的
相似
性,我们将文档转换为特征向量。然后应用源文档与目标文档特征向量之间
的
余弦
角公式。 然而,
余弦
公式仅适用于向量。一个矢量应该有两个震级和方向。对于表示为向量
的
文档,方向在哪里?
浏览 0
提问于2020-05-17
得票数 1
1
回答
Elasticsearch:在相关评分中使用密集向量上
的
距离(在查询时)
我使用elasticsearch来组合不同
的
东西:-基于密集向量(
余弦
相似
度)
的
文本得分搜索。我
的
问题是,在查询阶段不计算
余弦
相似
度,我在文本中
的
搜索充当预筛选器。我将始终获得结果链接到文本搜索,即使
余弦
相似
更好。这是function_score根据<em
浏览 1
提问于2020-01-29
得票数 1
回答已采纳
1
回答
基于亲合传播
的
聚类doc2vec
、
、
、
、
然而,我只是不明白是否应该使用
余弦
相似
或
余弦
距离来聚类我
的
文档向量。目前,我正在使用
余弦
相似
性作为我
的
亲和力传播聚类。因此,我
的
第一个问题是;对t-sne使用距离矩阵(
余弦
距离)是正
浏览 0
提问于2018-01-04
得票数 1
2
回答
为什么word2Vec使用
余弦
相似
度?
、
、
我一直在阅读关于Word2Vec
的
论文(例如),我认为我理解训练向量以最大化在相同上下文中发现其他词
的
可能性。例如,对于文档来说,
余弦
相似
性比较是有意义
的
.两个文档可能有不同
的
长度,但有
相似
的分布词。 为什么不,比如
浏览 4
提问于2016-07-17
得票数 17
回答已采纳
1
回答
如何在MALLET中获取两个文档之间
的
余弦
相似
度?
、
、
、
我有一个使用MALLET训练
的
LDA主题模型,但是我想计算两个文档之间
的
余弦
相似
度来获得
相似
度,但是我不确定我要计算哪个文件
的
余弦
。我
的
余弦
相似
度函数运行得很好,但我不确定我在MALLET中比较
的
是什么。 任何帮助都将不胜感激!
浏览 1
提问于2017-04-07
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
余弦相似度算法进行客户流失分类预测
循环神经网络(三)——词嵌入学习与余弦相似度
辅助决策系统中的态相似、势相似、感相似、知相似
OCC每日利润的修正!
Facebook 如何修正缔造其成功的算法?
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券