词的余弦相似度与BERT模型的比较

、

我们通常将词嵌入之间的相似度与余弦相似度进行比较，但这只考虑了向量之间的角度，而不是范数。对于word2vec，随着单词在更多的上下文中使用，向量的范数会减少。因此，停用词接近于0，并且非常独特，高意义的词往往是大的向量。BERT是上下文敏感的，所以这个解释并不完全涵盖BERT</em

浏览 1提问于2019-07-23得票数 4

1回答

使嵌入相似的火炬损失函数

、、、、

我正在研究一个嵌入模型，其中有一个BERT模型，它接收文本输入并输出多维向量。该模型的目的是为相似的文本找到相似的嵌入(高余弦相似度)，对于不相似的文本寻找不同的嵌入(低余弦相似度)。在小型批处理模式下进行训练时，BERT模型给出N*D维输出，其中N是批处理大小，D是BERT

浏览 5提问于2020-12-31得票数 0

回答已采纳

1回答

、、、、

您好，我希望使用BERT模型为一个单词生成相似的单词，这与我们在gensim中使用的生成most_similar单词的方法相同，我发现该方法如下： from transformers import BertTokenizer, BertModel model = BertModel.from_pretrained

浏览 66提问于2021-10-31得票数 1

2回答

我正在尝试类似的研究摘要，所以我使用word嵌入将单词转换为1x768向量，所以总体上将抽象转化为带有形状的嵌入(#ofword，768)。两个抽象之间的余弦相似性返回一个矩阵(#ofwords1 1，#ofwords1 2)，然后我对其进行总结，以得到一个总体得分。我想知道的是，在一个余弦相似矩阵中对所有值的总结是否真的是确定两个不同文本之间的整体相似性的好方法呢？有没有一种更好，或者更便宜<em

浏览 0提问于2020-08-26得票数 2

1回答

关于word2vec most_similar()函数

、、

我使用如下的most_similar()方法来获取与给定单词相似的所有单词：AFAIK，它的作用是计算给定单词和字典中所有其他单词之间的余弦相似度。当我检查单词和分数时，我可以看到列表中有负分数的单词。这是什么意思？它们是与给定单词具有相反含义的单词吗？另外，如果它

浏览 2提问于2016-01-19得票数 5

3回答

最佳简历，文档匹配

、、、、

我用了三种不同的方法来计算简历和工作描述之间的匹配。有人能告诉我什么方法是最好的吗?为什么？ Gensim库采用LSA/LSI模型提取关键词，计算文档与查询之间的</em

浏览 4提问于2016-11-02得票数 1

1回答

句子转换器如何预测新实例

、、、、

它展示了如何对我们的自定义数据进行培训。但我不知道该怎么预测。如果有两个新句子，如1)这是第三个例子，2)这是第三个例子。我怎么能预测到这些句子有多相似呢？DataLoader(train_examples, shuffle=True, batch_size=16)保存了与旧代码相比的This is an example sentence", "Each sentence is converted"

浏览 1提问于2022-01-04得票数 2

1回答

词对余弦相似度差异的统计意义

我想知道是否有什么方法可以说明从语言模型中提取的词对的余弦相似度差异的统计意义。假设我有一对A-B，和对A-C。我使用word2vec或bert (或其他任何)嵌入来计算A的余弦相似度，假设我得到了.60。我对A也是这样做的，比方说产生.62。现在，.60和.62之间的差异在统计学上是显著的吗？这是一个合理<e

浏览 0提问于2022-10-20得票数 0

1回答

计算给定语音记录中的语义连贯性

、、、、

我正在尝试计算给定段落/文本的语义连贯性，即。如果有人在谈论某件事或话题时偏离了轨道--更具体地说是描述一张图片(图片可能有很多子细节)。文字记录1:我喜欢运动。世界上有这么多体育迷。有一种致命的病毒正在世界各地传播。文本1的语义连贯性应该是高的，而文本2的语义连贯性应该是低的。我正在使用BERT (bert-as-service)为句子生成句子嵌入。然后，我尝试通过计算句子嵌入向量之间的余弦<

浏览 9提问于2020-03-04得票数 0

1回答

从BERT模型求词嵌入的余弦相似度

、、、

我很感兴趣的是如何从BERT模型中得到不同句子中的词嵌入的相似性(实际上，这意味着单词在不同的场景中有不同的含义)。我想从sent1和sent2那里得到cos(纽约，纽约)的价值，即使'New York‘这个短语是一样的，但它出现在不同的句子中。我从那里得到了一些直觉但是，我仍然不知道我需要提取哪个层的嵌入，以及如何为上面的例子计算cos的</

浏览 8提问于2021-11-21得票数 3

回答已采纳

3回答

如何使用BERT中的嵌入比较句子相似度

、、、、

我正在使用HuggingFace Transformers包访问预先训练好的模型。因为我的用例需要英语和阿拉伯语的功能，所以我使用预训练模型。我需要能够使用诸如余弦相似性之类的东西来比较句子的相似性。要使用它，我首先需要获得每个句子的嵌入向量，然后才能计算余弦相似度。首先，从BERT模型中提

浏览 2提问于2020-03-03得票数 21

回答已采纳

1回答

检查TF-国防军的结果

、、

我正在与TF-以色列国防军和余弦相似做文档比较，并给出一个文档，哪个文档在数据中是最相似的。但是，有时它会返回两个文档之间的高度相似性，而在读取文档对时，这两个文档似乎不太相似。是否有传统的方法来评估哪些词有助于两个文档之间的高相似度得分使用TF-以色列国防军和余弦相似性？

浏览 0提问于2019-06-16得票数 1

1回答

为什么好词嵌入是从最大程度的余弦相似性产生的呢？

、、、

我了解word2vec的技术细节。据我所知，一个特定嵌入的好处是在浅薄的任务中看到的，比如单词类比。我无法理解最大程度的余弦相似度与好的词嵌入之间的关系。

浏览 0提问于2018-01-25得票数 4

1回答

如何建立基于简历和职务描述的推荐模型？

、、、、

如何在给出的职位描述的基础上建立一个更好的简历推荐模型？我很熟悉弓形或tfidf (n克)的方法，然后采取余弦相似，但我正在寻找一种深入的学习方法。我没有任何标有标签的数据要评估。任何建议都会很感激的。

浏览 0提问于2020-06-24得票数 4

回答已采纳

1回答

当Word2Vec使用点积相似性进行训练时，为什么还要使用余弦相似性

、、、、

根据我在stackoverflow上找到的几篇文章(例如这个Why does word2Vec use cosine similarity?)，在我们训练了一个word2vec ( CBOW或Skip-gram)模型之后，计算两个词向量之间的余弦相似度是一种常见的做法。然而，这对我来说似乎有点奇怪，因为该模型实际上是用点积作为相似度分数进行训练的。这一点的一个证据

浏览 132提问于2019-01-29得票数 7

1回答

如何在MALLET中获取两个文档之间的余弦相似度？

、、、

我有一个使用MALLET训练的LDA主题模型，但是我想计算两个文档之间的余弦相似度来获得相似度，但是我不确定我要计算哪个文件的余弦。我的余弦相似度函数运行得很好，但我不确定我在MALLET中比较的是什么。任何帮助都将不胜感激！

浏览 1提问于2017-04-07得票数 0

1回答

针对多个文档计算文本相似度

、、、

我试图计算一个搜索词A的文本相似性，就像“如何使小鸡”与其他搜索词的集合一样。为了计算相似度，我使用余弦距离和TF将A转换成一个向量。我想同时比较一下A与所有文档的相似性。目前，我的方法包括迭代计算A的余弦相似性，每次针对其他文档计算。我有100个与之比较的

浏览 5提问于2019-11-14得票数 0

1回答

如何将包含100个术语的列表汇总为少量(~5)个重要术语？

、、

，例如：如果这太多了，至少按相关度对术语进行排名问题是大多数文本分析工具使用词频和/或跨多个文档工作，但在我的例子中，我的列表只有唯一的词，而且还包含噪声(不相关的词)。有没有什么Python工具或API可

浏览 0提问于2020-08-08得票数 1

1回答

使用预训练的Bert，Elmo获得两个单词之间的相似度分数

、、、、

我正在尝试使用预训练的维基模型来比较Glove，Fasttext，Bert，Elmo在两个单词之间的相似度。Glove和Fasttext有预训练的模型，可以很容易地与python中的gensim word2vec一起使用。Elmo和Bert有这样的模型吗？

浏览 74提问于2019-09-15得票数 1

0回答

腾讯词向量相似词相似度不高？

利用腾讯词向量，做余弦相似度，为什么“广角行车记录仪”与“行车记录仪”的相似度还没有与 “家用音响设备”的相似度高？

浏览 630提问于2019-04-16

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

BERT词嵌入的大小/范数的意义是什么？

使嵌入相似的火炬损失函数