为什么未知令牌的keras标记器需要嵌入的input_dim为vocab_size +2，而不是vocal_size+1

在Keras中，未知令牌（unknown token）是在文本处理任务中用于表示未知词汇的特殊标记。当使用嵌入层（Embedding layer）将文本序列映射为向量序列时，通常会为未知令牌分配一个特定的索引。

在给定的问答内容中，提到了一个未知令牌的Keras标记器（tokenizer），并询问了为什么该标记器的嵌入层的input_dim参数需要设置为vocab_size + 2，而不是vocab_size + 1。

答案如下：

在这种情况下，将input_dim参数设置为vocab_size + 2的原因是为了确保未知令牌也有一个特定的索引。实际上，设置为vocab_size + 1也可以表示未知令牌，但是为了避免任何潜在的冲突，通常会添加一个额外的索引。

当设置input_dim为vocab_size + 2时，嵌入层的权重矩阵将具有vocab_size + 2行，每行代表一个词汇或未知令牌的嵌入向量。通过这样的设置，模型可以将文本序列中的每个单词映射为对应的嵌入向量，同时也可以通过该额外索引表示未知词汇。

具体来说，对于一个包含vocab_size个已知词汇的文本语料库，将input_dim设置为vocab_size + 2可以确保嵌入层的权重矩阵具有足够的维度来处理所有已知词汇和未知令牌。

以下是腾讯云相关产品的介绍链接地址：

页面内容是否对你有帮助？

有帮助

没帮助

为什么未知令牌的keras标记器需要嵌入的input_dim为vocab_size +2，而不是vocal_size+1

、、、、

我正在使用keras嵌入和使用Keras tokenizer。起初，我没有使用oov_token (对于未知的令牌)，并且我的记号赋予器的word_counts的长度为54。对于嵌入，我曾经将my_tokenizer.word_counts+1作为input_dim，后来我需要处理未知的令牌，

浏览 17提问于2020-10-23得票数 1

1回答

如何在具有嵌入层的keras中建立序列到序列自动编码器？

、、、

我想用角码建立一个序列对序列的自动编码器。目的是为了"doc2vec“。在keras的文档中，我找到了一个例子：from keras.models import Model(timesteps)(encoded) seque

浏览 1提问于2018-08-09得票数 4

回答已采纳

1回答

ValueError:输入0与图层layer_1不兼容:需要的ndim=3，找到的ndim=2

、、

我正在尝试使用单词嵌入和编解码器架构来构建文本摘要生成器。这是我在Keras的第一次尝试，我不能理解为什么layer_1需要ndim=3。我不能弄明白这一点。下面是我的代码：n_embeddings = 200 model = keras.Sequential() model.add(Embedding(we

浏览 14提问于2018-01-22得票数 1

回答已采纳

2回答

使用mask_zero=True嵌入tf.keras，然后使用GlobalAveragePooling1D生成TypeError

、、、、

我使用tf.keras在谷歌colab上的tensorflow v2上。我正在尝试使用带有掩码的嵌入，然后是全局平均值。Embedding(input_dim=vocab_size, output_dim=16, mask_zero=True)(inputs) outputs = tf.keras.layers.GlobalAveragePooling1D我想知道为什么你需要指定一个显式的序列长度

浏览 23提问于2019-10-16得票数 1

1回答

为什么Keras嵌入层的矩阵是vocab_size + 1的大小？

、、、、

下面是一个玩具例子，我的词汇表大小为7，嵌入大小为8，而Keras嵌入层的权重输出为8x8。(?)怎么会这样呢？这似乎与与Keras嵌入层为“最大整数索引+ 1”有关的其他问题有关，我已经阅读了有关这方面的所有其他堆栈溢出查询，但它们都表明它不是vocab_size +1，而我的代码告诉我是这样的</e

浏览 3提问于2022-05-16得票数 1

回答已采纳

1回答

向Keras层输入

、、、、

我有以下形状的输入序列。共有1434个序列，每个序列的长度为185个，唯一的字符总数为37个。因此，在某种程度上，我们有如下的词汇大小。vocab_size=37user_input = keras.layers.Input(shape=((185,37)), name='Input_1'

浏览 0提问于2019-07-25得票数 0

回答已采纳

1回答

流动嵌入层词汇大小

、、

我正在学习Tensorflow，并且在tensorflow中遇到了用于学习自己的单词嵌入的嵌入层。该层接受以下参数： output_dim,mask_zero=False, “输入朦胧”应与词汇量相同，即独特的词汇如果我想把词汇量限制在前25000个最常用的</e

浏览 2提问于2020-05-05得票数 1

回答已采纳

1回答

在整个x_data上使用Keras* fit_to_text更好还是只在train_data上呢？*

、、

我有一个带有文本列的数据格式。我把他们分成了x_train和x_test。我的问题是，在整个x数据集上做Keras的Tokenizer.fit_on_text()更好，还是只做x_traintokenizer = Tokenizer() tokenizer.fit_on_texts以后我也必须对x_test进行标记化，所以我可以只使用相同的标记器吗？

浏览 0提问于2019-02-26得票数 20

回答已采纳

1回答

两个池层的对比特性

、、、、

我正在尝试设计一个双向的LSTM模型，我想连接在Max池和平均池层之后的特性。我把这个送给我的模特：from keras.layers.recurrent import LSTMfrom keras.models import Sequential from keras.layers.cor

浏览 0提问于2018-10-13得票数 1

1回答

Keras用预先训练的嵌入来初始化大型嵌入层

、

我试图用Tensorflow后端重新训练Keras 2中的word2vec模型，使用预先训练过的嵌入和自定义语料库。我就是这样用预先训练好的嵌入来初始化嵌入层的： input_length正如前面提到的，shape是(2270872, 300

浏览 2提问于2018-11-21得票数 12

回答已采纳

1回答

嵌入/嵌入层在深度学习中的应用

、、、

假设，我的数据集如下所示:每个数据点包含7个特征(7个不同的单词)(这里是A)，长度不同。 Group1 Group2............我得到了大约60%的准确度。我的问题是如何使用嵌入层来解决我的问题。实际上，我不太了解嵌入(为什么、何时和如何工作)，我只知道一个热向量不包含太多信息。我想知道嵌入是否能提高准确性。如果有人能在这些方面为我提供指导，对我将是非常有益的。(

浏览 1提问于2019-05-28得票数 1

回答已采纳

4回答

Keras嵌入层

、、

input_dim、output_dim和input_length在以下几个方面意味着什么：我从文件中了解到：因此，当我的输入是像google.com这样的单词时，

浏览 3提问于2017-09-11得票数 8

回答已采纳

2回答

使用functional API的Keras中的LSTM输入图层形状

、、、

我正在尝试在药物数据上实现LSTM，下面给出了数据的形状，也是模型，但它抛出了一个错误，即Input 0 is incompatible with layer lstm_1: expected ndim=3, found ndim=2。可以请有人帮助，什么将是模型的输入形状提前感谢。

浏览 30提问于2021-05-08得票数 0

2回答

如何利用嵌入层获取短语的向量表示并进行PCA

、、、、

考虑到我不想使用Word2Vec嵌入，我只想从我的神经网络的嵌入层中提取向量。它是一个分类器MLP，所以我定义了对应于文档中每个句子的类标签，我根据记号器模块为每个单词分配一个整数，我准备我所有的单词序列都具有相同的长度，因为keras喜欢这样工作，然后我最终定义、编译和拟合模型[[6, 2], [3, 1], [7, 4], [8, 1], [9], [10], [5, 4],

浏览 0提问于2021-11-12得票数 1

回答已采纳

1回答

如何在角点中建立嵌入层

、、、

我正试图在tensorflow中建立一个文本分类模型，这是根据Francois的一本书中的教程进行的。我首先尝试创建一个嵌入层，但是在这个阶段它一直在崩溃。我的逻辑如下： case)output_dim 以文本字符串列表为X开始，整数列表以y开头。标记、向量化和填充文本数据以最长的序列长度将每个整数标签转换为一个热编码数组馈送到一个嵌入层，输入：input_dim =唯一标记/单词

浏览 2提问于2019-12-18得票数 1

回答已采纳

1回答

Keras中嵌入层的尺寸问题

、、、、

问题:我定义的Keras嵌入层的似乎是错误的大小，正如我所得到的错误所暗示的那样。因为分类特性有许多独特的特性，所以我采取的策略是为每个分类特性训练一个Keras嵌入层，而不是一个热编码(它将数据压缩到难以处理的大小)。，人们已经得出结论，这是由于嵌入层的大小不正确，通常输入维度需要<

浏览 0提问于2020-03-09得票数 1

2回答

用Python提取分类特征的嵌入到原始数据帧

、、、、

嵌入大小为50，因此Keras返回的矩阵具有维数10002 x 50。额外的2行是用于未知类别的，而另一行我不知道--这是Keras工作的唯一方法，即，具有一个具有数字值

浏览 3提问于2020-05-17得票数 1

回答已采纳

1回答

在Keras中，如何在训练期间访问自定义损失函数的Word2Vec (嵌入)向量

、、、

我有一个keras RNN模型，就像这个模型使用预先训练好的Word2Vec权重。model = Sequential() model.add(L.Embedding(input_dim=vocab_size, output_dim=embedding_size,我想用预测向量做一些数学运算，并将它们与基本事实向量进行比较，以此作为监控进度的一种方式(而不是作为损失函数)。所以我需要一种"Keras-ful

浏览 15提问于2019-03-12得票数 1

1回答

keras理解字嵌入层

、、、

one_hot编码，为什么？在这种情况下，我们为什么要得到大小为50的embedding对象？即使两个单词有相同的one_hot号，它们有不同的嵌入吗？我如何才能理解哪个嵌入是哪个词的，即done对work 最后一层有33个

浏览 1提问于2019-02-22得票数 3

回答已采纳

2回答

Keras :第一个参数

在Keras中，如果您想要添加一个包含10个单元的LSTM层，则使用model.add(LSTM(10))。我听说过这个数字10被称为隐藏单元的数量和输出单元的数量( Keras代码第863行)。我的问题是这两件事是一样的吗？输出的维数是否与隐藏单位的数量相同？我读过一些教程(如和)，但没有一个明确说明这一点。

浏览 4提问于2017-04-10得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

为什么未知令牌的keras标记器需要嵌入的input_dim为vocab_size +2，而不是vocal_size+1

相关·内容

为什么未知令牌的keras标记器需要嵌入的input_dim为vocab_size +2，而不是vocal_size+1

如何在具有嵌入层的keras中建立序列到序列自动编码器？

ValueError:输入0与图层layer_1不兼容:需要的ndim=3，找到的ndim=2

使用mask_zero=True嵌入tf.keras，然后使用GlobalAveragePooling1D生成TypeError

为什么Keras嵌入层的矩阵是vocab_size + 1的大小？

向Keras层输入

流动嵌入层词汇大小

在整个x_data上使用Keras* fit_to_text更好还是只在train_data上呢？*

两个池层的对比特性

Keras用预先训练的嵌入来初始化大型嵌入层

嵌入/嵌入层在深度学习中的应用

Keras嵌入层

使用functional API的Keras中的LSTM输入图层形状

如何利用嵌入层获取短语的向量表示并进行PCA

如何在角点中建立嵌入层

Keras中嵌入层的尺寸问题

用Python提取分类特征的嵌入到原始数据帧

在Keras中，如何在训练期间访问自定义损失函数的Word2Vec (嵌入)向量

keras理解字嵌入层

Keras :第一个参数

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐