自制的嵌入是否适用于RNN，或者它们是否必须经过训练？

文章/答案/技术大牛

发布

0回答

、、、

假设我正在训练一个RNN用于分类，使用100个单词的词汇表。我可以跳过嵌入，将句子作为one-hot向量传递，但是对于100个特征的空间使用one-hot向量似乎非常浪费内存。而且随着词汇的增长，情况只会变得更糟。有没有什么原因我不能创建自己的嵌入，其中0-100的每个值都被转换为二进制并存储为长度为7的数组，即0=[0,0,0,0,0,0,0]，1=[1,0,0,0,0,0,0]，...，100=[1,1,0,0,1,0,0我意识到

浏览 1提问于2018-07-17得票数 1

1回答

动态RNN中初始状态的设置

、

根据链接：我目前正在调试我的RNN模型，因为它似乎将不同的问题分类在同一个类别中，这是很奇怪的。我怀疑这可能与我没有设置细胞的初始状态有关。

浏览 3提问于2019-05-15得票数 1

回答已采纳

1回答

RNN传感器训练中的标签对齐

、、

我试图了解RNN传感器是如何与地面真相标签训练的。在反恐委员会的情况下，我知道该模型是经过训练的损失函数，它总结了所有可能的地面真理标签的所有分数。但在RNN-T中，预测网络必须从最后一步接收输入，以产生类似于“教师强制”方法的输出。但我在这里的疑问是，地面真实标签是否应该被转换成所有可能的空标签对齐，并通过教师强制“方法”将每条直线传送到网络上？

浏览 1提问于2019-07-03得票数 3

1回答

一个只有10000个单词的字典真正需要什么嵌入层output_dim？

、、、

我正在训练一个RNN，它的一组词特征非常小，大约10,000。在添加RNN之前，我计划先从嵌入层开始，但我不清楚真正需要什么维度。我知道我可以尝试不同的值(32，64，等等)，但我宁愿先有一些直觉。例如，如果我使用32维嵌入向量，那么每个维只需要3个不同的值来完全描述空间(32**3>>10000)。或者，对于一个有少量单词的空间，是否真的需要使用嵌入层，还是从输入层直接转到R

浏览 0提问于2018-07-13得票数 7

1回答

<PAD>、<EOS>和<GO>标记的不同用法

、、

我发现<PAD>、<EOS>和<GO>标记有许多不同的用法。就我个人而言，我将这三个标记分开，并为它们分配不同的嵌入，具体地将全零嵌入向量分配给<PAD>标记(使用基于RNN的seq2seq模型)。我想知道是否存在这些令牌的最佳使用(就基于RNN的模型或基于transformer的模型而言)。

浏览 0提问于2020-06-19得票数 1

1回答

RNN和LSTM在tensorflow中的实现

、

我一直在努力学习如何在tensorflow中对RNN和LSTM进行编码。我在网上找到了一个例子 X是要输入的数据，y是标签的集合。以下是我<e

浏览 1提问于2016-10-25得票数 2

回答已采纳

1回答

在训练神经网络的过程中应该改变嵌入层吗？

、

我是深度学习和Pytorch领域的新手。所以我的问题是，在训练网络的过程中，嵌入应该改变吗？如果我想要将预先训练的嵌入(例如，经过训练的word2vec嵌入)加载到PyTorch嵌入层中，是否应该在训练过程中也更改预先训练的嵌入？

浏览 12提问于2019-08-01得票数 3

4回答

文本处理的支持向量机还是人工神经网络？

、、

哪种方法是正确的？或者有没有这两个的替代方案...比范恩和支持向量机更合适的方法吗？

浏览 1提问于2010-03-13得票数 14

回答已采纳

2回答

如何在Tensorflow RNN中建立嵌入层？

、、、

我只是根据单词的频率对它们进行分类，并给出了它们的索引。tf.random_uniform([vocab_size, hidden_size], -1, 1))这是否意味着我们正在构建一个学习嵌入的层如果我在代码中使用这两行代码，就会得到一个错误： TypeError:传递给参数‘int64’的值在允许的值列表中没有Dat

浏览 0提问于2018-09-04得票数 8

1回答

Tensorflow:在输入输入之前拆分占位符？

我的模型通过提要接收一个输入序列，然后必须在模型中用分隔符将该序列拆分。然而，由于Tensorflow的图表要求我们将占位符放在前面，我不知道如何实现这一点。有没有一种方法可以创建一个可以处理模型中不断变化的张量数量和形状的模型？

浏览 2提问于2016-03-08得票数 1

2回答

理解变压器的自重计算

、

utm_source=blog&utm_medium=demystifying-bert-groundbreaking-nlp-framework#comment-160771变压器模型自重计算中的键值查询向量是被查询的单词的嵌入向量，对吗？在RNN中计算注意力是否与变压器中的自我注意不同？

浏览 0提问于2020-11-09得票数 0

1回答

基于图像标签生成有意义的图像描述

、、、、

目前，我和我的三个朋友正在进行一个项目，基于特定图像中的对象生成图像描述(当向系统提供图像时，必须基于对象和它们之间的关系生成新颖的描述)。因此，简单地说，一个人正在计划识别图像中的对象，并使用基于快速区域的CNN (FRCNN)对它们进行标记。在我的部分中，我必须根据这些图像标签( FRCNN的输出正计划作为我的RNN的输入)

浏览 11提问于2017-07-05得票数 0

1回答

将脚本列表作为cron作业运行的标准解决方案(也许是fluentd？)

、、、、

我需要定期运行几个脚本，并以普罗米修斯指标的格式重新发送它们的输出。目前，我在Flask上使用了自制的解决方案和一个后台cron作业，将输出转储到文件中，解析它们并转换为.prom格式，然后通过NodeExporter公开。简明。这似乎是夸大其词，而且是自制的，毫无意义。我想知道是否有一个标准的解决方案，它可以运行脚本，解析他们的输出，并以/metrics或以普罗米修斯或Fluentd格式重发？ Fluen

浏览 2提问于2018-08-08得票数 0

1回答

具有不同嵌入尺寸的经过训练模型上的resize_token_embeddings

、、、、

我想问一下如何改变经过训练的模型的嵌入大小。from transformers import AutoTokenizer

浏览 52提问于2022-06-27得票数 2

回答已采纳

1回答

Tensorflow:我的rnn总是输出相同的值，rnn的权重没有经过训练。

、

我使用tensorflow实现了一个简单的RNN模型，以了解时间序列数据的可能趋势并预测未来值。然而，模型在训练后总是产生相同的值。实际上，它得到的最好的模型是：(也许这些不是很好的设置。但无论我如何改变它们，结果几乎是一样的。因此，我只是设置这些，以帮助显示他们以后。)我发现这是因为BasicRNNCell的权

浏览 0提问于2019-03-15得票数 3

3回答

用于Linux兼容性的Nvidia视频卡驱动程序

、、

我想购买一个新的显卡，但所有供应商只为Windows提供驱动程序，而Nvidia提供Linux驱动程序，我的问题是我是否可以使用来自nvidia的驱动程序，或者它们是否必须来自制造商？

浏览 0提问于2013-07-31得票数 1

1回答

用Python脚本预测SSIS包中的数据

、、、、

我知道微软在他们的SQL服务器机器学习服务中包含了Python，但是这仅适用于server 2017及以上版本，这是我的服务器目前无法满足的要求。在这种情况下，我希望完全在SSIS中部署具有经过训练的生成预测模型管道，即：是否有一种方法完全在SSIS中完成，<e

浏览 1提问于2019-02-18得票数 3

回答已采纳

1回答

如何将Windows3.5的安装添加到Windows2008Server R2的安装程序中

、、、、

我有一个自制的引导程序(称为SetUp.exe)，它检查目标计算机上是否安装了.NET 3.5，如果没有，则通过运行dotnetfx35.exe来启动安装。很好。这适用于我需要的所有情况，除了Windows2008Server R2。在此操作系统上，.NET installer不安装/启用.NET 3.5。相反，它会弹出一个对话框，指示用户必须手动启用它。我更喜欢从我的引导程序exe中或者从我的基于WiX的

浏览 0提问于2010-10-07得票数 0

1回答

密集层对不同识别任务的一般有用性

、、、、

我想问，在任何形式的识别任务中使用嵌入和相似性度量实用吗？如果我有一个经过训练的神经网络来查找照片中的不同对象，提取完全连接的层/密集层并对它们进行聚类是否有用？我最近发现有一个来自tensorflow的嵌入式投影仪工具，非常酷和有用。我知道在单词嵌入以及相似单词如何聚在一起方面已经有了一些工作。对于面孔也是如此。话虽如此，我还是想用同样的方法来分析地质遗迹；我可以训练一

浏览 8提问于2020-03-14得票数 0

1回答

我必须扩展什么才能让自定义网格具有良好的性能？

、、

我需要一个具有不同高度的行的GridView。仅适用于行，不适用于行中的项。在一行中，项目具有相同的高度。因此，似乎我必须创建一个自定义视图。它必须具有非常好的性能和较低的内存使用量。是

浏览 0提问于2012-06-29得票数 0

回答已采纳

点击加载更多