如何使用TensorFlow LSTM教程进行字符级语言建模？

TensorFlow是一个开源的机器学习框架，提供了丰富的工具和库来支持各种深度学习任务。LSTM（长短时记忆网络）是一种特殊的循环神经网络（RNN），在自然语言处理领域中广泛应用于语言建模、文本生成等任务。

要使用TensorFlow进行字符级语言建模，可以按照以下步骤进行：

数据准备：
- 准备一个包含大量文本的数据集，可以是小说、新闻文章等。
- 将文本数据转换为字符级别的序列，每个字符作为一个样本。
- 构建字符到索引的映射表，方便后续将字符转换为数字表示。
数据预处理：
- 将字符序列划分为输入序列和目标序列，用于训练模型。
- 将字符序列转换为数字序列，方便输入到神经网络中。
- 对输入序列和目标序列进行独热编码，将其转换为二维张量。
构建模型：
- 导入TensorFlow和相关库。
- 定义LSTM模型的结构，包括输入层、LSTM层、输出层等。
- 设置模型的超参数，如隐藏层大小、学习率等。
模型训练：
- 定义损失函数，一般使用交叉熵损失函数。
- 选择优化器，如Adam优化器。
- 使用训练数据进行模型训练，不断迭代优化模型参数。
模型评估：
- 使用测试数据评估模型的性能，计算损失值和准确率等指标。
模型应用：
- 使用训练好的模型进行字符级语言建模，生成新的文本序列。

在腾讯云上，可以使用TensorFlow的GPU版本进行加速训练，提高模型训练的效率。腾讯云提供了云服务器、GPU云服务器等产品，可以满足不同规模和需求的深度学习任务。

更多关于TensorFlow LSTM的教程和示例，可以参考腾讯云的文档和示例代码：

TensorFlow官方文档：https://www.tensorflow.org/
TensorFlow中文社区：https://tensorflow.google.cn/
腾讯云AI Lab：https://ai.tencent.com/ailab/

请注意，以上答案仅供参考，具体实现细节和代码实现可能需要根据具体情况进行调整和修改。

我怎么才能转移到文字层面的困惑呢？

、、

我在TensorFlow中构建了一个基于的下一个字符预测神经网络。因此，我能够成功地计算出给定测试序列的下一个字符的概率分布。取所有log概率的平均值，我可以成功地得到“字符级别的困惑”。我几乎已经使用了这个中的代码来实现这个目标。但是，我需要转到"word级困惑“，因为我需要将我的模型与标准结果进行比较，其中大多数报告了基于"word级困惑”的语言模型的有效性。(维基百科描述了单词级的困惑) 正确的方法是什么？有可能吗？

浏览 1提问于2016-12-03得票数 1

回答已采纳

2回答

使用TensorFlow构建会话模型

我想构建一个会话模型，它可以使用TensorFlow LSTM使用前面的句子来预测句子。TensorFlow教程中提供的示例可用于预测句子中的下一个单词。 lstm = rnn_cell.BasicLSTMCell(lstm_size) # Initial state of the LSTM memory. state = tf.zeros([batch_size, lstm.state_size]) loss = 0.0 for current_batch_of_words in words_in_dataset: # The value of state is updated

浏览 2提问于2016-02-12得票数 2

4回答

在LSTM中“截断梯度”是什么意思？

、、

我正在学习关于LSTM：的tensorflow教程。这一节说代码使用“截断反向传播”，那么这到底意味着什么呢？

浏览 9提问于2016-08-01得票数 4

回答已采纳

2回答

默认初始化Tensorflow LSTM状态和权重？

、、、、

我在使用Tensorflow的LSTM细胞。 lstm_cell = tf.contrib.rnn.BasicLSTMCell(lstm_units) 我想知道权值和状态是如何初始化的，或者确切地说，对于Tensorflow中的LSTM单元格(状态和权重)，默认的初始化器是什么？是否有一种简单的方法来手动设置初始化程序？注意:对于tf.get_variable()，glorot_uniform_initializer是尽可能从中找到的。

浏览 2提问于2018-03-11得票数 1

回答已采纳

1回答

TensorFlow:简单递归神经网络

、、、

我用TensorFlow建立了一些神经网络，比如基本的MLP和卷积神经网络。现在我想转到递归神经网络。然而，我在自然语言处理方面没有经验。因此，对于我来说，RNN的TensorFlow NLP教程并不容易阅读(也不是很有趣)。基本上，我想从一些简单的东西开始，而不是LSTM。如何在TensorFlow?中建立一个简单的递归神经网络，如Elman网络。我只能找到TensorFlow的GRU或LSTM示例，主要用于NLP。有人知道一些简单的递归神经网络教程或TensorFlow的例子吗？下图显示了一个基本Elman网络，它通常简单地称为SRN (简单递归网络)：

浏览 2提问于2016-04-25得票数 9

回答已采纳

1回答

Keras神经网络: TypeError: LSTM()缺少一个必需的位置参数：'Y‘

、、、、

我正在尝试使用Keras (2.2.0版)和TensorFlow (1.1.0版)来训练一个LSTM神经网络。我知道有更新的TensorFlow版本，但不幸的是，。但是，我不认为我的问题与TensorFlow版本有关。这就是我的Keras代码的样子： [...] from keras.layers import Dense, Dropout, LeakyReLU, LSTM, Activation, Dense, Dropout, Input, Embedding def LSTM(X,Y): inputDimension = len(X[0]) inputSize = l

浏览 0提问于2018-07-23得票数 5

回答已采纳

2回答

水平分层LSTM单元

、、、、

我对整个神经网络领域都很陌生，我刚刚读了一些关于LSTM细胞的教程，特别是tensorflow。在本教程中，他们有一个对象tf.nn.rnn_cell.MultiRNNCell，据我理解，它是LSTM单元的垂直分层，类似于分层卷积网络。但是，我无法找到关于水平 LSTM单元的任何信息，其中一个单元格的输出是另一个单元格的输入。我明白，因为这些细胞是反复出现的，他们不需要这样做，但我只是想看看这是否真的有可能。干杯!

浏览 0提问于2016-07-20得票数 1

1回答

基于参数的NLP文本生成

、

我想根据某些参数的值生成一些文本。例如，假设我想生成视频游戏的描述。因此，除了训练数据的真实描述外，我希望模型考虑到有关游戏的下列参数(例如)：暴力:是的多平台:是毒品:不因此，如果游戏有毒品内容，输出文本有一些短语引用它。这个是可能的吗？如果是这样的话，我怎么能用Python来做呢？我打算在Tensorflow中使用LSTM神经网络。

浏览 0提问于2020-03-05得票数 0

回答已采纳

1回答

在tensorflow中这两个LSTM实现有什么不同，如何初始化LSTM的8个权重矩阵？

、、、、

我对如何定义LSTM的权重矩阵感到困惑。由于LSTM有8个权重矩阵，我不知道如何在tensorflow中初始化这些LSTM的权重矩阵。但是后来我发现了这个，它完全有意义，因为它有所有的8个权重矩阵，但它没有使用LSTM的tensorflow实现。与LSTM方程一致。但是在LSTM的tensorflow 中，我不知道如何定义所有这8个权重矩阵，因为它们是在上面的第一个实现中定义的。你能帮帮我吗？

浏览 1提问于2016-08-05得票数 1

4回答

我如何用tf.keras.layers.Attention建立一个自我关注的模型？

、、

我已经完成了一个简单的多对一的LSTM模式如下。 from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense from tensorflow.keras.layers import LSTM from tensorflow.keras.layers import Dropout model=Sequential() model.add(LSTM(2**LSTM_units,input_length=data.shape[1],input_dim=data.shape[2],re

浏览 0提问于2020-06-22得票数 11

2回答

Tensorflow:用三维特征数组传递CSV

、、、、

我打算在Tensorflow中用于LSTM培训的当前文本文件如下所示： > 0.2, 4.3, 1.2 > 1.1, 2.2, 3.1 > 3.5, 4.1, 1.1, 4300 > > 1.2, 3.3, 1.2 > 1.5, 2.4, 3.1 > 3.5, 2.1, 1.1, 4400 > > ... 有3个序列，3个特征向量，每个样本只有一个标签。我格式化了这个文本文件，这样它就可以与LSTM训练保持一致，因为后者需要序列的时间步骤，或者通常，LSTM训练需要一个3D张量(批处理，时间步骤数，特征值)。我的问题是:我应该如何使用

浏览 3提问于2016-09-18得票数 0

回答已采纳

1回答

TensorFlow转换为预测温度

、、

我最近开始学习TensorFlow。我学习了关于的教程，并决定进一步研究RNN / LSTM模型。本教程解释了如何使用和绘制模型，但我也想尝试将输出值转换为“真实”值。如何从测试数据集中提取预测值并将其转换为温度？

浏览 8提问于2022-03-07得票数 0

1回答

TF-2.0W手术改变了。禁用急切模式并使用回调时

、、、、

我正在使用TF2.0中的一些LSTM层。为了训练目的，我使用回调LearningRateScheduler，为了速度目的，我禁用了Tensorflow (disable_eager_execution)的急切模式。但当我同时使用这两种功能时，tensorflow会发出警告： Operation ... was changed by setting attribute after it was run by a session. This mutation will have no effect, and will trigger an error in the future. Either d

浏览 14提问于2019-12-13得票数 2

2回答

利用TensorFlow的RNN (LSTM)语言模型，得到下一个词的概率分布。

、、

我正在运行TensorFlow的RNN (LSTM)语言模型示例。它运行和报告的困惑是完美的。不过，我想要的是三件事：给定一个序列(例如，w1，w5，w2000，w750)，给出下一个单词在词汇表上的概率分布。我不知道如何处理教程中的模型。我希望模型返回最可能序列的排序(例如，n-g)，n可以作为输入。和给出一个序列，我要它的概率。我是TensorFlow和RNN的新手，所以如果你需要比我提供的更多的信息，请告诉我。语言模型的代码是。

浏览 6提问于2016-08-31得票数 1

回答已采纳

1回答

Tensorflow LSTM模型试验

、、、、

我是LSTM和Tensorflow的新手，我尝试使用LSTM模型来学习和分类我拥有的一些巨大的数据集。(我并不担心我打算学习的准确性)。我试图以类似于使用LSTM的PTB单词预测教程的方式实现该模型。教程()中的代码使用下面的行使用模型运行会话 cost, state, _ = session.run([m.cost, m.final_state, eval_op], {m.input_data: x, m.targets: y,

浏览 2提问于2016-04-29得票数 1

1回答

如何在tensorflow中实现一个更复杂的initial_state

、、

我目前正在使用tensorflow和python处理多层LSTM。我使用initial_state在tf.nn.dynamic_rnn中将单元格的前一个状态传递到下一步。创建这样的层： cells = [] for c in range(0, num_layers): cells.append(tf.nn.rnn_cell.BasicLSTMCell(num_units = num_units, forget_bias = 1.0, activation = tf.nn.tanh)) basic_cell = tf.nn.rnn_cell.MultiRNNCell(cells) st

浏览 0提问于2018-03-22得票数 0

1回答

训练保存的tensorflow模型时出错

、、、、

我正在尝试使用子类化API构建一个自定义的keras模型，但是当我加载我的模型的前一个实例并尝试训练它时，我得到了一些错误：这是我的模型的类，它有3个输入和1个输出： import tensorflow as tf spec1 = tf.TensorSpec(shape=(1,40,5,1)) spec2 = tf.TensorSpec(shape=(1,3)) class Conv_Rnn_model(tf.keras.Model): def __init__(self): # super() permet d'appeler le construct

浏览 7提问于2020-08-09得票数 0

2回答

由于未设置输入形状，无法保存ActorCritic模型。

、、

我想拯救一个演员-评论家模型，但这个问题发生了。 import os import tensorflow as tf from tensorflow.keras.layers import Flatten, Dense, LSTM, BatchNormalization from tensorflow.keras import Model class ActorCritic(Model): def __init__(self, action_size, state_size): super(ActorCritic, self).__init__()

浏览 0提问于2021-10-24得票数 1

1回答

理解TensorFlow模型作为类和TensorFlow会话是如何交互的

、、、、

我使用TensorFlow已经有相当长的时间了。并且相信我对TensorFlow图是如何在会话中工作和执行的有了彻底的了解。但是，我已经以类似脚本的方式编写了所有的TensorFlow模型，如下所示： import tensorflow as tf import DataWorker import Constants x = tf.placeholder(tf.float32, [None, Constants.sequenceLength, DataWorker.numFeatures]) y = tf.placeholder(tf.float32, [None, 1]) xTensors

浏览 4提问于2017-10-05得票数 2

1回答

利用tensorflow建立一种用于时间序列预测的双层LSTM

、、、、

在Tensorflow教程中，我正在实验LSTM时间序列在使用LSTM的“多步预测”一节中，教程说由于这里的任务比以前的任务要复杂一些，所以模型现在由两个LSTM层组成。最后，由于72个预测，致密层输出72个预测。之前的任务是单点预测。我们如何知道一个问题需要多少层(在这里，2层)？然后，从实现的角度，使用Python库， multi_step_model = tf.keras.models.Sequential() multi_step_model.add(tf.keras.layers.LSTM(32,

浏览 0提问于2019-12-25得票数 2

回答已采纳

1回答

Tensorflow LSTM可变范围ValueError当代码跨多个木星单元时

、、、

起初，我以为我误解了Tensorflow API的一些地方。现在，我怀疑我只是误解了在木星笔记本中如何管理可变范围。如果我将所有代码插入到jupyter笔记本中的单个单元格中并运行它，那么Tensorflow的LSTM教程示例工作得很好。但是，当我将程序分割成单独的单元格时，即使以正确的顺序运行所有内容(首先定义等)，我也会得到一个可变范围错误： 15 # Get lstm cell output ---> 16 outputs, states = rnn.static_rnn(lstm_cell, x, dtype=tf.float32) ValueErr

浏览 2提问于2017-09-22得票数 0

3回答

使用RNN生成文本时，它总是预测相同的字母

、、、、

我正在尝试使用RNN创建一个简单的文本(名称)生成器。我很好地创建了模型，但当我尝试预测值时，我总是得到相同的字母。我的代码如下： from tensorflow.keras.activations import softmax from tensorflow.keras.losses import categorical_crossentropy from tensorflow.keras.models import Sequential from tensorflow.keras.layers import LSTM, Dense # parameters LSTM_NODES = 1

浏览 0提问于2020-03-10得票数 1

1回答

LSTM网络的输入序列排序

、、

当用时间序列数据训练LSTM网络时，我想这些数据的顺序很重要，我的问题是这种排序应该如何. 让我们取一个时间序列向量，它将是LSTM的输入： [X= X_0，x_{小(-1\小)}，x_{小(-2小)}，\l点，x_{small(-N\small)}] 带有指示过去值的负索引。应该给哪个向量喂食(理论上的情况，与任何API无关)： [X= X_0，x_{小(-1\小)}，x_{小(-2小)}，\l点，x_{small(-N\small)}] 或 [ X^r = X_{小(-N\small)}，\l点，x_{小(-2小)}，x_{小(-1\小)}，x_0] 更准确地说，在TensorFlow

浏览 0提问于2018-10-31得票数 1

回答已采纳

1回答

LSTM机器学习熊猫

、

实际上，我正在尝试使用TensorFlow和LSTM。为此，我在文本文件(10MB)中有数据。当我尝试复制numpy中的数据时，我得到内存已满错误。如何准备数据以便在LSTM中使用，有什么建议吗？在使用此函数处理张量流之前，从File读取数据： def read_data(fname): with open(fname,encoding="utf8") as f: content = f.readlines() content = [x.strip() for x in content] content = [word for i

浏览 15提问于2019-09-10得票数 0

1回答

如何使用机器学习和LSTM来确定价格预测中的层数和单位数？

、、、、

我正在尝试为一个与预测(类似于股票价格预测)相关的问题提出一个实验性的解决方案。我已经阅读了很多关于使用机器学习和使用LSTM (keras和tensorflow)进行股票价格预测的文档。我了解机器学习本身的一般理论，以及LSTM层如何在幕后工作。在经典的“苹果(Apple)股价预测”场景中，我看到的教程有3层和50个单元，其他的只有2层和128个单元。在我必须自己编写代码的情况下，我如何确定LSTM的数量和预测正常工作所需的单元数量？我目前的主要猜测是试图通过试验和错误来找出答案。我想知道问题、数据和解决方案之间是否存在某种关系。此外，如果有人能解释拥有更多/更少的LSTM层和更多/

浏览 7提问于2021-09-15得票数 0

2回答

如何用tensorflow2和keras在多gpus上训练模型？

、、、

我有一个LSTM模型，我想训练多个gpus。我对代码进行了转换，在nvidia-smi中，我可以看到它正在使用所有gpu的所有内存，每个gpu都在使用大约40%的内存，但每批培训的估计时间几乎与1个gpu相同。有人能引导我，告诉我如何在多个gpus上进行适当的训练吗？我的代码： import tensorflow as tf from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense from tensorflow.keras.layers import LSTM fro

浏览 26提问于2019-11-28得票数 1

回答已采纳

1回答

如何利用LSTM层的tensorflow集线器嵌入模型？

、、

我正在学习tensorflow 2，通过TF集线器教程完成文本分类。它使用了TF集线器的嵌入模块。我想知道是否可以修改模型以包括LSTM层。以下是我尝试过的： train_data, validation_data, test_data = tfds.load( name="imdb_reviews", split=('train[:60%]', 'train[60%:]', 'test'), as_supervised=True) embedding = "https://tfhub.dev/go

浏览 5提问于2020-06-23得票数 4

回答已采纳

1回答

Tensorflow keras顺序.add与内联定义不同？

、、

当我通过声明性方法而不是函数方法定义我的模型时，Keras给出了不同的结果。这两个模型看起来是等价的，但是使用".add()“语法是可行的，而使用声明性语法会产生错误--每次都有不同的错误，但通常是这样的：A target array with shape (10, 1) was passed for an output of shape (None, 16) while using as loss `mean_squared_error`. This loss expects targets to have the same shape as the output.输入形状的自动转换

浏览 7提问于2019-11-05得票数 0

回答已采纳

2回答

Tensorflow序列到序列LSTM (嵌套)

、、、、

我想构建一个带有特殊单词嵌入的LSTM，但是我有一些关于这将如何工作的问题。正如您可能知道的，一些LSTM操作字符，所以它是字符中，字符外。我也想这样做，通过对单词的抽象来学习一个健壮的嵌入在它们上的嵌套LSTM，以抵抗轻微的字符级错误。因此，一个微小的LSTM会在一个单词的每一个字母上展开，然后这个单词就会被嵌入。然后，将句子中的每个嵌入单词作为输入输入到更高级别的LSTM，LSTM将在每个时间步骤中在一个单词级别上操作，而不是在字符上操作。问题：-我再也找不到关于这个问题的研究论文了。如果你知道我说的话，我想在我想做的事情上加上一个名字。-是否已经存在一些TensorFlow开源代码

浏览 6提问于2016-06-18得票数 4

回答已采纳

1回答

AttributeError：'NoneType‘对象没有属性’汇总‘

、、、、

我开始学习如何用keras来实现神经网络。然而，我刚才偶然发现了这个错误。我不知道我在这里做错了什么。我在youtube上的Valerio：教程旁工作。我的代码： import tensorflow from tensorflow.keras import Model from tensorflow.keras.layers import Input, Dropout, LSTM class GNN: """ GNN is a graph neural network. """ def __init__(self,

浏览 7提问于2022-01-03得票数 0

1回答

Tensorflow中的LSTM反向传播

、

在扇区截断反向传播的PTB google官方教程中，有一个使用BasicLSTMCell的实现，它通过创建一个for循环来展开num_steps步骤的图形。 # Placeholder for the inputs in a given iteration. words = tf.placeholder(tf.int32, [batch_size, num_steps]) lstm = rnn_cell.BasicLSTMCell(lstm_size) # Initial state of the LSTM memory. initial_state = state = tf.zeros([

浏览 14提问于2016-07-29得票数 1

回答已采纳

1回答

NLP:与标准的单词标记器相比，使用子词标记器有什么好处？

、、、

我正在看这个Tensorflow colab教程，介绍如何用Transformers，https://www.tensorflow.org/tutorials/text/transformer来翻译语言，他们用一个子单词文本标记器来标记这些单词。我以前从未见过一个子词记号器，也不知道为什么或什么时候应该使用它，而不是单词记号器。这篇教程说The tokenizer encodes the string by breaking it into subwords if the word is not in its dictionary. 为了了解结果可能是什么样子，工作Transformer被分

浏览 0提问于2020-10-09得票数 3

回答已采纳

1回答

时间序列预测训练模型

、、

因此，我加载并预处理了我的数据，以便进行时间序列预测。我已经建立了一个模型，但现在我不知道如何真正地训练它。以下是代码： import tensorflow as tf import pandas as pd import numpy as np import matplotlib as plt # Loading Data df = pd.read_csv("testdata.csv", header=0, parse_dates=[ 0], names=['Month', 'People'], index

浏览 1提问于2020-05-27得票数 0

回答已采纳

1回答

tensorflow -卷积+ lstm

我试图从本文实现图1的体系结构。我遵循了关于tensorflow的lstm教程，但这并没有帮助我，因为输入的数据没有及时转移。我需要在上运行CNN，每个帧在一个序列中，然后提供给lstm。有人知道这方面的任何示例代码吗？

浏览 3提问于2017-10-08得票数 1

1回答

train_data.cache().shuffle(BUFFER_SIZE).batch(BATCH_SIZE).repeat()是做什么的？

、、、

我正在学习Tensorflow的timeseries/LSTM教程，并且很难理解这一行是做什么的，因为它没有得到真正的解释： train_data.cache().shuffle(BUFFER_SIZE).batch(BATCH_SIZE).repeat() 我试图查找不同的模块做什么，但我无法理解完整的命令及其对数据集的影响。下面是整个教程：

浏览 6提问于2020-05-18得票数 2

回答已采纳

1回答

如何选择LSTM中的隐藏层数和存储单元数？

、

如何选择LSTM中的隐藏层数和存储单元数？我想建立关于分类的LSTM模型。 from tensorflow.keras import Sequential model = Sequential() model.add(Embedding(44000,32)) model.add(LSTM(32)) model.add(Dense(1, activation='sigmoid'))

浏览 1提问于2022-09-01得票数 -2

1回答

如何找出模型本身使用的VRAM大小？(LSTM)

、、、、

如何了解此机型的VRAM使用率？(不是关于正在训练的数据，而是将模型及其权重加载到VRAM中 from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense,Dropout,LSTM,BatchNormalization import tensorflow as tf model = Sequential() model.add(LSTM(700, input_shape=(10000,5000,20), return_sequences=True)) model.add(D

浏览 13提问于2020-09-04得票数 0

3回答

与Keras的经验是否等同于使用Tensorflow的经验？

、、、

很多我见过的机器学习工作岗位要求使用Tensorflow的经验。如果我有使用Tensorflow的经验，但只能通过使用Keras构建神经网络。这算不算？我还没有看到在没有Keras的情况下使用Tensorflow的教程或任何代码，所以我看不出人们是如何严格学习Tensorflow的。但是为什么雇主不直接要求使用Keras的经验呢？

浏览 0提问于2021-01-28得票数 0

回答已采纳

2回答

从TensorFlow模型中求出概率分布曲线

、、、、

我试着学习如何使用TensorFlow，所以我试图建立一个概率ML模型，根据最近n天的价格序列得到第二天股票价格的概率分布。在这样做的时候，我设法预测了第二天的价格，但没有得到模型的概率分布。如何从TensorFlow模型中得到模型预测所依据的曲线？这是我到目前为止得到的预测第二天的实际价格的代码(使用这个视频：)： import pandas as pd import numpy as np import matplotlib.pyplot as plt from datetime import datetime from datetime import timedelta from

浏览 4提问于2022-08-14得票数 0

1回答

正确格式化tensorflow serving LSTM的JSON

、、

我有一个tensorflow LSTM模型，其中预测函数的输入是100行5列。当numpy数组为1,100，5时的形状。我正在努力解决如何正确格式化JSON请求以将其发送到tensorflow服务端点的问题。当前托管在google云上，但很可能最终成为tensorflow服务的docker图像。任何关于如何正确格式化数据以发送到TF的帮助都将非常有用，因为我正在努力在他们的文档中找到正确的格式。谢谢!

浏览 18提问于2021-04-11得票数 2

1回答

升级代码rnn.static_bidirectional_rnn以适应tensorflow 2.0API

、、、、

import tensorflow as tf from tf.contrib import rnn lstm_f = rnn.BasicLSTMCell(n_hidden, forget_bias=1.0) lstm_b = rnn.BasicLSTMCell(n_hidden, forget_bias=1.0) blstm_out, state_f, state_b = rnn.static_bidirectional_rnn(lstm_f, lstm_b, x, dtype=tf.float32) 上面的代码与tensorflow 1.x一起工作，但是我很难找到一种使用tensorflo

浏览 5提问于2019-05-07得票数 2

回答已采纳

1回答

通过Tensorflow 2.0中的keras api使用LSTM中的功能列

、、、

我喜欢用TensorFlow2.0中的keras api构建一个LSTM 我的标签应该依赖于几个时间序列，包括数字和分类变量。构建正常神经网络时，特征列" feature“() 是非常有帮助的，因为我不需要做一个热编码。当切换到LSTM时，是否仍然可以使用功能列" feature“？你能给我发一本Jupyter Notebook /教程，告诉我如何实现它吗？你好，乔纳森

浏览 6提问于2019-10-24得票数 1

2回答

Tensorflow中的动态LSTM模型

、、、、

我希望设计一个LSTM模型使用Tensorflow，其中的句子是不同的长度。我遇到了一个关于PTB数据集()的教程。这个模型如何捕捉不同长度的实例？该示例没有讨论任何有关填充或其他处理可变大小序列的技术。如果我使用填充，展开尺寸应该是什么？

浏览 3提问于2016-07-18得票数 1

回答已采纳

1回答

Tensorflow的API: seq2seq

、、、

我一直在遵循教程创建和训练一个基于rnn的聊天机器人，使用tensorflow。据我所知，这些教程是在较早版本的tensorflow上编写的，因此有些部分已经过时，给我一个错误，比如： Traceback (most recent call last): File "main.py", line 33, in <module> outputs, last_state = tf.nn.seq2seq.rnn_decoder(inputs, initialstate, cell, loop_function=None, scope='rnnlm

浏览 0提问于2017-03-06得票数 1

回答已采纳

2回答

tensorflow-Keras LSTM VAE -无法转换RHEL7上的符号张量错误- Airflow

、、、、

我有一个错误 {taskinstance.py:1455} ERROR - Cannot convert a symbolic Tensor (lstm_4/strided_slice:0) to a numpy array. This error may indicate that you're trying to pass a Tensor to a NumPy call, which is not supported 回溯(最近一次调用) 当我使用下面的代码创建LSTM-VAE模型时。配置： Python: 3.7.9 Tensorflow: 2.4.0 NumPy: 1.1

浏览 121提问于2021-04-28得票数 0

回答已采纳

1回答

如果我在LSTM上面堆叠一个完全连接的层，那么LSTM的长度如何变化呢？

、、、

我尝试构建一个长度可变的LSTM。首先，我创建LSTM单元，然后堆叠一个具有2个输出节点的完全连接层。代码如下： from tensorflow.keras.models import Sequential from tensorflow.keras.layers import LSTM, Dense, TimeDistributed from tensorflow.keras.utils import to_categorical import numpy as np model = Sequential() model.add(LSTM(32, return_sequences=Tr

浏览 61提问于2020-07-29得票数 0

回答已采纳

2回答

无法将Tensorflow从1.0转换为Tensorflow 2.0

、

我有tensorflow 1.0版本的代码，无法使用下面的语法转换tensorflow 2.0。你能帮帮我吗？ a) lstm_cell =tf.keras.layers.LSTM(units=hidden_unit) #lstm_cell = tf.compat.v1.nn.rnn_cell.DropoutWrapper(lstm_cell, output_keep_prob=self.dropout_keep_prob) Q -1)如何在Tf2.0上为lstm_cell使用drop out？ b) self._initial_state = lstm_cell.zero_state(sel

浏览 2提问于2019-12-04得票数 1

1回答

tensorflow如何确定哪些LSTM单元将被选为输出？

、、、

我使用以下代码创建了一个LSTM模型： model = tensorflow1.keras.Sequential() model.add(tensorflow1.keras.layers.LSTM(128, input_shape=(720, 4), return_sequences=True)) model.add(tensorflow1.keras.layers.LeakyReLU(alpha=0.5)) model.add(tensorflow1.keras.layers.LSTM(128, return_sequences=True)) model.add(tensorflow1.ke

浏览 3提问于2021-03-15得票数 0

回答已采纳

1回答

从通用语句编码器输出生成LSTM输入

、、、、

我正在研究一个使用LSTM和从通用句子编码器获得的嵌入的多类分类问题。在此之前，我使用了手套嵌入，并获得了所需的输入形状(batch_size，timesteps，input_dim)。我计划使用通用语句编码器，发现通用语句编码器的输出是2d批处理、功能的。我怎样才能做出所需的改变。 LSTM +通用语句编码器 EMBED_SIZE = 512 module_url = "https://tfhub.dev/google/universal-sentence-encoder-large/3" embed = hub.Module(module_url) def Unive

浏览 0提问于2019-05-29得票数 4

5回答

ValueError:形状(None，1)和(None，3)不兼容

、、

我有一个三维数据集的音频文件，其中X.shape是(329,20,85)。我想有一个辛普尔赤裸的模型运行，所以请不要挑剔，只解决手头的问题。以下是代码： model = tf.keras.models.Sequential() model.add(tf.keras.layers.LSTM(32, return_sequences=True, stateful=False, input_shape = (20,85,1))) model.add(tf.keras.layers.LSTM(20)) model.add(tf.keras.layers.Dense(nb_classes, activa

浏览 0提问于2020-05-01得票数 28

回答已采纳