腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9384)
视频
沙龙
1
回答
如
何为
通过
序列
示例
训练
的
rnn
模型
提供
测试
输入
、
、
我正在尝试
通过
序列
示例
提供
训练
数据
的
方法,
如
链接
通过
输入
管道和队列
训练
基于LSTM
的
RNN
模型
中所述。由于这些
示例
是符号引用,我不清楚如何在经过
训练
的
模型
上
提供
单个或一批
测试
输入
。
浏览 9
提问于2017-06-26
得票数 0
2
回答
Keras变量
输入
、
我正在研究https://www.tensorflow.org/tutorials/text/text_generation上
的
一个Keras
示例
这个
模型
是这样构建
的
: def build_model(vocab_size, embedding_dim,
rnn
_units, batch_size): tf.keras.layers.Embeddingbatch_inpu
浏览 18
提问于2020-10-31
得票数 1
回答已采纳
1
回答
如何在TensorFlow import_graph_def中改变
输入
维数
、
我
的
场景: 定义
RNN
模型
结构,并使用具有固定批大小和
序列
长度
的
输入
对其进行
训练
。冻结
模型
(即将所有可
训练
变量转换为常量),生成包含
测试
时使用该
模型
所需
的
一切
的
GraphDef (
通过
tf.graph_util.convert_variables_to_constants)。问题:所有这些都可以工作,直到我将
输入
传递给<em
浏览 0
提问于2017-04-18
得票数 4
2
回答
TensorFlow中
的
序列
标记
、
、
我已经成功地用tensorflow
训练
了一个word2vec,并且我想把这些结果
输入
到一个带有lstm细胞
的
rnn
中进行
序列
标记。2)我没有找到太多关于如何实现
序列
标记lstm
的
文档。(我怎么把我
的
标签带进来?) 有人能为我指出如何开始这项任务
的
正确方向吗?
浏览 0
提问于2015-12-25
得票数 7
回答已采纳
1
回答
处理MLP中
的
可变输出单元?
、
我正在使用Keras来构建我
的
架构。 我试图解决
的
回归问题对于不同
的
训练
样本有不同
的
输出。假设我有与我
的
前两行y_train = [[16, 3], [6], ... ]对应
的
前两行X_train (input data)。我希望将密集层单元
的
输出分配给这些y_train行
的
长度。例如,对于第一个
训练
样本,我想要model.add(dense(2)),因为y_train[0]有长度2,对于第二个
训练
浏览 0
提问于2019-07-31
得票数 1
4
回答
基于单词
的
文本生成和基于字符
的
文本生成
RNN
有什么区别?
、
、
、
在阅读有关文本生成
的
递归神经网络时,我注意到一些例子被逐字生成文本,而另一些例子却没有具体说明原因。 那么,预测每单词文本
的
RNN
模型
和预测每字符文本
的
RNN
模型
有什么区别呢?基于单词
的
RNN
需要更大
的
语料库吗?基于字符
的
RNN
推广得更好吗?也许唯一
的
区别是
输入
表示(一次热编码,字嵌入)?为文本生成选择哪一个?
浏览 0
提问于2016-08-01
得票数 19
回答已采纳
1
回答
在
测试
阶段,变压器解码器
的
目标
输入
是什么?
、
、
转换器解码器接收两个
输入
,编码器
的
输出和目标
序列
。本回答
提供
了如何将目标
输入
解码器
的
方法。如果有人能帮我澄清这件事会很有帮助
的
。
浏览 0
提问于2020-09-15
得票数 1
回答已采纳
2
回答
用Keras中不同长度
的
例子
训练
RNN
、
、
、
我正试着开始学习
RNN
,我正在使用Keras。我理解普通
RNN
和LSTM层
的
基本前提,但是我很难理解特定
的
训练
技术要点。在角化酶(文件)中,它表示
RNN
层
的
输入
必须具有形状(batch_size, timesteps, input_dim)。这表明所有的
训练
示例
都有固定
的
序列
长度,即timesteps。我可能想让
RNN
对不同长度
的
句子进行操作。当
浏览 0
提问于2018-01-06
得票数 120
1
回答
如何将利用CNN提取
的
特征传递到
RNN
中?
、
、
、
、
我
的
目标是以73791096754314441539
的
形式从图像中提取文本,这基本上就是OCR所做
的
。 a-z,A-Z,包括spaces 在内
的
特殊字符 outputs, _ = tf.nn.dynamic_
rnn</em
浏览 0
提问于2017-07-11
得票数 6
1
回答
当使用桶方法
训练
seq2seq
模型
时,是否为每个桶保留单独
的
RNN
?
、
、
假设我们有三个不同长度
的
桶。那么我们要
训练
三个不同
的
网吗?我们不能保留一个动态
RNN
吗?其中,它将根据编码器中
输入
序列
的
长度添加单元。然后编码器将最后
的
隐藏状态传递给解码器。它能用吗?
浏览 0
提问于2017-06-08
得票数 1
1
回答
利用gensim
的
pre_trained矢量对torch嵌入层
的
期望
输入
、
、
、
、
我想在我
的
神经网络体系结构中使用预先
训练
过
的
嵌入。预先
训练
的
嵌入是由gensim
训练
的
。我们可以简单地加载批处理
序列
的
令牌吗?
模型
中将令牌转换成它
的
索引。我发现您可以
通过
使用word2vec
模型
的
vocab获得单词
的
索引# 147 因此,作为对嵌入层
浏览 0
提问于2019-02-12
得票数 4
回答已采纳
1
回答
Tensorflow
RNN
序列
训练
我正在做我
的
第一步学习TF和有一些困难
的
训练
RNN
。 我
的
玩具问题是这样
的
:一个两层
的
LSTM +密集层网络被
输入
原始音频数据,并且应该
测试
声音中是否存在一定
的
频率。因此,网络应该从1到1映射浮动(音频数据
序列
)到浮动(预选
的
频率体积)。在
训练
期间,我用(BATCH_SIZE,SEQUENCE_LEN,1)批给它,看起来损失是正确
的
,但是我不知道
浏览 1
提问于2016-10-08
得票数 1
回答已采纳
3
回答
用于
RNN
原型
的
非常简单
的
实值时间
序列
数据集
、
、
、
是否有一个简单
的
实值时间
序列
数据集,可以
训练
一个普通
的
RNN
模型
。对于“非常简单”,我
的
意思是每个时间步骤只有2到4个实值
输入
,每个时间步骤只有一个实值输出。背景:我正在研究机器学习和形式化方法
的
交叉。为了
测试
一种正式验证
RNN
的
新技术,我们需要从一个非常简单
的
设置开始。 谢谢!
浏览 0
提问于2019-08-12
得票数 1
3
回答
怀疑
RNN
中
的
批次大小和时间步长
在Tensorflow
的
RNN
教程中:。它提到了两个参数:批量大小和时间步长。我被这些概念搞糊涂了。在我看来,
RNN
引入批处理是因为
训练
序列
可能很长,以至于反向传播无法计算那么长
的
(爆炸/消失梯度)。因此,我们将长
的
待
训练
序列
划分为较短
的
序列
,每个
序列
都是一个小批量,其大小称为“批大小”。我说对了吗? 关于时间步长,
RNN
仅由一个单元(LSTM或GRU单
浏览 1
提问于2017-06-06
得票数 16
1
回答
为什么巴丹瑙关注
的
编码器隐藏状态形状与编码器输出形状不同?
、
、
、
这个问题与这里所示
的
神经机器翻译有关:批量= 64
RNN
单元
的
数(也是隐藏状态向量
的
长度或隐藏状态向量在每个时间步长)= 1024这被解释为: 在每一批(总共64)中,对于每个
输入
字(总共16),在每个时间步骤中存在一个1024维向量。这个1024维向量表示在编码过程中特定时间步骤
的
输入
字。这个1024维向
浏览 2
提问于2020-09-25
得票数 0
回答已采纳
2
回答
RNN
:具有分类变量
的
每个时间步骤
的
多个
输入
、
、
我试图建立一个
RNN
模型
来预测几个不同城市和不同产品部门
的
日销售额(每天
的
分类特征和多个
输入
),以及诸如流量、温度等数值特征(每天
的
单
输入
)。如何使用这些特性构建
模型
。我试图将编码(Label编码器)标记为分类特征,并试图连续地
训练
/更新一个
RNN
模型
,并将每个城市
的
产品段数据
的
时间
序列
提供
给它,但最终得到了巨大<em
浏览 0
提问于2020-06-04
得票数 0
2
回答
基于Tensorflow
的
LSTM一步预测
、
我正在使用Tensorflow
的
组合GRUCell + MultiRNNCell + dynamic_
rnn
来生成一个多层LSTM来预测元素
序列
。在我所见过
的
几个例子中,
如
字符级语言
模型
,一旦完成了
训练
阶段,一代人似乎一次只
输入
一个“字符”(或任何元素)来得到下一个预测,然后根据第一个预测得到下面的“字符”,等等。我
的
问题是,既然Tensorflow
的
dynamic_
rnn
将
RNN
浏览 5
提问于2017-04-18
得票数 0
回答已采纳
1
回答
如何处理LSTM
模型
中
的
某些时间
序列
?
、
、
、
、
我是一个新
的
keras用户,我想很容易地理解如何构建一个lstm
模型
。每个用户都有
序列
序列
,但必然有相同
的
长
序列
。每个系列对应一个多标签系列。我
的
目标是预测每个用户
的
下一个
序列
的
标签,并考虑最后
的
序列
(作为时间
序列
)。 当我只使用一个用户时,我就成功了。实际上,我做了一个lstm
输入
,例如(批处理大小、时间步长、特征),其中批处理大小等于1,因为
浏览 3
提问于2017-06-10
得票数 0
回答已采纳
2
回答
如何
训练
序列
项
的
LSTM
模型
?
、
、
、
、
因此,我想使用LSTM来
训练
每个用户
的
过去
序列
来预测下一个购买
序列
。下面,我定义了一个LSTM
模型
,其中我不返回
序列
,因为我有一个用户标签。(X_train, y_train, batch_size=1, epochs=1, shuffle=1)
如
您所见,我使用batch_size =1来
训练
我
的
LSTM,因为用户之间
的
时间步骤不同。我在70%
的
用户上对
模型
进行了拟合,并在其他用
浏览 5
提问于2017-06-13
得票数 8
1
回答
是否可以使用单个GPU同时
训练
多个递归神经网络?
、
在这里也被问到了类似的问题,但答案是针对咖啡馆
的
。以下是我
的
具体问题: 我
的
一个朋友用Theano和TensorFlow为某个问题设计了一个随机神经网络。它有14个
输入
节点,2个隐藏层,每个层有7个节点,最后是一个输出节点。我们大约有30,000个这样
的
RNN
需要
训练
。我是一个很少接触机器学习
的
软件工程师。我需要做
的
是加快这些
RNN
的
训练
过程。从CS
的
角度来看这个
浏览 0
提问于2016-07-14
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
TensorFlow 2keras开发深度学习模型实例:多层感知器(MLP),卷积神经网络(CNN)和递归神经网络(RNN)
CNN取代RNN?当序列建模不再需要循环网络
独立循环神经网络:打造更长更深的RNN
基于深度学习的中文古籍OCR技术进展
谷歌Docs,现在已经可以自动生成文本摘要了!
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券