Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >LSTM如何处理变长序列

LSTM如何处理变长序列
EN

Stack Overflow用户
提问于 2018-04-19 07:56:08
回答 2查看 14.4K关注 0票数 10

我在用Python进行深度学习的第7章第1节中找到了一段代码如下:

代码语言:javascript
运行
AI代码解释
复制
from keras.models import Model
from keras import layers
from keras import Input

text_vocabulary_size = 10000
question_vocabulary_size = 10000
answer_vocabulary_size = 500

# Our text input is a variable-length sequence of integers.
# Note that we can optionally name our inputs!
text_input = Input(shape=(None,), dtype='int32', name='text')

# Which we embed into a sequence of vectors of size 64
embedded_text = layers.Embedding(64, text_vocabulary_size)(text_input)

# Which we encoded in a single vector via a LSTM
encoded_text = layers.LSTM(32)(embedded_text)

# Same process (with different layer instances) for the question
question_input = Input(shape=(None,), dtype='int32', name='question')
embedded_question = layers.Embedding(32, question_vocabulary_size)(question_input)
encoded_question = layers.LSTM(16)(embedded_question)

# We then concatenate the encoded question and encoded text
concatenated = layers.concatenate([encoded_text, encoded_question], axis=-1)

# And we add a softmax classifier on top
answer = layers.Dense(answer_vocabulary_size, activation='softmax')(concatenated)

# At model instantiation, we specify the two inputs and the output:
model = Model([text_input, question_input], answer)
model.compile(optimizer='rmsprop',
              loss='categorical_crossentropy',
              metrics=['acc'])

如您所见,这个模型的输入没有原始数据的形状信息,那么在嵌入层之后,LSTM的输入或嵌入的输出都是一些可变的长度序列。

所以我想知道:

  • 在该模型中,角点如何确定lstm_unit层中的LSTM数。
  • 如何处理变长序列

附加信息:为了解释lstm_unit是什么(我不知道如何称呼它,所以只需显示它的图像):

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2018-04-19 08:22:41

提供的递归层继承了基本实现keras.layers.Recurrent,该实现包括选项return_sequences,该选项默认为False。这意味着,在默认情况下,递归层将消耗可变长度的输入,最终只在最后一步产生层的输出。

因此,使用None来指定可变长度的输入序列维度没有问题.

但是,如果希望该层返回整个输出序列,即输入序列的每个步骤的输出张量,则必须进一步处理该输出的可变大小。

您可以通过让下一层进一步接受可变大小的输入来做到这一点,然后继续讨论这个问题,直到稍后在您的网络中,最终您必须从某个可变长度的东西中计算一个损失函数,或者在继续到以后的层之前计算一些固定长度的表示,这取决于您的模型。

也可以通过要求固定长度的序列来实现,可能是用特殊的哨兵值填充序列的末尾,这仅仅是为了填充长度的空序列项。

另外,Embedding层也是一个非常特殊的层,用于处理可变长度的输入。输出形状将对输入序列的每个令牌具有不同的嵌入向量,因此具有be的形状(批大小、序列长度、嵌入维数)。既然下一层是LSTM,这没问题.它也会很高兴地消耗可变长度的序列。

但是,正如Embedding文档中提到的那样

代码语言:javascript
运行
AI代码解释
复制
input_length: Length of input sequences, when it is constant.
      This argument is required if you are going to connect
      `Flatten` then `Dense` layers upstream
      (without it, the shape of the dense outputs cannot be computed).

如果您想直接从Embedding到非可变长度表示,那么您必须提供固定的序列长度作为层的一部分。

最后,请注意,当您表示LSTM层(如LSTM(32) )的维度时,您描述的是该层输出空间的维度。

代码语言:javascript
运行
AI代码解释
复制
# example sequence of input, e.g. batch size is 1.
[
 [34], 
 [27], 
 ...
] 
--> # feed into embedding layer

[
  [64-d representation of token 34 ...],
  [64-d representation of token 27 ...],
  ...
] 
--> # feed into LSTM layer

[32-d output vector of the final sequence step of LSTM]

为了避免批量大小为1的效率低下,一种策略是根据每个示例的序列长度对输入训练数据进行排序,然后根据公共序列长度分组,例如使用自定义的Keras DataGenerator。

这具有允许较大批处理大小的优点,特别是如果您的模型可能需要批处理规范化或GPU密集型培训,甚至只是为了减少批量更新梯度的噪音。但是,它仍然允许您处理输入训练数据集,该数据集对于不同的示例具有不同的批处理长度。

然而,更重要的是,它还有一个巨大的优势,即您不必管理任何填充,以确保输入中的公共序列长度。

票数 12
EN

Stack Overflow用户

发布于 2018-04-19 09:08:14

如何处理单位?

单位是完全独立的长度,所以,没有什么特别的是做。

长度只增加“重复步骤”,但重复步骤总是重复使用相同的单元格。

单元格的数量由用户固定和定义:

  • 第一个LSTM有32个单元/单元
  • 第二个LSTM有16个单元/单元

如何处理可变长度?

  • 方法1:创建一个序列的单独批,每个批具有自己的长度。将每个批次分别提供给模型。方法手动循环中的train_on_batchpredict_on_batch是最简单的形式。
    • 理想情况下,每段长度分开的批次,每一批收集所有长度相同的序列。

  • 方法2:创建一个固定长度的批处理,用0填充每个序列的未使用的尾长,在嵌入层中使用参数mask_zero=True
    • 小心不要在嵌入的输入中使用0作为实际单词或有意义的数据。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/49925374

复制
相关文章
【科技】神经网络使我们能够以新的方式“读懂人脸”
面部分析软件正被用来预测性行为和安全风险。 去年9月,斯坦福大学教授Michal Kosinski利用AI试图从他们脸上预测性取向时,引发了一场激烈的争论。现在,他已经用自己的软件来证明他所表达的观点
AiTechYun
2018/03/02
6580
【科技】神经网络使我们能够以新的方式“读懂人脸”
以编程方式创建Vue.js组件实例
最近参与了一个Vue.js项目,项目中需要能够以编程方式创建组件。通过编程,意思是使用JavaScript创建和插入组件,而无需在模板中编写任何内容。
前端知否
2020/03/23
7.9K3
使 Typecho 支持 emoji 的显示
每次发布带有emoji表情的文章就显示数据库错误 查找了相关资料 原因是emoji表情是4个字节 而utf8只能3个字节 所以需要修改数据库的排序规则为utf8mb4_unicode_ci
团团生活志
2022/08/16
2150
(转)iOS开发之UICollectionViewController系列(一) :Ready CollectionViewController
原文链接:https://www.cnblogs.com/ludashi/p/4791826.html
VV木公子
2018/06/05
5.6K0
(转)iOS开发之UICollectionViewController系列(一) :Ready CollectionViewController
iOS开发之窥探UICollectionViewController(一) -- Ready Your CollectionViewController
之前用CollectionViewController只是皮毛,一些iOS从入门到精通的书上也是泛泛而谈。这几天好好的搞了搞苹果的开发文档上CollectionViewController的内容,亲身体验了一下CollectionViewController的强大,之前一直认为CollectionView和TableView用法差不多,功能应该也是类似的。TableView的功能就已经很强大了,,CollectionView就是TableView的升级版,其功能更为强大。以后的几篇博客中好好的研究一下Col
lizelu
2018/01/11
1.7K0
iOS开发之窥探UICollectionViewController(一) -- Ready Your CollectionViewController
以编程方式执行Spark SQL查询的两种实现方式
摘 要 在自定义的程序中编写Spark SQL查询程序 1.通过反射推断Schema package com.itunic.sql import org.apache.spark.sql.SQLContext import org.apache.spark.{SparkConf, SparkContext} /**   * Created by itunic.com on 2017/1/2.   * Spark SQL   * 通过反射推断Schema   * by me:   * 我本沉默是关注互联
天策
2018/06/22
2.1K0
显示方式
08.05自我总结 一.显示方式 1.display 常用的三种方式 #第一种block 1.支持设置宽高 2.自带换行 一般情况所有有宽高、参与位置布局的都是block #第二种inline 1.不支持设置宽高,宽高只能有文本撑开 2.不带换行,一行显示不下会自动换行(保留数据的整体性) 一般情况存放文本的 #第三种inline-block 1.支持设置宽高 2.不带换行,一行显示不下会自动换行(以标签整体换行,标签左右有间距) 一般情况不去主动设置该显示方式,系统的两个img、input都设置为了单
小小咸鱼YwY
2019/09/11
6590
GridControl控件单元格居中显示
GridControl控件单元格居中显示 下面这样设置一步到位,不用再去Columns里面设置每一列的TextOptions属性了
别团等shy哥发育
2023/02/27
1.1K0
GridControl控件单元格居中显示
如何使特定的数据高亮显示?
当表格里数据比较多时,很多时候我们为了便于观察数据,会特意把符合某些特征的数据行高亮显示出来。这不,公司的HR小姐姐就有这个需求,说她手头上有一份招聘数据,她想把“薪水”超过20000的行突出显示出来,应该怎么操作呢?
猴子聊数据分析
2020/02/26
5.8K0
EXCEL单元格的引用方式
EXCEL单元格的引用包括相对引用、绝对引用和混合引用三种。 相对引用   公式中的相对单元格引用(例如 A1)是基于包含公式和单元格引用的单元格的相对位置。如果公式所在单元格的位置改变,引用也随之改变。如果多行或多列地复制公式,引用会自动调整。默认情况下,新公式使用相对引用。例如,如果将单元格 B2 中的相对引用复制到单元格 B3,将自动从 =A1 调整到 =A2。 绝对引用   单元格中的绝对单元格引用(例如 $A$1)总是在指定位置引用单元格。如果公式所在单元格的位置改变,绝对引用保持
用户1075292
2018/01/23
1.4K0
[CSS]JQuery 操作CSS使DIV显示或者隐藏
在某些需求中,你需要点击按钮显示某个div,并隐藏已经显示的按钮。同时点击另外一个按钮,又会隐藏已经显示的,并显示已经影藏的。当然当你使用mvvm框架(vue,react之类的)的框架的时候是不存在这些问题的。显然,当你翻到我这个博客的时候是没有用vue之类的,因此,你只要看我下面的代码就好了
用户2353021
2020/05/11
4.2K0
让JTable单元格可以自动换行、自动调整宽度以适合单元格内容
源代码也可以从我的Java资料站进行下载! http://Java.EchoChina.net 或 http://61.131.30.54/123/Develop/Java/SC/
阿敏总司令
2019/02/28
2K0
让JTable单元格可以自动换行、自动调整宽度以适合单元格内容
以 React 的方式思考
React 很棒的一点是创建应用中引导你思考的过程。这篇文档中,我们将通过运用React创建一个产品搜索列表,来引导你熟悉这个思考过程。
fanzhh
2019/08/20
3.5K0
以 React 的方式思考
现在,以编程方式在 Electron 中上传文件,是非常简单的!
本文主要探讨了在 Electron 应用中如何实现上传文件到服务器的功能,同时通过本地代理服务器来获取完整的cookie。首先介绍了在 Electron 应用中如何通过 XHR 上传文件到服务器,然后介绍了如何通过 LocalStorage 将文件保存在本地。最后,本文介绍了一种使用 Electron 创建本地代理服务器,从而获取完整的cookie的方法。
ios122
2017/12/27
5.3K0
现在,以编程方式在 Electron 中上传文件,是非常简单的!
python编程之API入门: (一)使
在网络编程中,我们会和API打交道。那么,什么是API?如何使用API呢?本文分享了一下我对API的理解以及百度地图API的使用。 API是"Application Programming Inte
py3study
2020/01/16
1.6K0
JS页面跳转使地址后面不显示参数[通俗易懂]
大家好,又见面了,我是你们的朋友全栈君。 背景 使用window.open()和window.location.href跳转时,新页面的地址栏会显示参数,如下:http://127.0.0.1:
全栈程序员站长
2022/07/31
6.1K0
以交互方式安装ESXi 6.0
ESXi 是VMware vSphere一整套解决方案的底层服务器系统,根据不同的应用场景可将ESXi安装在U盘、本地磁盘或ISCSI存储。本文章将介绍如果通过交互方式在本地磁盘安装ESXi 6.0。
全栈程序员站长
2022/07/05
7770
以交互方式安装ESXi 6.0
vscode 使水平滚动条固定持续显示
1、在编辑器窗口中键盘 ctrl/command + shift + p 2、输入 setting,打开设置(json) 3、在 JSON 文件中加入以下代码:
Leophen
2022/05/07
2.5K0
Docker以挂载方式安装RocketMQ
如果你还没有安装 Docker,请先安装。可以参考官方文档 https://docs.docker.com/install/ 进行安装
关忆北.
2023/10/11
1.6K0
Docker以挂载方式安装RocketMQ
以 GitOps 方式管理 Terraform 资源
这是我们希望揭示Flux 生态系统[1]项目的博文系列中的第一篇。这次是Terraform 控制器[2]。
CNCF
2022/11/28
2.4K0
以 GitOps 方式管理 Terraform 资源

相似问题

以编程方式开始使用UICollectionViewController

10

使用uibutton以编程方式将pushViewController连接到UICollectionviewController

21

以编程方式使片段全屏显示

31

以编程方式创建UINavigationController,并在容器中嵌入UICollectionViewController

12

以编程方式在UICollectionViewController的单元格中设置UIView子视图的高度?

50
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档