首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

matlab使用长短期记忆(LSTM)神经网络对序列数据进行分类

要训练深度神经网络对序列数据进行分类,可以使用LSTM网络。LSTM网络使您可以将序列数据输入网络,并根据序列数据的各个时间步进行预测。

相关视频

本示例使用日语元音数据集。此示例训练LSTM网络来识别给定时间序列数据的说话者,该时间序列数据表示连续讲话的两个日语元音。训练数据包含九位发言人的时间序列数据。每个序列具有12个特征,并且长度不同。数据集包含270个训练观察和370个测试观察。

加载序列数据

加载日语元音训练数据。  是包含长度可变的维度12的270个序列的单元阵列。  是标签“ 1”,“ 2”,...,“ 9”的分类向量,分别对应于九个扬声器。中的条目   是具有12行(每个要素一行)和不同列数(每个时间步长一列)的矩阵。

可视化图中的第一个时间序列。每行对应一个特征。

R语言用FNN-LSTM假近邻长短期记忆人工神经网络模型进行时间序列深度学习预测4个案例

左右滑动查看更多

01

02

03

04

准备填充数据

在训练过程中,默认情况下,该软件默认将训练数据分成小批并填充序列,以使它们具有相同的长度。太多的填充可能会对网络性能产生负面影响。

为防止训练过程增加太多填充,您可以按序列长度对训练数据进行排序,并选择小批量的大小,以使小批量中的序列具有相似的长度。下图显示了对数据进行排序之前和之后的填充序列的效果。

获取每个观察的序列长度。

按序列长度对数据进行排序。

在条形图中查看排序的序列长度。

选择大小为27的小批量可均匀划分训练数据并减少小批量中的数量。下图说明了添加到序列中的填充量。

定义LSTM网络架构

定义LSTM网络体系结构。将输入大小指定为大小为12的序列(输入数据的大小)。指定具有100个隐藏单元的双向LSTM层,并输出序列的最后一个元素。最后,通过包括大小为9的完全连接层,其后是softmax层和分类层,来指定九个类。

如果可以在预测时使用完整序列,则可以在网络中使用双向LSTM层。双向LSTM层在每个时间步都从完整序列中学习。例如,如果您无法在预测时使用整个序列,比如一次预测一个时间步长时,请改用LSTM层。

现在,指定训练选项。将优化器指定为  ,将梯度阈值指定为1,将最大历元数指定为100。要减少小批量中的填充量,请选择27的小批量大小。与最长序列的长度相同,请将序列长度指定为  。为确保数据仍按序列长度排序,请指定从不对数据进行随机排序。

由于批处理的序列短,因此训练更适合于CPU。指定   为  。要在GPU上进行训练(如果有),请将设置   为   (这是默认值)。

训练LSTM网络

使用指定的训练选项来训练LSTM网络  。

测试LSTM网络

加载测试集并将序列分类为扬声器。

加载日语元音测试数据。  是包含370个长度可变的维度12的序列的单元阵列。  是标签“ 1”,“ 2”,...“ 9”的分类向量,分别对应于九个扬声器。

LSTM网络   是使用相似长度的序列进行训练的。确保测试数据的组织方式相同。按序列长度对测试数据进行排序。

分类测试数据。要减少分类过程引入的数据量,请将批量大小设置为27。要应用与训练数据相同的填充,请将序列长度指定为  。

计算预测的分类准确性。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20221027A04MJC00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券