我有表示传感器输出的文本数据。
1458996986002; 11.43,-15.86,11.20,508.26; -1.59,-0.22,6.17,40.68; 126.0,-150.9,-105.0,49671.81; Walk
1459002923002; 16.69,-12.68,13.96,634.65; -2.55,2.13,4.87,34.87; 126.0,-150.9,-105.0,49671.81; Walk
timestamp; acc_x,acc_y,acc_z; gyro_x,gyro_y,gyro_z; magn_x,magn_y,magn_z; ActivityName
我的目标是:在将其输入递归神经网络(GRU/LSTM)之前,从文本行中提取特征。因此,我的目标是自动提取特征。这些提取的特征(编码器网络)将在神经网络之前用于活动识别任务(分类)。
我的问题是:哪一个自动编码器(去噪,变分,稀疏)适合这样的数据集?还是我应该用RBM代替?在选择了一种特征提取方法之后,如何比较输入和输出,因为输入不是0和1s。
我所读到的:我读到RBM是一种生成模型,即使你提供了一些类似的输入,它也能产生类似的正确输出。训练自动编码器是上述(1) 变得更容易(2)而不是RBM。另一方面,变分自动编码器可以做一些类似的事情(生成性)。第一个问题是有生成能力对上述问题有什么好处,因为在训练结束时,我只会使用编码器部分并抛出解码器层?如果没有,去噪自动编码器似乎是正确的方法我的意见。
最后一件事:我知道要迫使网络从数据中学习重要的特性(而不是记忆),您可以选择以下方法: 1) 像夹层一样使用三明治,2)在输入中添加噪声3) 正则化自动编码器=使一些节点同时活动
https://datascience.stackexchange.com/questions/29275
复制相似问题