我有一个解决这个问题的方法(我将把所有的音频记录转换成光谱仪->,将它们保存为图片并为此训练一个神经网络),但我想走更简单的方法,即不保存图片,而是立即将音频文件转换为张量,但是有一个问题,我找不到关于如何从TensorFlow中的张量中创建数据集的任何有用信息。return trch,self.labels[index] r
我正在从通过librosa加载的音频文件创建one_hot编码的张量。张量很大,我不想把它全部打印出来。实际上,这就是它向我显示的内容,然后当我尝试打印它时,它从不打印:(或许它会打印,但我不想等待) W tensorflow/core/framework/allocator.cc:124] Allocation例如,我想在张量中每隔50次打印一次热编码。
我正在尝试实现一个CNN-LSTM,它将代表帕金森病患者/健康对照者讲话的mel谱图图像进行分类。我正在尝试用LSTM模型实现一个预先存在的模型(DenseNet-169),但是我遇到了以下错误:ValueError: Input 0 of layer zero_padding2d is incompatible1.x #version 1 works without problemsfrom skle