从音频到张量，回到tensorflow中的音频

、

有没有办法将音频文件(wav)直接加载到tensorflow中的张量？然后，再次将张量转换为音频文件？我看到一些人将音频转换为spectogram，但我找不到任何人可以将spectogram转换为音频。

浏览 29提问于2018-02-08得票数 0

1回答

如何在不保存音频文件的情况下在python上播放音频

、、、

我正在和Tensorflow_TTS一起工作。我正在使用快速语音和梅尔根生成音频。现在这个音频是一个热切的张量，更准确地说是：<class 'tensorflow.python.framework.ops.EagerTensor'>。我想在脚本中播放这个音频张量，而不是将其转换为音频文件，然后再播放它。有没有办法做到这一点？

浏览 0提问于2020-10-25得票数 0

2回答

如何在Tensorflow中解析音频文件

、、

我是Python的新手，我想训练一个音频模型。我把我的音频文件转换成.wav格式。如何将这些音频.wav文件解析为tensorflow

浏览 1提问于2019-01-07得票数 0

1回答

tf.audio.decode_wav是如何获取其内容的？

、

我试图通过使用tf.audio.decode_wav将一些音频文件拖到Tensorflow中。 contents, desired_samples=-1,)contents:类型为string的张量WAV编码的音频，通常来自file.de

浏览 7提问于2019-09-25得票数 5

回答已采纳

1回答

Tensorflow js抛出错误

、、、、

我想记录16000赫兹的音频，并得到它的谱图。我的模型输入了null.1998.101。我无法在javascript中实现它。spectrogramTensor.print();waveformTensor.print();我的模型是触发字检测在Python中，我使用了以下代码。

浏览 3提问于2020-04-28得票数 2

回答已采纳

1回答

从Dataset map()函数调用中生成的图形操作中添加Tensorboard摘要

、、、、

我发现Dataset.map()功能非常好，可以在输入网络进行培训之前设置管道对图像/音频数据进行预处理，但我遇到的一个问题是在预处理之前访问原始数据，然后将其作为摘要发送到张量板。，该图表是在张卡的“图”选项卡中绘制的(见下面的屏幕快照)。我如何更好地构造这个结构，将原始音频输入到tf.summary.audio()中？现在，map()<e

浏览 0提问于2018-03-26得票数 9

回答已采纳

1回答

在树莓Pi上运行TensorFlow模型推断的首选方法是什么？

、、、

我想用Tensorflow在Raspberry上运行卷积神经网络的模型推理。目前，在云中运行该模型并不是的一个选项。1)直接在tensorflow上运行RPi代码。(现在可以直接在pip install tensorflow上使用RPi，参见。 2)使用ModelServer ( tensorflow serving() )运行一个实例。现在，我想要的是一个运行在RPi上的应用程序，它读取实时传感器数据(在我的

浏览 0提问于2018-08-08得票数 1

1回答

在tensorflow中创建自己的数据集

、、、

我有一个解决这个问题的方法(我将把所有的音频记录转换成光谱仪->，将它们保存为图片并为此训练一个神经网络)，但我想走更简单的方法，即不保存图片，而是立即将音频文件转换为张量，但是有一个问题，我找不到关于如何从TensorFlow中的张量中创建数据集的任何有用信息。return trch,self.labels[index] r

浏览 4提问于2021-12-24得票数 2

1回答

深度学习算法的平均输出

、、、、

我试图分类一些音频剪辑，为了做到这一点，我必须分割这些音频剪辑，每30秒长，在1秒剪辑。然后，我想把这个1秒音频剪辑放在分类器中，平均所有30个一秒音频文件的输出，以得到我的最终响应。我的问题是，我不知道如何在分类器中给它们喂食，我不能像建议的那样使用多个输入，因为我有30个输入，而不仅仅是2个，这会变得一团糟。

浏览 0提问于2020-10-03得票数 1

回答已采纳

2回答

从视频文件中提取音频通道以满足decode_wav的TensorFlow功能

、、

我想将视频文件的音频通道输入到以下TenorFlow函数：contents,desired_samples=-1,name=None) desired_samples:一个可

浏览 6提问于2019-10-10得票数 0

回答已采纳

1回答

如何从mel谱图转换wav (音频)文件？

、、、

我正在处理一个音频ML问题。我能够将给定的音频从WAV转换成MEL-平面图，使用tensorflow的文档。有人能帮帮我吗？

浏览 2提问于2021-09-30得票数 1

回答已采纳

3回答

tf.contrib.ffmpeg.decode_audio替换？

、、

在tensorflow文档中，它指出tf.contrib.ffmpeg.decode_audio是折旧的，但它没有说明它的替代品是什么…… 此函数已弃用。将在2018-09-04之后移除。

浏览 92提问于2018-11-12得票数 4

2回答

具有特定采样率的torchaudio加载音频

、

从文档来看，似乎没有固定采样率加载音频的参数，这对于训练模型是很重要的。如何用固定采样率加载具有固定采样率的火炬音频张量？

浏览 71提问于2022-02-14得票数 1

回答已采纳

1回答

使用Keras/TensorFlow进行fp16 /半精度的RTX卡培训

、、、

我刚刚得到一个RTX 2070超级，我想尝试半精确训练使用Keras与TensorFlow后端。层CNN音频分类。我的输入数据是以前生成的NumPy 3D数组(用LibROSA提取的音频MFCC功能)。这个数据是使用CPU生成的，据我所知，这些值被保存为32位浮点数。当我试图用这些数据训练我的网络时，我会得到以下错误： TypeError:列表中传递给“Merge”Op的“输入”的张量</

浏览 5提问于2019-10-25得票数 0

1回答

按步长打印张量

、

我正在从通过librosa加载的音频文件创建one_hot编码的张量。张量很大，我不想把它全部打印出来。实际上，这就是它向我显示的内容，然后当我尝试打印它时，它从不打印：(或许它会打印，但我不想等待) W tensorflow/core/framework/allocator.cc:124] Allocation例如，我想在张量中每隔50次打印一次热编码。

浏览 8提问于2019-05-13得票数 0

回答已采纳

1回答

ImportError:无法导入名称“音频”

、

当尝试导入gpu tensorflow时，它不能按计划工作。这给了我一个错误。这就是错误。import tensorflow as tf File "<stdin>", line 1, in <module> File"C: \ Users \ BeMore \ Anaconda3 \ lib \ site-packages \ tensorflow \ __ init__.py", line 31,

浏览 1提问于2019-04-03得票数 1

1回答

tensorflow保存输出层结果供审查

工作在简单的softmax tensorflow分类与4个特征/输入和3个输出。要保存结果:输入与预测输出与实际输出相比较，对所有张量执行tf.concat并打印(Tensor.eval())以检查结果。在实际用例中，想知道哪些是检查结果的最佳方法，这些结果不是标量(因此，张量板标量不是选项)，而是not类型的结果。有什么工具可以用张量输出来绘制图？转储到文件(数据可能很大，很难分析)？转储到数据库？取决于

浏览 8提问于2017-04-14得票数 0

回答已采纳

1回答

音频播放器自动处理

、、

当更改音频文件时，音频播放器将被释放。该应用程序在共享\音频文件夹中的文件中播放顺序音频。第一个文件播放ok，但在第一个音频之后停止。

浏览 2提问于2022-07-08得票数 1

回答已采纳

2回答

在ViewPager中滑动视图中的问题

、、、、

“我的视图寻呼机”由照片、音频和videos.Audio视图组成，播放按钮可以播放我单击“播放”按钮后消失的“播放”按钮，“音频启动”--“停止音频”或“当音轨完成后，播放”按钮再次变为可见。如果我在播放音频时滑动视图并移动到下一个视图，那么音频stops.But问题是，如果在播放音频时通过滑动到下一个视图，然后返回到视图Pager.However上的播放按钮，如果我滑动到下一个视图或进一步的下一个

浏览 1提问于2014-12-01得票数 0

回答已采纳

1回答

如何使用Keras实现CNN-LSTM

、、、

我正在尝试实现一个CNN-LSTM，它将代表帕金森病患者/健康对照者讲话的mel谱图图像进行分类。我正在尝试用LSTM模型实现一个预先存在的模型(DenseNet-169)，但是我遇到了以下错误：ValueError: Input 0 of layer zero_padding2d is incompatible1.x #version 1 works without problemsfrom skle

浏览 5提问于2021-03-09得票数 4

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何在不保存音频文件的情况下在python上播放音频

如何在Tensorflow中解析音频文件

tf.audio.decode_wav是如何获取其内容的？

Tensorflow js抛出错误

从Dataset map()函数调用中生成的图形操作中添加Tensorboard摘要

在树莓Pi上运行TensorFlow模型推断的首选方法是什么？

在tensorflow中创建自己的数据集

深度学习算法的平均输出

从视频文件中提取音频通道以满足decode_wav的TensorFlow功能

如何从mel谱图转换wav (音频)文件？

tf.contrib.ffmpeg.decode_audio替换？

具有特定采样率的torchaudio加载音频

使用Keras/TensorFlow进行fp16 /半精度的RTX卡培训

按步长打印张量

ImportError:无法导入名称“音频”

tensorflow保存输出层结果供审查

音频播放器自动处理

在ViewPager中滑动视图中的问题

如何使用Keras实现CNN-LSTM

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐