因此,在加载.tfrecord之后,我将执行以下操作: audio, sr = tf.audio.decode_wav(image_data) 它返回一个具有音频长度的张量。所以我用一个tf.data.Dataset.map()函数对所有的音频进行了处理: audio = tf.tile(audio, [5]) 因为这就是将我最短的音频填充到所需长度所需的时间。if the audio is 120000 long, the audio will repeat 2 times
audio = tf.tile(audio, [pad_nu
我试图在tensorflow中使用map_fn对列向量进行转换,但它不起作用。使用if t is not None:而不是if t:来测试是否定义了张量,并使用TensorFlow操作(如tf.cond )执行以张量值为条件的子图。我试着打印x的类型,它是一个形状(1,)的张量。因此,看起来发生的事情是,值不是作为标量值传递到lambda中,而是作为形状(1,)的张量传递;%是广播的,产生了形状(1)的另一个
我尝试将python函数应用于张量的每个元素,该函数将元素转换为形状3的向量,因此我可以计算自定义评估度量。它需要是一个Python函数,因为它也在其他地方使用。错误(下面的日志)是Invalid argument: PartialTensorShape: Incompatible ranks during merge: 1 vs. 0,我认为它与map_fn的结果及其形状有关。但是,它只在运行时发生,就好像我有任何其他形状一样,然后当我执行mode