这使得我们开始的时候不是扁平的。现在让我们来看一幅来自MNIST数据集的手写图像。这个图像有两个不同的维度,高度和宽度。
?
高度和宽度分别为18 x 18。...这些尺寸告诉我们这是裁剪过的图像,因为MNIST数据集是包含28 x 28的图像。现在让我们看看如何将这两个高度轴和宽度轴展平为单个长度为324的轴。
上图显示了我们的扁平化输出,其单轴长度为324。...]
tensor([[[1, 1, 1, 1],
[1, 1, 1, 1],
[1, 1, 1, 1],
[1, 1, 1, 1]]])
我们在第一幅图像中有第一个颜色通道...[0][0]
tensor([[1, 1, 1, 1],
[1, 1, 1, 1],
[1, 1, 1, 1],
[1, 1, 1, 1]])
我们在第一幅图像的第一颜色通道中有第一行像素...由于我们需要对批处理张量中的每个图像进行单独的预测,因此此扁平化的批次在我们的CNN中无法很好地起作用,现在我们一团糟。
解决方案是在保持batch 轴不变的情况下使每个图像变平。