为什么内存使用量会随着过滤器的大小而增大?, output_channels]的二维矩阵.对于每个补丁,右乘滤波矩阵和图像补丁向量.我最初只是把这看作是对过程的一种描述,但如果tensorflow实际上是从引擎盖下的图像中提取和存储单独的过滤器大小的“补丁”,那么信封背面的计算表明,在我的情况下,所涉及的中间计算需要130 if
我试图找到一个解释,为什么我使用Numba的矩阵乘法比使用NumPy的点函数慢得多。虽然我使用Numba编写矩阵乘法函数的最基本的代码,但我不认为性能显著降低是由于算法。为简单起见,我考虑两个k x k方阵,A和B。1000 x 1000矩阵重复运行此代码,通常至少需要大约1.5秒才能完成。另一方面,如果我不更新矩阵C,例如,如果我删除第14行,或者为了测试而将其