PyTorch使用tensorboardX

狼啸风云

修改于 2022-09-02 21:19:49

1.1K0

修改于 2022-09-02 21:19:49

之前用pytorch是手动记录数据做图，总是觉得有点麻烦。学习了一下tensorboardX，感觉网上资料有点杂，记录一下重点。由于大多数情况只是看一下loss,lr,accu这些曲线，就先总结这些，什么images,audios以后需要再总结。

1.安装

有各种方法，docker安装，使用logger.py脚本调用感觉都不简洁。现在的tensorboardX感觉已经很好了，没什么坑。在命令行pip安装即可

！注意！这玩意虽然在pytorch下，但是其实是内核是 tensorflow里面的board，所以安装之前得先安装 tensorflow

pip install tensorboardX

2.调用

from tensorboardX import SummaryWriter
writer = SummaryWriter('log')

writer就相当于一个日志，保存你要做图的所有信息。第二句就是在你的项目目录下建立一个文件夹log，存放画图用的文件。刚开始的时候是空的。

训练的循环中，每次写入图像名称，loss数值， n_iteration

writer.add_scalar('Train/Loss', loss.data[0], niter)

验证的循环中，写入预测的准确度即可：

writer.add_scalar('Test/Accu', correct/total, niter)

为了看得清楚一点，我把整个train_eval写一起了

def train_eval(epoch):
running_loss = 0.0
for i, data in enumerate(trainloader, 0):
inputs, labels = data
inputs, labels = Variable(inputs), Variable(labels)
optimizer.zero_grad()
outputs = net(inputs)
loss = criterion(outputs, labels)
loss.backward()
optimizer.step()
running_loss += loss.data[0]
#每2000个batch显示一次当前的loss和accu
if i % 2000 == 1999:
print('[epoch: %d, batch: %5d] loss: %.3f' %
(epoch + 1, i+1, running_loss / 2000))
running_loss = 0.0
print('[epoch: %d, batch: %5d] Accu: %.3f' %(epoch + 1, i+1, correct/total))

#每10个batch画个点用于loss曲线
if i % 10 == 0:
niter = epoch * len(trainloader) + i
writer.add_scalar('Train/Loss', loss.data[0], niter)

#每500个batch全验证集检测，画个点用于Accu
if i % 500 == 0:
correct = 0
total = 0
for data in testloader:
images, target = data
res = net(Variable(images))
_, predicted = torch.max(res.data, 1)
total += labels.size(0)
correct += (predicted == target).sum()
writer.add_scalar('Test/Accu', correct/total, niter)