我正在使用Alexnet架构对图像网络模型进行微调。我的数据集非常小(每类7张图像)。我必须丢弃最后一个FC层("FC8"
)权重,但是其他完全连接的层呢?对于"FC6"
和"FC7"
,我应该使用来自图像网络模型的权重还是从随机初始化?所有三个FC层的学习率均为5。
发布于 2016-07-21 02:42:25
由于训练示例如此之少,我建议固定所有层(conv,fc6和fc7)的权重,并使用线性支持向量机来训练最后一层。大多数支持向量机训练包和算法都使用全局凸优化,在这种设置下可能会产生比SGD更好的结果。
https://stackoverflow.com/questions/38488343
复制相似问题