迁移学习
迁移学习(transfer learning)是指将已经学习的知识应用到其它领域,在图像识别问题中,是将训练好的模型通过简单调整来解决新的问题。从图像中提取特征,不一定需要算力强大的GPU,训练上百层的神经网络。
卷积神经网络中卷积层和池化层可以抽取图片的几何特征,比如浅层的卷积用于抽取出一些直线,角点等简单的抽象信息,深层的卷积层用于抽取人脸等复杂的抽象信息,最后的全连接层是对图片分类的处理。因此,我们可以使用网络的前N-1层提取特征。
例如,利用在ImageNet数据集上训练好的 ResNet50 模型来解决一个自定义的图像分类问题:保留训练好的 ResNet50 模型中卷积层的参数,只去掉最后一个全连接层,将新图像输入训练好的神经网络,利用前N-1层的输出作为图片的特征,将 ResNet50 模型作为图片特征提取器,提取得到的特征向量作为输入训练新的单层全连接网络来处理新的分类问题,或者将这些特征代入SVM,LR等其它机器学习模型进行训练和预测。
在数据量足够的情况下,迁移学习的效果往往不如完全重新训练,但是迁移学习所需要的训练时间和训练样本要远远小于训练完整的模型。大多数情况下,更加实用。
2. 比赛介绍
猫狗大战是2013年Kaggle上的比赛,它使用25000张(约543M)猫狗图片作为训练集,12500张(约271M)图片作为测试集,数据都是分辨率400x400左右的小图片,目标是识别测试集中的图片是猫还是狗。赛题网址:https://www.kaggle.com/c/dogs-vs-cats。
对于图像识别,在数据量足量大的情况下,一般使用深度学习中的卷积神经网络(Convolutional Neural Networks, CNN),而本篇将从迁移学习的角度,看看如何应用现有的深度学习模型,从图片中提取特征,供分类器使用。使用此方法,即无需大量学习和训练模型的时间成本,又能解决图片识别相关的大多数问题。
3. 代码分析
(1) 数据及代码位置
数据及代码位置如下:cat_vs_dog.ipynb 中存放了所有代码, train目录中存放所有训练数据,注意将猫和狗的图片分开目录存放,test目录存放测试数据。
(2) 提取特征
本例中使用了InceptionV3,Xception,ResNet50三种模型,分别提取图片特征,H5是一种文件存储格式,使用库h5py库存取。
(3) 训练模型和预测
特征提取完成后,训练了简单的全连接神经网络,迭代次数为8次,并对测试集test进行预测,预测结果保存在y_pred之中,训练过程保存在history之后,此后分析其迭代效果。
(4) 训练结果分析
使用matplotlib库,分别对8次迭代的准确率作图比较,从结果可以看出迭代两次之后,精确率就稳定下来。本例中使用了全部图片25000张训练模型,正确率相对较高。
(5) 代码下载
本例中的代码以及少量图片可从git下载:https://github.com/xieyan0811/cat_vs_dog由于整体图片有几百M,占空间大,特征提取时间长,所以只上传了几百张图片,如果想训练出上图展示的效果,请下载kaggle赛题中的所有数据,替换train和test目录即可,注意,需要把猫和猫的图片存放不同目录下。
搜索添加公众号:算法学习分享
领取专属 10元无门槛券
私享最新 技术干货