工具
深度学习分类任务入门的例子应该算是kaggle比赛里的猫狗大战了。最开始使用caffe来实现猫狗分类任务,caffe的安装确实是一个比较麻烦的事情,不过网上有了很多的教程可以供参考,就可以自己少踩一些坑了。caffe使用过程是比较方便的,但在我感觉灵活性是稍差一些。
之后,发现了英伟达的Digits深度学习平台(目前已经可以基于caffe、TensorFlow、Torch了)。这款工具没的说,确实是一款利器。图像分类、图像分割、目标识别通通拿下,而且使用过程极其简单,让新手毫无门槛就可以入门深度学习了。
再后来,了解了下Tensorflow框架以及它的高级API——Keras,Tensorflow已经是非常好的深度学习框架了,并且在不断地更新之中。Keras是对Tensorflow的一个更高级的封装,让你不需要再去写那么多的代码,搭建神经网络可以真的就像李宏毅教授说的“搭积木”那样简单。并且Keras有非常好的中文文档,学习起来更是方便了许多。
思路
因为我的任务是对具有时序性的图像进行分类,所以一直以来我将其看作是一个行为识别的任务。目前为止,实现了三种思路:
3.使用3D卷积神经网络进行行为识别任务,将时序看做第三维(长×宽×高),长和宽是图像的长宽,时序可以看做第三维“高”,这样也考虑到了时间的因素。用keras搭建3D卷积神经网络
领取专属 10元无门槛券
私享最新 技术干货