前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >人工智能|备战Tensorflow技能认证之两种快速构建模型的常用方式

人工智能|备战Tensorflow技能认证之两种快速构建模型的常用方式

作者头像
算法与编程之美
发布2020-04-07 17:06:08
4990
发布2020-04-07 17:06:08
举报
文章被收录于专栏:算法与编程之美

本文首发于微信公众号:"算法与编程之美",欢迎关注,及时了解更多此系列文章。

1 前言

Tensorflow认证考试内容五项中的第一项是基础/简单模型,第二项是学习数据集模型。小编猜想,这两者都是比较基础的知识,涉及到的知识应该主要包含:全连接神经网络搭建简单模型,数据集的加载,以及根据数据集搭建全连接神经网络模型进行训练(也有可能会涉及到卷积)。

在基础的内容肯定不能浪费太多时间,所以本文向读者们推荐两种能够快速搭建模型的方式,并辅以数据集的加载和简单的卷积层。

这两种方式能帮助快速地搭建模型,但并不意为这两者方式不能搭建复杂的模型,本文将以典型案例手写数字识别为例,来看看如何运用tf.keras.Sequential和Keras Functional API,这两种方式来快速搭建模型。

2 数据加载及预处理

代码语言:javascript
复制
import tensorflow as tf

from tensorflow.keras import datasets,Sequential,layers,optimizers,models

 

def data_preprocess(x,y):

    #mnist的数据类型是unit8,需要转换为float32,并将像素点的值从0~255更换为-1~1

    x=2*tf.cast(x,dtype=tf.float32)/255.-1

    #真实值已经采用one_hot编码,直接转换为整型即可

    y=tf.cast(y,dtype=tf.int32)

    return x,y

 

#加载mnist手写字体数据集

(x,y),(x_val,y_val)=datasets.mnist.load_data()

#真实值进行one_hot编码

y=tf.one_hot(y,depth=10)

y_val = tf.one_hot(y_val, depth=10)

#维度变换

x=tf.reshape(x,[-1,28,28,1])

x = tf.reshape(x, [-1, 28, 28, 1])

x_val = tf.reshape(x_val, [-1, 28, 28, 1])

#构建训练数据集train_db

train_db=tf.data.Dataset.from_tensor_slices((x,y))

train_db=train_db.map(data_preprocess).shuffle(10000).batch(128)

#构建测试数据集test_db

test_db=tf.data.Dataset.from_tensor_slices((x_val,y_val))

test_db=test_db.map(data_preprocess).batch(128)

3 tf.keras.Sequential容器搭建

tf.keras.Sequential,可视作一个容器,只需要通过add函数往里面填入所需的神经层,便能快速地构建神经网络模型。

代码语言:javascript
复制
#创建Sequential容器

model=Sequential()

#加入池化层

model.add(layers.MaxPool2D(pool_size=[2, 2], strides=2, padding='same'))

#加入卷积层

model.add(layers.Conv2D(64,kernel_size=[2,2],padding='same',activation=tf.nn.relu))

model.add(layers.MaxPool2D(pool_size=[2,2],strides=2,padding='same'))

model.add(layers.Conv2D(128, kernel_size=[2, 2], padding='same', activation=tf.nn.relu))

model.add(layers.MaxPool2D(pool_size=[2, 2], strides=2, padding='same'))

model.add(layers.Conv2D(256, kernel_size=[2, 2], padding='same', activation=tf.nn.relu))

model.add(layers.MaxPool2D(pool_size=[2, 2], strides=2, padding='same'))

#矩阵打平

model.add(layers.Flatten())

#加入全连接层

model.add(layers.Dense(128, activation=tf.nn.relu))

model.add(layers.Dense(10))

#建立模型,并指明输入的维度及其形状

model.build(input_shape=[None,28,28,1])

也可以选择在创建容器时,就加入所需要的神经层,两种方式并无太大差别。

代码语言:javascript
复制
model=Sequential([

        #池化层,卷积层各三层,最后打平再加上两层全连接

        layers.MaxPool2D(pool_size=[2, 2], strides=2, padding='same'),

        layers.Conv2D(64,kernel_size=[2,2],padding='same',activation=tf.nn.relu),

        layers.MaxPool2D(pool_size=[2,2],strides=2,padding='same'),

        layers.Conv2D(128, kernel_size=[2, 2], padding='same', activation=tf.nn.relu),

        layers.MaxPool2D(pool_size=[2, 2], strides=2, padding='same'),

        layers.Conv2D(256, kernel_size=[2, 2], padding='same', activation=tf.nn.relu),

        layers.MaxPool2D(pool_size=[2, 2], strides=2, padding='same'),

        layers.Flatten(),

        layers.Dense(128, activation=tf.nn.relu),

        layers.Dense(10)

])

#建立模型,并指明输入的维度及其形状

model.build(input_shape=[None,28,28,1])

4 Sequential模型训练

本文提到的两种方式,在模型的训练上都可以直接调用model.compile进行模型训练配置和model.fit进行训练。

代码语言:javascript
复制
#训练模型的必要配置

model.compile(  #优化器选择及lr的数值

                optimizer=optimizers.Adam(lr=1e-3), 

               #损失函数选择,均分误差,交叉熵等

                loss=tf.losses.CategoricalCrossentropy(from_logits=True),                #用于监控训练,并呈现精确度

                metrics=['accuracy']

                  )

#模型训练,从左往右的参数分别是:训练数据集,训练次数,测试数据集,训练多少次便测试一次

model.fit(train_db,epochs=6,validation_data=test_db,validation_freq=2)

tf.keras.Sequential来搭建模型,简单快速。但缺陷也很明显,框架已定,灵活性太低,无法解决多输入/输出的问题,比如验证码识别:假设一张图内有4个数字,在不对图片进行切割等预处理的情况下,无法通过 Sequential来输出4个结果。

5 Keras Functional API

Functional API即保证了搭建模型的简单快捷,也具有很好的灵活性和可扩充性,无论是单输入/输出还是多/输入输出都能实现。

数据预处理和训练部分都与Sequential相同,那就直接来看看如何用Functional API搭建模型吧。

代码语言:javascript
复制
#定义输入层,并限制其shape

inputs=tf.keras.Input(shape=[28,28,1])

#定义不同神经层,并且每一层的输入都来自于上一层

x=layers.MaxPool2D(pool_size=[2, 2], strides=2, padding='same')(inputs)

x=layers.Conv2D(64,kernel_size=[2,2],padding='same',activation=tf.nn.relu)(x)

x=layers.MaxPool2D(pool_size=[2, 2], strides=2, padding='same')(x)

x=layers.Conv2D(128,kernel_size=[2,2],padding='same',activation=tf.nn.relu)(x)

x=layers.MaxPool2D(pool_size=[2, 2], strides=2, padding='same')(x)

x=layers.Conv2D(256,kernel_size=[2,2],padding='same',activation=tf.nn.relu)(x)

x=layers.MaxPool2D(pool_size=[2, 2], strides=2, padding='same')(x)

x=layers.Flatten()(x)

x=layers.Dense(128, activation=tf.nn.relu)(x)

#定义输出层

output=layers.Dense(10)(x)

#建立模型传入输入和输出层

model=tf.keras.Model(inputs=inputs,outputs=output)

根据以上代码示例,便建立了一个含有卷积和全连接的神经网络。并且每一层都可以独立提出来,也就是说可以查看每一层的输出情况,可以在一些复杂模型中抽取特定层放入自己的代码中,比如抽取VGG19中的某些层放在自己的代码中去实现图像的风格迁移。

6 总结

tf.keras.Sequential和Keras Functional API都可以有助于快速地建立神经网络模型,.Sequential简单易懂,在既定框架下可以最快的搭建些不是很复杂的模型,Functional API同样简单可扩展性高,应用范围更广。

这两种方式来解决认证考试中的前两项内容,相信绰绰有余。

END

主 编 | 王文星

责 编 | 马原涛

where2go 团队

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-04-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 算法与编程之美 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
容器服务
腾讯云容器服务(Tencent Kubernetes Engine, TKE)基于原生 kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务,覆盖 Serverless、边缘计算、分布式云等多种业务部署场景,业内首创单个集群兼容多种计算节点的容器资源管理模式。同时产品作为云原生 Finops 领先布道者,主导开源项目Crane,全面助力客户实现资源优化、成本控制。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档