前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >TensorFlow实现简单神经网络分类问题

TensorFlow实现简单神经网络分类问题

作者头像
里克贝斯
发布2021-05-21 15:44:00
1.1K0
发布2021-05-21 15:44:00
举报
文章被收录于专栏:图灵技术域

利用TensorFlow来训练所有的神经网络的训练过程可以分为如下3个步骤:

①定义神经网络的结构和前向传播的输出结果。

②定义损失函数以及选择反向传播优化算法。

③生成会话(tf.Session)并且在训练数据上反复运行反向传播优化算法。

下面给出一个简单的二分类问题的神经网络算法(完整的流程)

神经网络具体结构如下图:

训练流程图:

几个解释:

①Numpy 是一个科学计算的工具箱的,这里通过Numpy生成模拟数据集。

②batch是每一次的训练数据的大小。

③损失函数是交叉熵(cross_entropy)

具体解释请看:https://www.omegaxyz.com/2018/05/07/information_entropy/

④反向传播算法可以使用梯度下降法:tf.train.GradientDescentOptimizer(0.05).minimize(cross_entropy)或者tf.train.AdamOptimizer(0.002).minimize(cross_entropy)

文章中使用的是AdamOptimizer,学习率是0.002。

⑤这里所有x1+x2<1的样例都被认为是正样本。

⑥每隔一段时间计算在所有数据上的交叉熵并输出,交叉熵越小说明预测的结果和真实的结果差距越小,这里用matplotlib画图。

代码:

Python

代码语言:javascript
复制
import tensorflow as tf
import matplotlib.pyplot as plt
from numpy.random import RandomState
# Numpy 是一个科学计算的工具箱的,这里通过Numpy生成模拟数据集
 
# 定义训练数据batch的大小
batch_size = 8
 
w1 = tf.Variable(tf.random_normal([2, 3], stddev=1, seed=1))
w2 = tf.Variable(tf.random_normal([3, 1], stddev=1, seed=1))
 
x = tf.placeholder(tf.float32, shape=(None, 2), name='x-input')
y_ = tf.placeholder(tf.float32, shape=(None, 1), name='y-input')
 
# 定义神经网络前向传播过程
a = tf.matmul(x, w1)
y = tf.matmul(a, w2)
 
# 定义损失函数和反向传播算法
cross_entropy = -tf.reduce_mean(
    y_ * tf.log(tf.clip_by_value(y, 1e-10, 1.0)))
train_step = tf.train.AdamOptimizer(0.002).minimize(cross_entropy)
# 采用梯度下降优化器进行优化
# train_step = tf.train.GradientDescentOptimizer(0.05).minimize(cross_entropy)
 
 
# 通过随机数生成一个模拟数据集
rdm = RandomState(1)
dataset_size = 128
X = rdm.rand(dataset_size, 2)
 
# 产生样本标签,这里所有x1+x2<1的样例都被认为是正样本
Y = [[int(x1 + x2 < 1)] for (x1, x2) in X]
 
# 创建一个会话来运行tensorflow程序
with tf.Session() as sess:
    init_op = tf.initialize_all_variables()
    sess.run(init_op)
    print(sess.run(w1))
    print(sess.run(w2))
 
    STEPS = 5000
 
    plt.axis([0, 5000, 0, 0.08])
    plt.ion()
    x11 = [0, 0]
    y11 = [1, 1]
 
    for i in range(STEPS):
        start = (i * batch_size) % dataset_size
        end = min(start + batch_size, dataset_size)
        # 通过选取的样本训练神经网络并更新参数
        sess.run(train_step, feed_dict={x: X[start:end], y_: Y[start:end]})
        if i % 100 == 0:
            # 每隔一段时间计算在所有数据上的交叉熵并输出,交叉熵越小说明预测的结果和真实的结果差距越小
            total_cross_entropy = sess.run(cross_entropy, feed_dict={x: X, y_: Y})
            print("After %d training step,cross entropy on all data is %g" % (i, total_cross_entropy))
            x11[0] = x11[1]
            y11[0] = y11[1]
            x11[1] = i
            y11[1] = total_cross_entropy
            plt.plot(x11, y11)
            plt.xlabel("Step")
            plt.ylabel("Cross Entropy")
            plt.pause(0.05)
        # print(sess.run(w1))
        # print(sess.run(w2))
plt.pause(10)

结果:

交叉熵越低,结果越好

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018-05-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 利用TensorFlow来训练所有的神经网络的训练过程可以分为如下3个步骤:
  • 神经网络具体结构如下图:
  • 训练流程图:
  • 几个解释:
  • 代码:
  • 结果:
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档