首页
学习
活动
专区
圈层
工具
发布
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    TensorFlow强化学习入门(3)——构建仿真环境来进行强化学习

    W1_m) + B1_m) # 第二层 W2_m = tf.get_variable("W2_m", shape=[num_hidden_m, num_hidden_m], initializer=tf.contrib.layers.xavier_initializer...第三层(输出层) # 注意这里有三个单独的输出层 W_obs_m = tf.get_variable("W_obs_m", shape=[num_hidden_m, 4], initializer=tf.contrib.layers.xavier_initializer...]), name="B_obs_m") W_reward_m = tf.get_variable("W_reward_m", shape=[num_hidden_m, 1], initializer=tf.contrib.layers.xavier_initializer...1]), name="B_reward_m") W_done_m = tf.get_variable("W_done_m", shape=[num_hidden_m, 1], initializer=tf.contrib.layers.xavier_initializer...) # 第一层 W1_p = tf.get_variable("W1", shape=[dimen,num_hidden_p], initializer=tf.contrib.layers.xavier_initializer

    5.4K60
    领券