pytorch dqn - 腾讯云开发者社区

文章/答案/技术大牛

发布

1回答

使用pytorch的均方对数误差

你好，我是PyTorch的新手，我想在我的神经网络中使用均方对数误差作为损失函数来训练我的DQN代理，但是我在PyTorch的nn.functional中找不到MSLE，什么是实现它的最好方法？

浏览 27提问于2021-05-22得票数 1

回答已采纳

1回答

Pytorch使用了太多的资源

、、、

我正在使用pytorch训练一个DQN模型。使用ubuntu，如果我使用htop，我会得到 ? 正如你所看到的，所有的资源都被使用了，我对此有点担心。这是我的code。我必须使用pytorch添加我的需求吗？请注意，我的计算机上没有GPU，只有CPU

浏览 19提问于2020-04-09得票数 5

回答已采纳

1回答

NameError:在GOOGLE COLAB中运行开放式AI健身房时未定义名称'base‘

、、、、

我正在学习Pytorch.org，中的DQN强化学习教程但在这里，当我试图渲染一个屏幕并使用python display显示时，我得到的结果是name base not found。有人能帮我吗？

浏览 2提问于2020-08-05得票数 1

2回答

最近，我正在阅读Michael Nielsen 的神经网络和深度学习，并想在贷款违约数据上测试神经网络。但是，经过多次尝试，我仍然无法将csv格式的数据转换为脚本所需的矩阵格式。. v1 v2 v3 ... v770; 2. 2 1 2 ... 1; 下面是我导入的方法：tr_input = [np.reshape(genfromtxt('training.csv', delimiter=','), (7

浏览 0提问于2018-06-29得票数 0

1回答

强化学习中探索/利用的最佳实践

、

我的问题是在我对PyTorch DQN教程中的代码进行检查后提出的，但随后又提到了强化学习:强化学习中最佳探索/利用的最佳实践是什么？在DQN教程中，steps_done变量是一个全局变量，EPS_DECAY = 200。

浏览 22提问于2019-02-04得票数 0

回答已采纳

1回答

Pytorch Double DQN无法正常工作

、、

我正在尝试为cartpole v0创建一个双dqn网络，但是网络似乎没有像预期的那样工作，并且在8-9奖励时停滞不前。我做错了什么？next_observation) q_a_next = q_next[q_argmax] obv_reward = q target_reward = torch

浏览 7提问于2018-08-15得票数 1

1回答

使用pytorch的dqn的动作选择

、、

我是DQN的新手，正在尝试理解它的编码。

浏览 65提问于2021-08-01得票数 0

1回答

如何在PyTorch中为软角色评论者设置损失函数

、、、

我正在尝试在PyTorch中为软Q学习、参与者-批评者策略梯度算法实现一个自定义损失函数。这来自于下面的论文。该算法的结构类似于深度Q学习，因为我们使用网络来估计Q值，并使用目标网络来稳定结果。然而，与DQN不同的是，我们从Q(s)计算V(s)的方法是：这非常简单，可以用PyTorch进行计算。我的主要问题是如何设置损失函数。

浏览 21提问于2019-11-20得票数 0

1回答

解决错误:尺寸错配，m1：[30x2]，m2：[30x2]

、、

我收到以下错误消息： File "C:\Users\Sam\Desktop\Bitcoin\Q_Learning\DQN_NEW_Original.py'input' (position 1) mus

浏览 0提问于2021-06-21得票数 0

1回答

GPU是否缩短了策略RL的培训时间？

、、

我想知道使用GPU是否会有效，如果我使用的政策(如PPO) RL作为模型？我最近训练了一个模型，GPU的利用率约为2%。

浏览 0提问于2021-10-13得票数 1

回答已采纳

16回答

如何在windows中安装pytorch？

、、、、

我正在尝试在windows上安装pytorch，但有一个可用，但显示错误。 conda install -c peterjc123 pytorch=0.1.12

浏览 1提问于2017-12-11得票数 14

2回答

基于DQN的健身赛车v0

、、、、

我已经成功地使用了PPO算法，现在我想使用DQN算法，但是当我想训练模型时，它给了我这个错误： import osfrom stable_baselines3 import DQNenv = DummyVecEnv([lambda: env]) log_path

浏览 4提问于2022-03-31得票数 2

1回答

PyTorch DQN代码不能解决OpenAI CartPole

、、、

0.01target_update = 10lr = 0.001 screen = self.render('rgb_array').transpose((2, 0, 1)) # PyTorchAgent(strategy, em.num_actions_available(), device) memory = Rep

浏览 21提问于2020-02-07得票数 1

1回答

决斗DQN和双DQN的区别？

、、、

我读过一些文章，但还是找不出决斗DQN和双DQN之间的区别吗？他们之间到底有什么区别？另外，决斗DQN需要建立在双DQN之上吗？谢谢!

浏览 0提问于2019-05-31得票数 3

2回答

将具有第一行标题的二维数组转换为object JavaScript

、、

我有一个以第一行作为标题的数组： array = [[ 'combi', 'DQ#', 'sd', 'Level 3', 'Level 6', 'Level 7' ], [ 'DQn DQDC Simple','DQn', 'DQDC', 'Simple', 'Simple_A7', 0.262],[ 'DQn

浏览 39提问于2021-04-07得票数 2

回答已采纳

2回答

如何理解这个map-reduce代码是如何工作的？

= v, acc), {})) [ 'combi', 'DQ#', 'sd', 'Level 3', 'Level 6', 'Level 7' ], [ '

浏览 16提问于2021-10-05得票数 0

回答已采纳

2回答

Pytorch modified DQN算法错误“未实现‘’的导数”

、

我正在尝试构造新的观察值，并将其应用到DQN中。我使用pytorch DQN算法和我的观察代码。它还没有完成，所以数据还不清楚。 return len(self.memory) super(DQN, self).BATCH_SIZE = 5

浏览 1提问于2018-05-11得票数 1

1回答

使用MultiDiscrete ActionSpace AttributeError的健身房RL：'MultiDiscrete‘对象没有属性’空格‘

我正在尝试构建一个强化学习算法，它可以玩MasterMind游戏。我使用的是MultiDiscrete功能和观测空间。动作空间有4个插槽，每个有6种颜色，观察空间是2x4。我创建了一个自定义环境来连接我的程序游戏。由于出现错误，环境还没有准备好。也许有人能帮我解决这个问题。from gym import Envfrom stable_baselines3.common.policies import MultiInputActorCriti

浏览 0提问于2022-10-21得票数 0

1回答

tf_agents dqn初始化失败

、、、

connect 4 board import tensorflow as tffrom tf_agents.agents.dqnimport dqn_agentimport numpy as np agent = dqn</

浏览 12提问于2022-09-05得票数 0

回答已采纳

1回答

需要在lua中具有不同文件名的包。

、

遵循，我试图将DeepMind dqn导入到iTorch笔记本中。package.path = package.path .. ";/path/to/dqn/?.lua"require 'dqn' 我获得了一个(预期的)错误，因为文件夹中没有名为dqn.lua的文件。实际上，这些模块的源代码包含在文件Neura

浏览 3提问于2015-11-16得票数 1

回答已采纳

点击加载更多

使用pytorch的均方对数误差

Pytorch使用了太多的资源

NameError:在GOOGLE COLAB中运行开放式AI健身房时未定义名称'base‘

更新:将每行数据整形为(x，1)数组

强化学习中探索/利用的最佳实践

Pytorch Double DQN无法正常工作

使用pytorch的dqn的动作选择

如何在PyTorch中为软角色评论者设置损失函数

解决错误:尺寸错配，m1：[30x2]，m2：[30x2]

GPU是否缩短了策略RL的培训时间？

如何在windows中安装pytorch？

基于DQN的健身赛车v0

PyTorch DQN代码不能解决OpenAI CartPole

决斗DQN和双DQN的区别？

将具有第一行标题的二维数组转换为object JavaScript

如何理解这个map-reduce代码是如何工作的？

Pytorch modified DQN算法错误“未实现‘’的导数”

使用MultiDiscrete ActionSpace AttributeError的健身房RL：'MultiDiscrete‘对象没有属性’空格‘

tf_agents dqn初始化失败

需要在lua中具有不同文件名的包。

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐