JavaScript强化教程 - 腾讯云开发者社区

文章/答案/技术大牛

发布

1回答

Microsoft CNTK增强学习C++示例

、、、

我目前正在尝试用C++编写一个扮演炸弹人的人工智能，我想用CNTK将其实现为神经网络(强化学习)。该工具包有很多教程和示例，甚至有一个用于强化学习，但它是用python编写的，我不知道。有没有使用CNTK教授强化学习的实用C++示例或教程？我最关心的第一个问题是如何使用CNTK C++ api创建模型。

浏览 2提问于2017-06-06得票数 3

1回答

在openai健身房中创建自定义环境，并以游戏屏幕为观察对象

、

我用PyGame做了一个游戏。我想使用游戏屏幕的输出作为观察的自定义，而不是一组距离和角度。(我已经看到了定制环境的文档，但在那个观察中并没有游戏屏幕)。

浏览 0提问于2020-05-26得票数 0

3回答

如何去强化强化的JavaScript？

、、、

如何使已经被字符串化的JavaScript代码“去字符串化”？JSON.parse似乎不起作用。我们希望将JavaScript代码存储在数据库中，然后检索它，然后对它进行评估。

浏览 0提问于2015-04-27得票数 1

回答已采纳

1回答

强化学习中探索/利用的最佳实践

、

我的问题是在我对PyTorch DQN教程中的代码进行检查后提出的，但随后又提到了强化学习:强化学习中最佳探索/利用的最佳实践是什么？在DQN教程中，steps_done变量是一个全局变量，EPS_DECAY = 200。这可能适用于本教程中介绍的CartPole问题-早期的片段可能非常短，任务相当简单-但对于需要更多探索的更复杂的问题呢？

浏览 22提问于2019-02-04得票数 0

回答已采纳

2回答

如何在python中调用Javascript函数？

、、

我正在尝试用电子学和深度强化学习来做一个蛇的游戏。我用python和Javascript做的强化学习的东西。现在我如何在python中调用这样的函数呢？

浏览 3提问于2020-03-20得票数 0

2回答

Tic-Tac-Toe中的Tensorflow

**TLDR的底部我已经搜索了几天，而我只是不知道什么谷歌，因为我是非常新的机器学习。经过研究，我认为tensorflow是一个很好的起点(我愿意接受其他建议)。当我寻找tensorflow的例子时，它们都需要一个大型的数据存储库才能输入程序，但我更感兴趣的是创建一个在玩游戏时学习的AI，比如Tic Tac Toe。我很难搞清楚该怎么做。任何建议都有帮助，谢谢！

浏览 1提问于2019-03-19得票数 0

回答已采纳

2回答

强化学习算法

、

我想用强化学习机器学习的方法来研究和开发一些应用。我已经熟悉使用监督学习的分类问题。有人能给我推荐一些资料(链接，youtube教程，pdf笔记，.)吗？

浏览 0提问于2021-11-15得票数 0

回答已采纳

1回答

习惯养成人工智能

、

我可能对这件事有点不知所措，也许我问错了问题，但我来了。我希望建立一种习惯来形成AI，基本上它只做一次事情，然后根据结果确定它的优先级，以便以后再做一次或避免以后。我的主要问题是我不确定如何存储动作。有没有什么好的，基础的，学习人工智能的或者构建人工智能的指南？我使用python来做这件事，但我只是在寻找基础知识，这样我就可以理解他们在做什么。

浏览 0提问于2013-03-01得票数 0

回答已采纳

1回答

这是什么类型的优化问题？

、

我们有一个可变形的镜子，由40个驱动器控制，输入电压从-1V到1V。在撞上镜子之前，一脉冲光进入衍射光栅，然后光线通过波长传播到镜面上。每个执行器对每个波长施加差分相移。最后，由CCD重新会聚和读取光线。该程序将执行如下操作：将新频谱输入优化工具箱。回到1 可能有多个局部最大值，并且位置将随着我们的设置不断变化而日复一日地发生变化。任何帮助在哪里寻找更多的信息，将不胜感激！

浏览 0提问于2016-08-10得票数 1

1回答

网络工作人员是否增加(或降低)安全性？

、、、

web工作者是否缓解或强化了JavaScript和浏览器环境中已知的安全问题？

浏览 3提问于2012-10-09得票数 7

1回答

强化学习:处理不可量化的反馈系统

、

我正在尝试写一个强化学习算法，为了简单起见，它将预测一个我认为通过n个输入的数字，它们是什么并不重要。所以当算法预测一个数字时，我只会说“非常近”“接近”“精确”“远”“太远” 现在我看过的所有教程都有一个可以量化的结果，他们通常会做均方误差来看看预测中有多少误差。但是这里的反馈是无法量化的。仅供参考，我是ML的新手，它没有必要是强化学习。我也尝试过神经网络方法，但即使这样也有类似的问题。

浏览 1提问于2018-05-12得票数 1

2回答

Pytorch -在eval()和train()模式之间来回往返

、、、、

我正在学习“深度强化学习”，并在pytorch的强化学习(DQN)教程之后构建我自己的示例。在训练分类神经网络时，model.eval()只在训练结束后进行，但在“深度强化学习”的情况下，通常采用策略，然后继续优化过程。我想知道不同模式之间的来回是否对优化过程是“无害的”？

浏览 3提问于2019-10-18得票数 3

回答已采纳

1回答

关于如何在Tensoflow中使用tf.contrib.rnn.NASCell的示例代码

、、、、

在观看了Tensorflow 2017峰会视频后，我对这个使用强化学习的新对象感到好奇，以便找到最佳的NN架构。我是Python和Tensorflow的新手。只是在看初学者的教程。

浏览 3提问于2017-04-20得票数 2

1回答

TFAgents:如何考虑无效操作

、、

我使用TF-代理库来强化学习，我想考虑到，对于给定的状态，一些操作是无效的。如何实施呢？如果是的话:你知道这方面的教程吗？

浏览 10提问于2020-12-08得票数 2

回答已采纳

1回答

NameError:在GOOGLE COLAB中运行开放式AI健身房时未定义名称'base‘

、、、、

我正在学习Pytorch.org，中的DQN强化学习教程但在这里，当我试图渲染一个屏幕并使用python display显示时，我得到的结果是name base not found。有人能帮我吗？

浏览 2提问于2020-08-05得票数 1

1回答

如何实现一次要求所有输出的成本函数

假设我有一个成本函数，它要求一个神经网络的所有输出(即经过一定范围的训练时间步骤)来计算它的成本。在tensorflow中实现这一目标的方法是什么？

浏览 3提问于2018-04-16得票数 0

回答已采纳

1回答

使用AI，CNN和RNN的场景记忆

、

考虑以下场景(图像)。我想开发人工智能，来理解一个特定的事件和序列或者它的链条。场景2 :1号球员将球传给2号球员，然后2号球员可以接球或错失球。所以我希望从你那里知道的是，我如何实现这种人工智能，我应该应用什么样的方法和技术来开发这种人工智能。据我所知，我发现了RNN，CNN可以做到这一点，不知道它们到底是什么。以及你在这方面看到了什么样的缺点/挑战。以及应该采取的一般步骤来实现这一点。

浏览 1提问于2017-08-10得票数 0

1回答