腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
Microsoft CNTK增强学习C++示例
、
、
、
我目前正在尝试用C++编写一个扮演炸弹人的人工智能,我想用CNTK将其实现为神经网络(
强化
学习)。该工具包有很多
教程
和示例,甚至有一个用于
强化
学习,但它是用python编写的,我不知道。有没有使用CNTK教授
强化
学习的实用C++示例或
教程
? 我最关心的第一个问题是如何使用CNTK C++ api创建模型。
浏览 2
提问于2017-06-06
得票数 3
1
回答
在openai健身房中创建自定义环境,并以游戏屏幕为观察对象
、
我用PyGame做了一个游戏。我想使用游戏屏幕的输出作为观察的自定义,而不是一组距离和角度。(我已经看到了定制环境的文档,但在那个观察中并没有游戏屏幕)。
浏览 0
提问于2020-05-26
得票数 0
3
回答
如何去
强化
强化
的
JavaScript
?
、
、
、
如何使已经被字符串化的
JavaScript
代码“去字符串化”?JSON.parse似乎不起作用。我们希望将
JavaScript
代码存储在数据库中,然后检索它,然后对它进行评估。
浏览 0
提问于2015-04-27
得票数 1
回答已采纳
1
回答
强化
学习中探索/利用的最佳实践
、
我的问题是在我对PyTorch DQN
教程
中的代码进行检查后提出的,但随后又提到了
强化
学习:
强化
学习中最佳探索/利用的最佳实践是什么?在DQN
教程
中,steps_done变量是一个全局变量,EPS_DECAY = 200。这可能适用于本
教程
中介绍的CartPole问题-早期的片段可能非常短,任务相当简单-但对于需要更多探索的更复杂的问题呢?
浏览 22
提问于2019-02-04
得票数 0
回答已采纳
2
回答
如何在python中调用
Javascript
函数?
、
、
我正在尝试用电子学和深度
强化
学习来做一个蛇的游戏。我用python和
Javascript
做的
强化
学习的东西。现在我如何在python中调用这样的函数呢?
浏览 3
提问于2020-03-20
得票数 0
2
回答
Tic-Tac-Toe中的Tensorflow
**TLDR的底部我已经搜索了几天,而我只是不知道什么谷歌,因为我是非常新的机器学习。经过研究,我认为tensorflow是一个很好的起点(我愿意接受其他建议)。当我寻找tensorflow的例子时,它们都需要一个大型的数据存储库才能输入程序,但我更感兴趣的是创建一个在玩游戏时学习的AI,比如Tic Tac Toe。我很难搞清楚该怎么做。任何建议都有帮助,谢谢!
浏览 1
提问于2019-03-19
得票数 0
回答已采纳
2
回答
强化
学习算法
、
我想用
强化
学习机器学习的方法来研究和开发一些应用。我已经熟悉使用监督学习的分类问题。 有人能给我推荐一些资料(链接,youtube
教程
,pdf笔记,.)吗?
浏览 0
提问于2021-11-15
得票数 0
回答已采纳
1
回答
习惯养成人工智能
、
我可能对这件事有点不知所措,也许我问错了问题,但我来了。我希望建立一种习惯来形成AI,基本上它只做一次事情,然后根据结果确定它的优先级,以便以后再做一次或避免以后。我的主要问题是我不确定如何存储动作。有没有什么好的,基础的,学习人工智能的或者构建人工智能的指南?我使用python来做这件事,但我只是在寻找基础知识,这样我就可以理解他们在做什么。
浏览 0
提问于2013-03-01
得票数 0
回答已采纳
1
回答
这是什么类型的优化问题?
、
我们有一个可变形的镜子,由40个驱动器控制,输入电压从-1V到1V。在撞上镜子之前,一脉冲光进入衍射光栅,然后光线通过波长传播到镜面上。每个执行器对每个波长施加差分相移。最后,由CCD重新会聚和读取光线。该程序将执行如下操作:将新频谱输入优化工具箱。回到1 可能有多个局部最大值,并且位置将随着我们的设置不断变化而日复一日地发生变化。任何帮助在哪里寻找更多的信息,将不胜感激!
浏览 0
提问于2016-08-10
得票数 1
1
回答
网络工作人员是否增加(或降低)安全性?
、
、
、
web工作者是否缓解或
强化
了
JavaScript
和浏览器环境中已知的安全问题?
浏览 3
提问于2012-10-09
得票数 7
1
回答
强化
学习:处理不可量化的反馈系统
、
我正在尝试写一个
强化
学习算法,为了简单起见,它将预测一个我认为通过n个输入的数字,它们是什么并不重要。所以当算法预测一个数字时,我只会说“非常近”“接近”“精确”“远”“太远” 现在我看过的所有
教程
都有一个可以量化的结果,他们通常会做均方误差来看看预测中有多少误差。但是这里的反馈是无法量化的。仅供参考,我是ML的新手,它没有必要是
强化
学习。我也尝试过神经网络方法,但即使这样也有类似的问题。
浏览 1
提问于2018-05-12
得票数 1
2
回答
Pytorch -在eval()和train()模式之间来回往返
、
、
、
、
我正在学习“深度
强化
学习”,并在pytorch的
强化
学习(DQN)
教程
之后构建我自己的示例。在训练分类神经网络时,model.eval()只在训练结束后进行,但在“深度
强化
学习”的情况下,通常采用策略,然后继续优化过程。 我想知道不同模式之间的来回是否对优化过程是“无害的”?
浏览 3
提问于2019-10-18
得票数 3
回答已采纳
1
回答
关于如何在Tensoflow中使用tf.contrib.rnn.NASCell的示例代码
、
、
、
、
在观看了Tensorflow 2017峰会视频后,我对这个使用
强化
学习的新对象感到好奇,以便找到最佳的NN架构。我是Python和Tensorflow的新手。只是在看初学者的
教程
。
浏览 3
提问于2017-04-20
得票数 2
1
回答
TFAgents:如何考虑无效操作
、
、
我使用TF-代理库来
强化
学习,我想考虑到,对于给定的状态,一些操作是无效的。 如何实施呢?如果是的话:你知道这方面的
教程
吗?
浏览 10
提问于2020-12-08
得票数 2
回答已采纳
1
回答
NameError:在GOOGLE COLAB中运行开放式AI健身房时未定义名称'base‘
、
、
、
、
我正在学习Pytorch.org,中的DQN
强化
学习
教程
但在这里,当我试图渲染一个屏幕并使用python display显示时,我得到的结果是name base not found。有人能帮我吗?
浏览 2
提问于2020-08-05
得票数 1
1
回答
如何实现一次要求所有输出的成本函数
假设我有一个成本函数,它要求一个神经网络的所有输出(即经过一定范围的训练时间步骤)来计算它的成本。在tensorflow中实现这一目标的方法是什么?
浏览 3
提问于2018-04-16
得票数 0
回答已采纳
1
回答
使用AI,CNN和RNN的场景记忆
、
考虑以下场景(图像)。我想开发人工智能,来理解一个特定的事件和序列或者它的链条。场景2 :1号球员将球传给2号球员,然后2号球员可以接球或错失球。所以我希望从你那里知道的是,我如何实现这种人工智能,我应该应用什么样的方法和技术来开发这种人工智能。据我所知,我发现了RNN,CNN可以做到这一点,不知道它们到底是什么。以及你在这方面看到了什么样的缺点/挑战。以及应该采取的一般步骤来实现这一点。
浏览 1
提问于2017-08-10
得票数 0
1
回答
使用VW向奖励分布添加噪声
、
我想在我已有的奖励分布中添加噪声。奖励分布应该以什么形式表示,以便大众理解,以及大众可以使用哪些方法来诱导噪声?例如,您可以考虑给定的奖励分布
浏览 16
提问于2021-02-02
得票数 0
1
回答
如何在使用PyTorch
教程
代码时将输入类型(图像)更改为列表或数组
目前,我参考了火炬
强化
学习
教程
(DQN)。但是,此代码使用图像输入数据。(我需要帮助解决我使用列表输入数据的研究。列表输入数据形状为1×9。)
浏览 3
提问于2019-08-30
得票数 0
回答已采纳
2
回答
外键约束Synapse Azure
、
、
我当前在Azure Synapse中创建数据仓库,但是Synapse不允许创建外键。这对于事实表和维度表之间的引用完整性至关重要。有没有人对synapse中执行PK FK关系的替代方案有任何建议?
浏览 4
提问于2020-05-20
得票数 5
点击加载更多
相关
资讯
JavaScript 注释|JavaScript 教程
JavaScript 函数|JavaScript 教程
JavaScript 变量|JavaScript 教程
JavaScript 语句|JavaScript 教程
JavaScript 对象概念|JavaScript 教程
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券