学习控制算法 - 腾讯云开发者社区

、

我正在尝试使用强化学习来控制一个实际的机器人操纵器。对于强化学习，我使用的是Google tensorflow。我已经考虑过在C++中实现我自己的强化学习算法，但这将是太多的工作，并且需要太多的时间。 C++中有没有使用Tensorflow强化学习算法的方法？或者，有没有其他方法可以在C++实时控制</em

浏览 0提问于2019-04-01得票数 0

4回答

需要好的方法来选择和调整“学习率”

、、

在下图中，您可以看到一个学习算法，它试图学习生成所需的输出(红线)。该学习算法类似于反向误差传播神经网络。 “学习率”是一个值，它控制在训练过程中所做的调整的大小。如果学习率太高，则算法学习速度很快，但其预测在训练过程中会跳跃很多(绿线学习率为0.001)，如果学习率较低，则预测跳跃较少，但算法需要更长的学习时间(蓝线学习率为0

浏览 1提问于2009-06-05得票数 11

回答已采纳

2回答

强化学习算法

、

我想用强化学习机器学习的方法来研究和开发一些应用。我已经熟悉使用监督学习的分类问题。谢谢!

浏览 0提问于2021-11-15得票数 0

回答已采纳

2回答

遗传算法是无监督学习的一种形式吗？

、、

遗传算法被认为是一种无监督学习的形式吗？我知道算法是独立进化的，但是种群中每个个体的适应度是定期测量的(监督的？)。谢谢你的帮助！-

浏览 12提问于2013-12-23得票数 3

回答已采纳

1回答

目标变量中的缺失值

、、

因为我想用更多的数据来训练我的模型，所以我不想删除丢失的行，而是使用KNN输入算法。同时，我也想防止数据泄露。

浏览 9提问于2022-09-08得票数 -1

1回答

将有状态C计算与Modelica集成

、、

我已经集成了一个用C语言实现的机器学习算法和一个运行在OpenModelica中的Modelica模型。这让我怀疑，为了求解模型，OpenModelica需要在每次模拟迭代中调用它几次。这影响了算法的学习方式，因为它保持了关于其经验的状态。为什么OpenM

浏览 2提问于2015-03-31得票数 2

1回答

学习速度和梯度下降差？

、、、、

我明白(我想)学习率乘以梯度(斜率)就可以使梯度下降，但这是真的吗？我错过了什么吗？谢谢

浏览 5提问于2019-10-07得票数 0

回答已采纳

1回答

在RL/TD学习中，这些术语指的是什么？

我一直在努力实现TD。我的实现所依据的文件/项目如下：对我来说一切都是有意义的，直到它谈到了后盾的程序。我在加州大学二年级没有学过很多高级数学，也从来没有上过一门关于ML/RL的正式课程。反向传播过程：计算V上网络输出与所需输出O之间的误差E。V=V+(Alpha)*误差(N)*e(S)对于隐藏节点i和输出节点之间的权重，错误(I)=E*激活(I)

浏览 0提问于2020-04-10得票数 -2

回答已采纳

1回答

我的2048游戏双DQN算法从不学习

、、、、

我试着做双DQN算法来学习玩2048游戏.如果您想检查代码，我的实现在GitHub中是可用的。() 我试过的剧集最多有4000集。我如何计算出最佳的剧集数。

浏览 1提问于2017-07-06得票数 1

1回答

集合学习是元学习的一个子集吗？

、

我正在学习集合学习方法，重点是随机森林和梯度提升。我读过关于这个主题的这文章和关于元学习的这文章。可以说，集合学习是元学习的一个子集？

浏览 0提问于2022-03-29得票数 1

回答已采纳

1回答

我正在探索Amazon中的增量学习功能

、、、、

我可以访问AWS控制台，并开始探索Sagemaker增量学习文档。目前只有三种内建算法支持增量训练:目标检测算法、图像分类算法和语义分割算法。我想知道我们是否能够成功地使用新的增量样本数据来训练其他(非内置算法)训练图像的初始模型。例如，分类或回归。

浏览 2提问于2022-08-01得票数 0

1回答

连续在线群集识别的解决方案？

、

让我向您展示一个假设的在线集群应用程序的示例：此时n点1,2,3,4分配给蓝组A，点b,5,6,7分配给红色组B。在终点1,2,3,4，a，B属于A，点5,6,7至B。对我来说，这似乎是合理的。📷做这个决定的计算机将不得不使用规则。例如，当点被合并到一个集群中时，集群的标识由大多数人决定。

浏览 0提问于2014-08-14得票数 11

1回答

当提到神经网络时，什么是“控制任务”还是“控制器设计”？

、

似乎有一些机器学习算法最适合于“控制任务”和“控制器设计”。我知道定义/解释“控制”有很多不同的方式，所以我想知道它在机器学习中意味着什么？而且，如果它在描述某物为“控制任务”或“控制器”时意味着相同的事情。如果你明白我的意思，非常感谢你！

浏览 3提问于2011-12-26得票数 2

回答已采纳

2回答

我知道前馈神经网络的基本知识，以及如何使用反向传播算法来训练它们，但我正在寻找一种比我能用来训练神经网络的强化学习的算法。例如，问题是我想用人工神经网络解决的问题。在这种情况下，我不知道应该做什么来控制钟摆，我只知道我离理想的位置有多近。我需要让安在奖惩的基础上学习。因此，监督学习不是一种选择。对于第一种情况，我可以想到一些算法，比如爬山或遗传算法，但我猜它们都会很慢。它们也可能适用于第二种情况，但速度慢得令人难以置信，不利于在线学习</em

浏览 1提问于2012-05-23得票数 67

回答已采纳

1回答

在线机器学习资源

、、

我想知道是否有关于“在线机器学习”的书籍/文章/教程？或者这本书：我似乎在这方面找不到多少资料。

浏览 0提问于2021-11-15得票数 2

回答已采纳

1回答

自动驾驶技术是从数据还是最先进的算法中获得更多呢？

、、、、

当人们开始认为在不久的将来，自动驾驶汽车将取代一些道路上的车辆，这意味着机器人软件中的学习者可以达到一个很低的经验误差，从而保证乘客的安全。在我们看来，大量的驾驶数据和深入的强化学习算法在很大程度上促进了自动驾驶实践的成功。当涉及到我们自己实践的许多情况时，我们还无法建立一个如此高精度的预测模型，从而给我们自己的业务带来巨大的差异。我的问题是，当我看到机器学习技术能够在汽车驾驶上产生革命，因为它成功地实现了行为克隆任务，那么这一成功的首要原因是什么，大训练数据集，深强化学习技术，或者在自动驾驶问题中的任

浏览 0提问于2018-01-04得票数 1

1回答

机器学习如何与大数据相结合？

、、

机器学习如何与大数据集成?机器学习与MapReduce?What的区别是什么？(有监督学习、无监督学习、强化学习)是决策的主要内容之一，大数据在医疗保健和智能城市决策中的区别是什么？<code>H 111</code>以及大数据与深度学习作为机器学习技术之一的关系？<code>H 212</code><code>G 213</code>>

浏览 3提问于2019-11-14得票数 1

回答已采纳

2回答

学习算法列表

、、、

是否有将算法或算法类与该算法适合的任务匹配的列表或目录？比如在的主页上文本分类->朴素贝叶斯连续标签的预测-> LinearRegression

浏览 1提问于2017-07-10得票数 2

回答已采纳

5回答

学习高效算法

、

因此，我总是选择学习更高层次的编程细节，例如类交互、API设计等。我从来没有真正觉得算法特别有趣。因此，即使我能为我的程序想出一个好的设计，即使我能想出一个给定问题的解决方案，它也很少是最有效的。另外，你可以推荐哪些在线资源来教你针对不同问题的各种有效算法？

浏览 1提问于2011-03-12得票数 18

回答已采纳

2回答

学习回溯算法

、

我想学习回溯算法。有人能教我一些吗？我试着从一些网站上学习，但不起作用。有没有人可以教我。谢谢!

浏览 1提问于2011-04-11得票数 7

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何用强化学习算法建立实时控制器

需要好的方法来选择和调整“学习率”

强化学习算法

遗传算法是无监督学习的一种形式吗？

目标变量中的缺失值

将有状态C计算与Modelica集成

学习速度和梯度下降差？

在RL/TD学习中，这些术语指的是什么？

我的2048游戏双DQN算法从不学习

集合学习是元学习的一个子集吗？

我正在探索Amazon中的增量学习功能

连续在线群集识别的解决方案？

当提到神经网络时，什么是“控制任务”还是“控制器设计”？

基于强化学习的神经网络训练

在线机器学习资源

自动驾驶技术是从数据还是最先进的算法中获得更多呢？

机器学习如何与大数据相结合？

学习算法列表

学习高效算法

学习回溯算法

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐