腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何用强化
学习
算法
建立实时
控制
器
、
我正在尝试使用强化
学习
来
控制
一个实际的机器人操纵器。对于强化
学习
,我使用的是Google tensorflow。我已经考虑过在C++中实现我自己的强化
学习
算法
,但这将是太多的工作,并且需要太多的时间。 C++中有没有使用Tensorflow强化
学习
算法
的方法?或者,有没有其他方法可以在C++实时
控制</em
浏览 0
提问于2019-04-01
得票数 0
4
回答
需要好的方法来选择和调整“
学习
率”
、
、
在下图中,您可以看到一个
学习
算法
,它试图
学习
生成所需的输出(红线)。该
学习
算法
类似于反向误差传播神经网络。 “
学习
率”是一个值,它
控制
在训练过程中所做的调整的大小。如果
学习
率太高,则
算法
学习
速度很快,但其预测在训练过程中会跳跃很多(绿线
学习
率为0.001),如果
学习
率较低,则预测跳跃较少,但
算法
需要更长的
学习
时间(蓝线
学习
率为0
浏览 1
提问于2009-06-05
得票数 11
回答已采纳
2
回答
强化
学习
算法
、
我想用强化
学习
机器
学习
的方法来研究和开发一些应用。我已经熟悉使用监督
学习
的分类问题。谢谢!
浏览 0
提问于2021-11-15
得票数 0
回答已采纳
2
回答
遗传
算法
是无监督
学习
的一种形式吗?
、
、
遗传
算法
被认为是一种无监督
学习
的形式吗?我知道
算法
是独立进化的,但是种群中每个个体的适应度是定期测量的(监督的?)。谢谢你的帮助!-
浏览 12
提问于2013-12-23
得票数 3
回答已采纳
1
回答
目标变量中的缺失值
、
、
因为我想用更多的数据来训练我的模型,所以我不想删除丢失的行,而是使用KNN输入
算法
。同时,我也想防止数据泄露。
浏览 9
提问于2022-09-08
得票数 -1
1
回答
将有状态C计算与Modelica集成
、
、
我已经集成了一个用C语言实现的机器
学习
算法
和一个运行在OpenModelica中的Modelica模型。这让我怀疑,为了求解模型,OpenModelica需要在每次模拟迭代中调用它几次。这影响了
算法
的
学习
方式,因为它保持了关于其经验的状态。 为什么OpenM
浏览 2
提问于2015-03-31
得票数 2
1
回答
学习
速度和梯度下降差?
、
、
、
、
我明白(我想)
学习
率乘以梯度(斜率)就可以使梯度下降,但这是真的吗?我错过了什么吗?谢谢
浏览 5
提问于2019-10-07
得票数 0
回答已采纳
1
回答
在RL/TD
学习
中,这些术语指的是什么?
我一直在努力实现TD。我的实现所依据的文件/项目如下:对我来说一切都是有意义的,直到它谈到了后盾的程序。我在加州大学二年级没有学过很多高级数学,也从来没有上过一门关于ML/RL的正式课程。反向传播过程:计算V上网络输出与所需输出O之间的误差E。V=V+(Alpha)*误差(N)*e(S)对于隐藏节点i和输出节点之间的权重,错误(I)=E*激活(I)
浏览 0
提问于2020-04-10
得票数 -2
回答已采纳
1
回答
我的2048游戏双DQN
算法
从不
学习
、
、
、
、
我试着做双DQN
算法
来
学习
玩2048游戏.如果您想检查代码,我的实现在GitHub中是可用的。() 我试过的剧集最多有4000集。我如何计算出最佳的剧集数。
浏览 1
提问于2017-07-06
得票数 1
1
回答
集合
学习
是元
学习
的一个子集吗?
、
我正在
学习
集合
学习
方法,重点是随机森林和梯度提升。我读过关于这个主题的这文章和关于元
学习
的这文章。可以说,集合
学习
是元
学习
的一个子集?
浏览 0
提问于2022-03-29
得票数 1
回答已采纳
1
回答
我正在探索Amazon中的增量
学习
功能
、
、
、
、
我可以访问AWS
控制
台,并开始探索Sagemaker增量
学习
文档。目前只有三种内建
算法
支持增量训练:目标检测
算法
、图像分类
算法
和语义分割
算法
。我想知道我们是否能够成功地使用新的增量样本数据来训练其他(非内置
算法
)训练图像的初始模型。例如,分类或回归。
浏览 2
提问于2022-08-01
得票数 0
1
回答
连续在线群集识别的解决方案?
、
让我向您展示一个假设的在线集群应用程序的示例:此时n点1,2,3,4分配给蓝组A,点b,5,6,7分配给红色组B。在终点1,2,3,4,a,B属于A,点5,6,7至B。对我来说,这似乎是合理的。📷做这个决定的计算机将不得不使用规则。例如,当点被合并到一个集群中时,集群的标识由大多数人决定。
浏览 0
提问于2014-08-14
得票数 11
1
回答
当提到神经网络时,什么是“
控制
任务”还是“
控制
器设计”?
、
似乎有一些机器
学习
算法
最适合于“
控制
任务”和“
控制
器设计”。我知道定义/解释“
控制
”有很多不同的方式,所以我想知道它在机器
学习
中意味着什么?而且,如果它在描述某物为“
控制
任务”或“
控制
器”时意味着相同的事情。 如果你明白我的意思,非常感谢你!
浏览 3
提问于2011-12-26
得票数 2
回答已采纳
2
回答
基于强化
学习
的神经网络训练
、
、
、
、
我知道前馈神经网络的基本知识,以及如何使用反向传播
算法
来训练它们,但我正在寻找一种比我能用来训练神经网络的强化
学习
的
算法
。 例如,问题是我想用人工神经网络解决的问题。在这种情况下,我不知道应该做什么来
控制
钟摆,我只知道我离理想的位置有多近。我需要让安在奖惩的基础上
学习
。因此,监督
学习
不是一种选择。对于第一种情况,我可以想到一些
算法
,比如爬山或遗传
算法
,但我猜它们都会很慢。它们也可能适用于第二种情况,但速度慢得令人难以置信,不利于在线
学习</em
浏览 1
提问于2012-05-23
得票数 67
回答已采纳
1
回答
在线机器
学习
资源
、
、
我想知道是否有关于“在线机器
学习
”的书籍/文章/教程?或者这本书:我似乎在这方面找不到多少资料。
浏览 0
提问于2021-11-15
得票数 2
回答已采纳
1
回答
自动驾驶技术是从数据还是最先进的
算法
中获得更多呢?
、
、
、
、
当人们开始认为在不久的将来,自动驾驶汽车将取代一些道路上的车辆,这意味着机器人软件中的
学习
者可以达到一个很低的经验误差,从而保证乘客的安全。在我们看来,大量的驾驶数据和深入的强化
学习
算法
在很大程度上促进了自动驾驶实践的成功。 当涉及到我们自己实践的许多情况时,我们还无法建立一个如此高精度的预测模型,从而给我们自己的业务带来巨大的差异。我的问题是,当我看到机器
学习
技术能够在汽车驾驶上产生革命,因为它成功地实现了行为克隆任务,那么这一成功的首要原因是什么,大训练数据集,深强化
学习
技术,或者在自动驾驶问题中的任
浏览 0
提问于2018-01-04
得票数 1
1
回答
机器
学习
如何与大数据相结合?
、
、
机器
学习
如何与大数据集成?机器
学习
与MapReduce?What的区别是什么?(有监督
学习
、无监督
学习
、强化
学习
)是决策的主要内容之一,大数据在医疗保健和智能城市决策中的区别是什么?<code>H 111</code>以及大数据与深度
学习
作为机器
学习
技术之一的关系?<code>H 212</code><code>G 213</code>>
浏览 3
提问于2019-11-14
得票数 1
回答已采纳
2
回答
学习
算法
列表
、
、
、
是否有将
算法
或
算法
类与该
算法
适合的任务匹配的列表或目录?比如在的主页上文本分类->朴素贝叶斯 连续标签的预测-> LinearRegression
浏览 1
提问于2017-07-10
得票数 2
回答已采纳
5
回答
学习
高效
算法
、
因此,我总是选择
学习
更高层次的编程细节,例如类交互、API设计等。 我从来没有真正觉得
算法
特别有趣。因此,即使我能为我的程序想出一个好的设计,即使我能想出一个给定问题的解决方案,它也很少是最有效的。另外,你可以推荐哪些在线资源来教你针对不同问题的各种有效
算法
?
浏览 1
提问于2011-03-12
得票数 18
回答已采纳
2
回答
学习
回溯
算法
、
我想
学习
回溯
算法
。有人能教我一些吗?我试着从一些网站上
学习
,但不起作用。有没有人可以教我。谢谢!
浏览 1
提问于2011-04-11
得票数 7
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
DeepMind提出强化学习新算法,教智能体从零学控制
电子、通信与自动控制技术:基于机器学习的主动式匹配算法
使用Actor-Critic的DDPG强化学习算法控制双关节机械臂
如何学习算法?
机器学习算法
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券