腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
强化
网络
基础
设施?
我想知道,在
强化
你的网络时,最好的
强化
方法、程序和书籍是什么?特别是在以下方面:SQL服务器 Microsoft信息服务(IIS)
浏览 0
提问于2012-03-21
得票数 1
2
回答
Sitecore内容传递安全
强化
管理文件夹
、
、
我们正在使用蔚蓝的网络应用程序,用于sitecore的
基础
设施。然而,这在Azure网络应用中是不可能的,因为我们无法访问IIS。 解决这个问题的最好方法是什么?
浏览 3
提问于2015-11-22
得票数 0
回答已采纳
2
回答
强化
学习算法
、
我想用
强化
学习机器学习的方法来研究和开发一些应用。我已经熟悉使用监督学习的分类问题。 有人能给我推荐一些资料(链接,youtube教程,pdf笔记,.)吗?
浏览 0
提问于2021-11-15
得票数 0
回答已采纳
1
回答
什么是路径成本函数和终端成本在双深度Q-网络学习?
我只熟悉
强化
学习的
基础
知识,并遇到两个我不明白的术语:路径化成本函数和给定系统的终端成本。这些术语与Bellman方程中的类似吗?为上下文附加文件的片段。
浏览 7
提问于2022-07-26
得票数 1
2
回答
Azure安全性-操作系统构建的
强化
,安全标准?
他们是否对
基础
构建进行了任何更改?
强化
和安全标准?或者它们是新的标准版本? 任何关于这方面的信息都将不胜感激。
浏览 0
提问于2016-04-20
得票数 0
1
回答
如何使用一个颜色梯度为我的谷歌工作表图表?
、
我想使用一个颜色梯度(如橙色)在所有的值和颜色
强化
的
基础
上,更高的价值。 谢谢
浏览 3
提问于2022-06-29
得票数 0
9
回答
强化
学习的良好实现?
、
、
、
对于一个人工智能项目,我需要实现一个
强化
学习算法,这比一个简单的俄罗斯方块游戏。游戏是用
Java
编写的,我们有源代码。我知道
强化
学习理论的基本知识,但我想知道在SO社区中是否有人对这类事情有经验。 在俄罗斯方块游戏中实施
强化
学习,你推荐的阅读材料是什么?
浏览 3
提问于2009-04-11
得票数 25
回答已采纳
2
回答
关于隐马尔可夫模型和条件随机场的混淆
、
我对隐马尔可夫模型和条件随机场有点困惑。我想知道它们是监督学习方法还是无监督学习方法?谢谢
浏览 0
提问于2011-01-28
得票数 2
回答已采纳
1
回答
使用Docker的Python脚本沙箱
、
、
如果我使用像Python3AlMountain这样的
基础
镜像构建一个容器,并且我将遵循中指示的
强化
,那么注入和执行Python脚本是否安全?
浏览 1
提问于2018-10-22
得票数 1
1
回答
使用VW向奖励分布添加噪声
、
我想在我已有的奖励分布中添加噪声。奖励分布应该以什么形式表示,以便大众理解,以及大众可以使用哪些方法来诱导噪声?例如,您可以考虑给定的奖励分布
浏览 16
提问于2021-02-02
得票数 0
2
回答
四连排游戏
强化
学习的最佳算法
、
对于四连胜的游戏,
强化
学习的最佳算法是什么?我想构建一个四连排的游戏,它将使用RL算法之一来玩: Q-Learning,MinMax等。 考虑到我使用的是
Java
,什么是最好的。
浏览 1
提问于2012-01-08
得票数 0
回答已采纳
1
回答
模型和策略的区别是什么?
、
、
、
这两个定义似乎都表明,它们正在从状态映射到行为,那么,两者有什么区别,还是我错了?
浏览 7
提问于2019-07-27
得票数 2
回答已采纳
3
回答
在深度
强化
学习中,神经网络的设计是否有经验法则?
、
、
但是,如何设计和优化神经网络在深度
强化
学习中的应用呢?我们可以用奖励等来评估
强化
学习算法本身的性能,但是如何保证神经网络在
强化
学习算法中的应用是好的还是坏的呢?
浏览 0
提问于2019-02-08
得票数 3
2
回答
基于
强化
学习的神经网络训练
、
、
、
、
我知道前馈神经网络的基本知识,以及如何使用反向传播算法来训练它们,但我正在寻找一种比我能用来训练神经网络的
强化
学习的算法。另一种情况类似于,在这种情况下,反馈被延迟,只限于目标和反目标,而不是奖励。我的问题很简单:是否有一个简单的算法来训练带有
强化
学习的人工神经网络?我主要感兴趣的是实时奖励情况,但是如果有一种基于目标的情况下的算法,那就更好了。
浏览 1
提问于2012-05-23
得票数 67
回答已采纳
1
回答
逆
强化
学习的实际应用是什么?
、
逆
强化
学习是利用专家轨迹学习奖励函数。目前最成功的方法是最大熵逆
强化
学习。但在这一点上,你需要一个基于模型的
强化
学习。但世界上大多数实际问题都是无模型的,很难计算出状态转移概率。那么,我们如何在现实问题中使用这种逆
强化
学习呢?
浏览 0
提问于2018-04-02
得票数 3
回答已采纳
1
回答
将RNN的隐藏状态传递给另一个RNN
、
、
我正在使用
强化
学习教一个人工智能,一个奥地利纸牌游戏,与不完美的信息,称为施纳普森。对于不同的游戏状态,我有不同的神经网络(使用不同的特征)来计算值/策略。
浏览 0
提问于2021-10-11
得票数 1
3
回答
有什么有用的工具来检查Android源代码吗?
、
、
、
、
我想知道是否有人对基于
Java
的Android源代码审查有一些建议。例如,检查Android应用程序的安全性问题。作为F/OSS的奖金。
强化
似乎是一个不错的选择,但超出了我的价格范围。:)
浏览 0
提问于2011-05-27
得票数 9
3
回答
使用Fortify的PermGen外部内存错误
、
、
、
我正在运行
强化
静态代码扫描。main\Src>sourceanalyzer -64 -Xmx6500m -b project -scan -f project.fpr
java
-version
Java
(TM) SE Runtime Environment (build 1.8.0_05-b13)
Java
HotSpot(TM) 64-Bit Server VM (build25.5-b02, mixed mod
浏览 4
提问于2014-10-16
得票数 0
回答已采纳
2
回答
主动学习和
强化
学习有什么区别?
、
、
、
强化
学习( Reinforcement,RL)是机器学习的一个领域,它关注的是软件agents应该如何在环境中采取行动,以最大化累积报酬的概念。 如何区分他们?确切的区别是什么?
浏览 0
提问于2020-11-13
得票数 14
回答已采纳
5
回答
Java
中的增强技巧
在过去的这个学期,我介绍了
java
中的面向对象编程,下个学期我将学习计算机科学2和
java
,它主要学习在
java
中实现的各种算法和数据结构,如链表、二叉树等。有哪些方法可以
强化
我在面向对象编程入门课上学到的知识,同时还能为下个学期的算法和数据结构做准备。
浏览 7
提问于2010-12-15
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
JAVA 基础:Java概述
Java基础->编程基础
java基础
强化学习之基础入门
Java基础一(Java相关介绍)
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券