我在试着理解Q-Learning,
我目前的算法如下:
1.查找表是维护的,它将状态映射到每个可用操作的即时奖励和实用信息。
2.在每个状态下,检查它是否包含在查找表中,如果没有,则初始化它(默认实用程序为0)。
3.选择可能采取的行动:
(*ϵ* = 0>ϵ>1 - probability of taking a random action)
1-ϵ = Choosing the state-action pair with the highest utility.
ϵ = Choosing a random move.
ϵ decreases
我不知道如何选择两支球队之间的比赛,即使是在主场还是客场。
示例:
我有一张桌子:
MatchID | status | date | short (home) | opponent (Away)
1 ENDED XXX TEAM A TEAM B
2 ENDED XXX TEAM B TEAM A
3 ENDED XXX TEAM C TEAM B
4 ENDED XX
希望这个问题是有意义的,但本质上这是我遇到的问题。我的任务是创建一个程序,将某人的罚球命中率作为输入,然后模拟5场比赛,他们试图在每场比赛中投10次罚球。以及之后的总结,如最佳比赛,最差比赛,所有比赛的总得分,以及平均罚球命中率。
到目前为止,我试图让我的模拟游戏多次运行,但似乎找不到答案。这就是我目前所拥有的: import java.util.*;
public class FreeThrow {
public static int simulate(int input){
int i;
int j;
int count = 0;
我一直在用Java做一个小游戏,我使用Java Random类来生成随机数。 在游戏过程中,两个球队互相比赛,为了确定谁赢得了比赛,我生成了两个随机数字(从1到10,就像d10一样),然后对这些分数进行一些修改,比较它们以找出谁赢了。 但我想知道有没有更有效的方法。我真的不知道Java Random类是如何工作的,但我的想法是生成一个随机数(从1到100),然后整数除以10得到其中一个数字,然后进行mod 10得到另一个数字。 在代码中,我的问题是哪一个更快: Random r = new Random();
int team1Score;
int team2Score;
int randN
我有一个表,希望按情况在表中添加新列 例如 我有一个原始表,像这样 Name
Mike
Tom
Rose == 我想要一张新桌子,就像 Name Selected_1 Selected_2
Mike 1 1
Tom 0 1
Rose 0 0 当在第一场比赛中,迈克被选中时,我们应该在迈克中加1,在另外两场比赛中加0。在第二局中,Mike和Tom被选中,在这个时候,我们应该在Mike和Tom中加1,在Rose中加0。有没有什么办法来解决这个问题呢?