一直想用深度强化学习DQN解决三维城市道路的决策与控制问题,比如自动驾驶汽车在行驶的时候,考虑距离和成本来约束(奖励函数),引导汽车选择合理的模式(动作空间有2个:地面行驶和起飞),第一个难题就是三维仿真环境如何搭建?第二个是奖励函数怎么写?网上很少有教程关于奖励函数的设计的?摸索快一年了,一直没有结果,挑战性真的把兴趣都快抹杀了,这个课题还能,有希望继续搞吗?请大佬指点
发布于 2022-06-15 09:35:11
您好,SDK/H5(非微信内使用)采用线下对接的模式,填写申请后,会有专人与您联系。
如申请或使用遇到问题,可以添加小助手微信(faceid001)进行人工咨询。
更多详情请您点击这里查看。
相似问题