首页
学习
活动
专区
圈层
工具
发布

#cql

【RL Latest Tech】离线强化学习:保守Q学习 (CQL) 算法

不去幼儿园

Conservative Q-Learning (CQL) 是由Sergey Levine及其团队于2020年提出的一种针对离线强化学习的算法。CQL旨在解...

1.4K10
领券