- 博客(4)
- 收藏
- 关注
原创 通俗讲解深度强化学习经典算法——DQN
DQN的核心思想就是训练一个Q网络,这个Q网络输入当前环境的状态,输出为agent所有动作的Q值,agent选择具有最大Q值的动作作为当前时刻的行动,以此循环往复直至回合结束。上述就是DQN的整体思想。此外,为了更好地训练Q网络以及保证算法的稳定性,论文提出了经验回放缓冲池、目标网络的思想,后续会详细讲解。
2024-08-17 21:29:43
2882
原创 深度强化学习经典算法(DQN、DDPG、PPO、SAC等)完整代码实现
DRL算法DQN、DDPG、PPO、SAC完整实现,包含github仓库,代码简洁易懂可直接运行,具备可视化测试界面。
2024-07-12 16:01:46
533
6
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人