
强化学习
文章平均质量分 90
anthea_luo
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
深度强化学习PG解决装箱问题
强化学习 RL PG 装箱问题 python原创 2022-05-22 20:10:25 · 2181 阅读 · 11 评论 -
强化学习演进史
本文主要是pinard老师的系列笔记 详细请参考系列文章:https://www.cnblogs.com/pinard/p/9385570.html一年多前看这一系列的文章时 对这种一步一步改进的过程感受挺深。 所以这篇笔记中,一起去看看得到的东西缺点在哪里, 以及针对这种缺点的改进版是怎样。仅供复习吧,有错误欢迎指正 谢谢。机器学习可分三类: 监督学习/无监督学习/强化学习, 强化学习训练数据没有标签,评价标准是奖励值大小, 且奖励值不是事先准备好喂入网络, 而是延后处理的。强化学习 可以与环.原创 2020-11-13 21:22:40 · 1410 阅读 · 0 评论