此系列文章介绍强化学习相关内容
1. 强化学习历史
2. 强化学习之多臂赌博机
对(行为)进行学习
3. 强化学习之马尔科夫决策过程
对(行为,状态)组进行学习
4. 强化学习之策略学习
马尔科夫决策需要知道全部状态,对实际情况引入四种学习方法
(部分内容来自于国科大高级人工智能沈华伟老师授课内容)
此系列文章介绍强化学习相关内容
对(行为)进行学习
对(行为,状态)组进行学习
马尔科夫决策需要知道全部状态,对实际情况引入四种学习方法
(部分内容来自于国科大高级人工智能沈华伟老师授课内容)