我发现互联网上几乎关于Jack's Car Rental问题的学习资料极少,这里做一个总结,以供查阅。 本篇请结合课本Reinforcement Learning: An Introduction学习。Jack's Car Rental是一个经典的应用马尔可夫决策过程的问题,翻译过来,我们就直接叫它“租车问题”吧。租车问题的描述如下: Jack’s Car Rental Jack m ...
这是我学习Reinforcement Learning的一篇记录总结,参考了这本介绍RL比较经典的 Reinforcement Learning: An Introduction (Drfit) 。这本书的正文部分对理论的分析与解释做的非常详细,并且也给出了对结论详尽的解析,但是把问题的解决和实现都留到到了课后题,所以本篇文章主要侧重与对Multi-Armed Band ...