2019-03-19 | Reinforcement Learning | UNLOCK

国内增强学习在无人车上的应用论文阅读笔记（1）

电子科大（陈银银2018）——面向无人驾驶的增强学习算法研究

一：借鉴之处

采用仿真平台为TORCS，是一种跨平台的模拟驾驶仿真平台，可以在上面进行增强学习问题的研究。
对于增强学习值函数的推导及马尔可夫决策过程可以参考。

国防科大李斯定（2015硕士）——基于增强学习的移动机器人动态路径规划算法研究

利用增强学习+其它方法解决多机器人系统完全覆盖路径规划问题。

Q学习算法与神经网络结合，三次样条曲线
RRT和Q学习算法结合
- 注意里面状态、动作集、回报函数的构建原则
- QRRT算法规划出来的效果很不错

domestic

评论加载中