2019-03-19 | Reinforcement Learning | UNLOCK

国内增强学习在无人车上的应用论文阅读笔记(1)

电子科大(陈银银2018)——面向无人驾驶的增强学习算法研究

一:借鉴之处

  1. 采用仿真平台为TORCS,是一种跨平台的模拟驾驶仿真平台,可以在上面进行增强学习问题的研究。
  2. 对于增强学习值函数的推导及马尔可夫决策过程可以参考。

国防科大李斯定(2015硕士)——基于增强学习的移动机器人动态路径规划算法研究

利用增强学习+其它方法解决多机器人系统完全覆盖路径规划问题。

  1. Q学习算法与神经网络结合,三次样条曲线
  2. RRT和Q学习算法结合
    • 注意里面状态、动作集、回报函数的构建原则
    • QRRT算法规划出来的效果很不错

评论加载中