电子科大(陈银银2018)——面向无人驾驶的增强学习算法研究
一:借鉴之处
- 采用仿真平台为TORCS,是一种跨平台的模拟驾驶仿真平台,可以在上面进行增强学习问题的研究。
- 对于增强学习值函数的推导及马尔可夫决策过程可以参考。
国防科大李斯定(2015硕士)——基于增强学习的移动机器人动态路径规划算法研究
利用增强学习+其它方法解决多机器人系统完全覆盖路径规划问题。
- Q学习算法与神经网络结合,三次样条曲线
- RRT和Q学习算法结合
- 注意里面状态、动作集、回报函数的构建原则
- QRRT算法规划出来的效果很不错
评论加载中