1. Apollo如何实现强化学习的轨迹规划?

Apollo中实现了通过强化学习进行车辆轨迹规划,如何运行?以及如何对现有强化学习算法进行改进?

1.1. 回答