张大鹏, 刘东等: 基于深度强化学习的单线路公交动态驻站控制策略研究
文章概要:
1. 本文提出一种基于深度强化学习的动态驻站控制,以实现公交系统稳定运行和避免串车问题。
2. 构造线形公交系统,确定车辆运行和乘客行为规则,介绍基于深度强化建立动态控制方法定义强化学习的各要素,并开发事件驱动的模拟器环境,训练体br> 利用仿真模拟对所提方法与基准方法进行大量数值实验,选取不同评价指标进行对比分析,并实施敏感性分析br>4. 实验结果表明,本文方法实现了最稳定的车辆轨迹的载客分散度;在车头时距上,比无控制策略、基于时刻表控制策略和基于车头时距控制策略分别降低1.90%、60.98%和37.98%;在平均等待时间上,分别降低28.36%、26.53%和2361%。
5. 所提方法不同行驶时间变异性和车头时距情景下,具有很强的鲁棒性。
阅读原文
2. 构造线形公交系统,确定车辆运行和乘客行为规则,介绍基于深度强化建立动态控制方法定义强化学习的各要素,并开发事件驱动的模拟器环境,训练体br> 利用仿真模拟对所提方法与基准方法进行大量数值实验,选取不同评价指标进行对比分析,并实施敏感性分析br>4. 实验结果表明,本文方法实现了最稳定的车辆轨迹的载客分散度;在车头时距上,比无控制策略、基于时刻表控制策略和基于车头时距控制策略分别降低1.90%、60.98%和37.98%;在平均等待时间上,分别降低28.36%、26.53%和2361%。
5. 所提方法不同行驶时间变异性和车头时距情景下,具有很强的鲁棒性。