题名: | 内河无人船的驾驶行为决策模型 |
正文语种: | 中文 |
作者: | 杨娇;张庆年;杨杰;阮军;吴绩伟;凌强 |
作者单位: | 武汉理工大学交通与物流工程学院;武汉理工大学信息工程学院;上海国际港务(集团)股份有限公司 |
关键词: | 交通运输工程;航运安全;深度强化学习;TD3;内河无人驾驶船舶;驾驶行为决策 |
摘要: | 基于船舶领域的《内河避碰规则》,以交互学习、积累决策经验为手段,建立基于TD3(twin-delayeddeepdeterministicpolicygradient)算法的驾驶行为决策模型。模型设置安全性、经济性及协调性三类奖励函数,并通过奖励值的不断迭代,使模型快速收敛。并基于此模型,对内河中常见的对驶、交叉相遇及追越三种会遇场景进行仿真试验。结果表明:与DDPG相比,TD3算法不仅缩短了模型训练时间,还提升了决策效果。对比分析不同船长、航速下的驾驶行为决策结果,发现此模型不仅可以安全快速地进行自主驾驶决策,而且可对避碰路径进行优化,得到无人船较佳的自主驾驶决策方案。 |
期刊名称: | 武汉理工大学学报(交通科学与工程版) |
出版年: | 2022 |
期: | 03 |
页码: | 552-558 |