在审

基于深度强化学习的无信号交叉口自动驾驶车辆安全决策方法

徐东伟、顾同成、孙成巨、杨硕
浙江工业大学
徐东伟机构 暂无
技术领域 暂无
顾同成机构 暂无
技术领域 暂无
孙成巨机构 暂无
技术领域 暂无
杨硕机构 暂无
技术领域 暂无

摘要

一种基于深度强化学习的无信号交叉口自动驾驶车辆安全决策方法,首先通过车辆与环境交互获取自车及邻近其他车辆的时序状态,输入时空社交注意力网络,时间社交注意力采用一维卷积与自注意力机制捕捉车辆的时序依赖关系,空间社交注意力采用全连接网络与自注意力机制建模车辆之间的空间交互关系,两者经特征对齐与维度融合后,生成时空注意力特征,经TD3算法输出驾驶策略;引入自适应策略修正机制,以实时碰撞时间为约束动态调整风险裕度,结合约束预测模型修正危险策略;同时,通过交叉口各HVs与潜在碰撞区域之间的位置关系评估风险,通过风险与奖励的动态关联引导TD3学习更安全的行为模式,本发明实现无信号交叉口自动驾驶车辆的安全稳定控制。

暂无引用专利