当前位置:首页>>复杂环境智能建模与仿真刘杉
刘杉
2025/8/25 15:21:00    
报告题目:
逆向强化学习驱动的即时配送仿真与优化
报告摘要:
即时配送作为数字经济时代的城市物流的关键环节,已经深度融入城市居民生活场景。外卖、网约车等即时配送任务的效率与服务直接影响用户体验与运营成本。逆向强化学习(Inverse reinforcement learning)通过观测到的用户行为反推其隐含奖励函数,解决传统强化学习依赖人工设定奖励的局限。在即时配送的路径规划中,逆向强化学习可挖掘和学习用户的隐性行为偏好,并基于动态交通环境和任务背景生成个性化路线。结合即时配送特点,报告人设计了动态逆向强化学习、集成逆向强化学习、对抗逆向强化学习、迁移逆向强化学习等系列模型,结合图神经网络,服务于即时配送的路径推荐、轨迹预测、到达时间预测、异常检测、末端配送等任务,并建立交通仿真环境验证模型效果。
个人简介:
刘杉,东南大学讲师,硕士生导师。1996年出生,2018年本科毕业于北京航空航天大学,2022年博士毕业于清华大学。研究领域包括交通建模与优化、逆向强化学习等,对即时配送、道路交通、轨道交通等多种模式的时空预测、车辆调度、路径规划等任务有持续研究。科研方面,入选中国科协青年人才托举工程、江苏省双创博士、东南大学至善青年学者,主持国家自然科学青年基金、江苏省自然科学青年基金,一作/通讯发表SCI论文十余篇,多项研究成果发表在Transportation Research Part C, Transportation Research Part E等国际知名期刊上。教学方面,获评全国高校自动化类专业青年教师讲课(说课)大赛二等奖、江苏省高校教师教学创新大赛二等奖、东南大学吾爱吾师-院系最受欢迎老师、东南大学优秀本科生导师。