当前位置:首页>>智能仿真优化与调度分会场王付宇
王付宇
2025/8/29 7:19:00    
报告题目:
基于图注意力网络的多目标深度强化学习钢铁热轧生产调度优化方法
报告摘要:
本研究聚焦钢铁热轧生产调度优化问题中面临的求解瓶颈,提出一种基于图注意力网络的多目标深度强化学习方法并用于该问题的高效求解。首先将板坯序列被映射为无向加权图,借助残差边注意力机制精准刻画相邻板坯的相容性与差异性。同时,为了实现多目标优化,采用基于权重向量条件化的多目标强化学习策略,通过训练多个智能体获得覆盖度与均匀性更优的近似Pareto前沿。最后,为满足刚性工艺约束,设计约束屏蔽机制以实现“采样即合规”,有效提升了推理与训练效率。实验结果表明,该方法在不同规模实例上较传统启发式算法具有更高的可行率与更优的前沿质量,同时显著降低计算开销,为钢铁热轧智能调度提供了一种高效、鲁棒且可解释的新范式。
个人简介:
教授、博士生导师、宝钢优秀教师奖获得者,现任安徽工业大学管理科学与工程学院副院长(主持工作)、民建安徽省省委委员、市政协常委。入选安徽省高层次人才计划领军人才、校青年拔尖人才,兼任中国仿真学会智能仿真优化与调度专委会常务委员、中国系统工程学会物流系统工程专委会委员、安徽省管理学学会常务理事。先后主持国家自科基金面上项目、教育部社科规划项目等课题30余项;在《管理科学学报》《中国管理科学》《管理工程学报》、Swarm and Evolutionary Computation、Computers & Industrial Engineering等发表论文70余篇;获安徽省教学成果一等奖(R1)、安徽省社会科学二等奖等省级以上奖励10余项;智库成果被中国科协、安徽省政协等部门采纳,并获省主要领导肯定性批示。