报告题目:
以人为中心的3D交互理解与重建研究
报告摘要:
以人为中心的3D交互理解与重建是构建交互式世界模型、推动虚拟世界与现实世界深度融合的关键环节。本报告从交互语义理解、交互区域定位与交互状态重建三个方面,分析并阐释了该领域所面临的关键问题。在此基础上,进一步探讨了人-物交互意图与环境物理属性间的视觉关联学习方法,介绍了一套视觉驱动的三维人-物交互状态解析与重建框架,该框架有望为动态世界模型构建提供交互先验与动态约束机制。最后,报告结合AIGC内容生成、具身智能决策以及虚拟现实交互系统等实际应用,对所述方法进行评述。
个人简介:
查正军,中国科学技术大学信息科学技术学院教授、博导,主要从事图像视频处理与分析、多模态理解与生成、神经形态视觉计算等领域的研究。先后主持国家杰出青年科学基金、国家优秀青年科学基金、国家自然科学基金重点项目、科技部创新2030-新一代人工智能重大项目、国家创新人才引进计划青年项目等。获中国科学院青年科学家奖、中国科学院优秀导师、霍英东教育基金会青年科学奖等。指导的研究生学位论文入选中国科学院优秀博士论文、中国人工智能学会博士论文激励计划、中国电子学会硕士论文激励计划等。担任国际会议ICME指导委员会委员,IEEE Trans. PAMI、IEEE Trans.MM、IEEE Trans. CSVT等权威国际期刊编委。