当前位置:首页>>大模型驱动的多模态交互与认知仿真及行业应用孟维亮
孟维亮
2025/10/13 21:18:00    
报告题目:
面向仿真的多模态数据感知与生成技术
报告摘要:
本报告旨在探讨支撑高逼真、高可靠性仿真系统的核心关键技术。在环境感知层面,研究针对广视角与剧烈光照变化的地理图像实时精准融合方案,以保障仿真环境的空间一致性;同时,提出在传感器存在误差的协同感知条件下,实现可靠特征融合方法,提升仿真智能体对复杂环境的鲁棒理解能力。在内容生成层面,探索基于文本生成全景视频的先进范式,为构建沉浸式虚拟场景提供高效途径;研究利用生成式模型创作特定风格景观图像的技术,以加速虚拟世界的环境设计与创作。此外,作为连接感知与生成的关键基石,引入一个大规模、多视角交通场景数据集,其为算法的训练、测试与验证提供了至关重要的数据支撑。相关技术可为仿真平台的开发奠定坚实基础。
个人简介:
孟维亮,中国科学院自动化研究所多模态人工智能系统全国重点实验室副研究员,CCF杰出会员,主要研究领域为计算机图形图像、计算机视觉、点云处理、深度学习、人工智能、无人驾驶环境感知等。主持及参与多项国家重点研发计划、国家863项目、国家自然科学基金重点基金、面上基金、青年基金以及博士后基金等,获中国图学学会科技进步奖二等奖,教育部高等学校科学研究优秀成果奖科学技术二等奖,已经在国际国内期刊及会议上发表了一百余篇论文(AAAI会议、Siggraph Asia会议、ICCV会议、MICCAI会议、ACM MM会议、 IEEE VR 会议、IEEE TPAMI期刊,IEEE TIP期刊、IEEE TGRS期刊、IEEE TOM期刊,ISPRS-J期刊,?CGF期刊等),授权国际专利一项,国内专利二十余项。