当前位置:首页>>世界模型驱动的虚实共生系统:理论、方法与实现王楠楠
王楠楠
2025/10/13 20:31:00    
报告题目:
面向边端高效推理的模型轻量化
报告摘要:
针对大模型高计算复杂度引起的高能耗和高碳排放问题,本报告从架构设计、推理步数和参数量化三个方面,探索神经网络规模压缩和稳定训练方法,实现绿色低碳的大模型轻量化技术。具体包括:(1) 优化网络架构,以降低模型参数规模或降低参数激活量;(2) 生成模型推理阶段的单步算法设计,以降低模型推理时延;(3) 模型的低比特量化,以实现模型的进一步缩小以及稳定训练。本报告的三项研究内容相辅相成,有望构建面向边端需求的大模型轻量化完备解决方案,实现资源消耗与模型性能之间的极佳平衡。
个人简介:
王楠楠,教授,博士生导师,西安电子科技大学空天地一体化综合业务网全国重点实验室副主任。近年来从事图像跨域重建与可信鉴别方面的研究,具体包括图像跨域重建,目标身份分析,以及模型可信学习等。在IEEE TPAMI、IJCV等国际学术期刊和CVPR、ICCV、ECCV、ICML、NeurIPS等国际学术会议上发表论文200余篇,授权国家发明专利30余项,其中7项实现专利技术转让,软件著作权3项,相关成果获教育部自然科学一等奖、陕西省科学技术一等奖、中国图象图形学学会自然科学奖一等奖、中国人工智能学会优秀博士学位论文、陕西省优秀博士学位论文奖等荣誉。主持国家自然科学基金优秀青年基金、联合基金重点、面上、青年项目,科技创新2030-“新一代人工智能”重大项目子课题等。