11月12日,电子信息工程学院“明理讲坛”第三期在行政楼一楼报告厅顺利举行。院领导许海峰教授主持本期讲坛,全体教师及2025级本科生共同参会,学院特邀中国科学技术大学常晓军教授作《多模态大模型:从跨模态理解到生成与推理》专题报告。

常晓军教授以通俗易懂的语言拆解复杂技术,聚焦视觉与语言大模型的核心进展展开分享。他指出,随着模型能力持续迭代,多模态大模型在长视频理解、视觉叙事建模等场景中已展现突破性潜力,尤其在处理长时序数据时,能够精准捕捉跨场景语义关联,为事件推理与情节理解提供坚实技术支撑。同时,开放词汇与少样本学习是提升模型泛化能力的关键,未来多模态大模型将在统一表征、跨模态推理等方向持续突破,为智能系统发展奠定重要基础。
互动环节中,学子们围绕报告内容踊跃提问,常晓军教授逐一耐心回应。结合自身科研经历,他为新生提供具体学习建议,鼓励大家保持好奇心,将基础课程学习与前沿技术探索紧密结合。
许海峰教授在总结中表示,“明理讲坛”的举办旨在帮助新生建立专业认知、激发学习热情。常教授的报告深入浅出,系统梳理了多模态大模型的发展脉络与核心逻辑,清晰指明了未来发展方向。后续学院将持续邀请行业专家、学者开展交流活动,为学子搭建起链接课堂与前沿的坚实桥梁。
供稿:李梓霂/一审:左铖/二审:李梓霂/终审:许海峰
