5月26日,学院外籍副教授阿里(Ali)在L202教室作题为“Image Captioning Using a Transformer with Topic-Word Semantic Modeling and Multimodal Feature Fusion”的学术报告,相关方向研究生到场聆听。

阿里首先介绍了图像描述生成(Image Captioning)的基本任务,系统回顾了从“CNN+RNN”到LSTM、再到Transformer的主流模型演进过程。针对现有Transformer模型在语义信息提取方面的局限,他重点阐述了其团队提出的创新方法,包括主题-词语义建模、多模态特征融合机制及相关实验分析。报告结束后,与会研究生就模型设计、应用前景及跨学科融合等问题与阿里进行了深入交流。
本次报告深入浅出、层次清晰、案例详实,为研究生在计算机视觉与自然语言处理交叉领域的研究提供了新思路与方法指导,有效拓宽了学生的学术视野,为其今后开展相关科研工作及参与国际学术交流等奠定了良好基础。
(撰稿、摄影:陈义仁 审核:刘德阳)