近日,信息管理学院姜文晖博士以第一作者在计算机视觉领域国际权威期刊《IEEE Transactions on Image Processing》发表论文《Visual Cluster Grounding for Image Captioning》。论文针对图像描述任务中注意力机制不聚焦、多模态特征之间细粒度关联建模困难等问题,提出了一种图像区域与文本单词之间的动态关联模型,提升多模态特征的表达粒度和区分能力,最终提高自动图像描述任务的准确性。此外,论文还提出了一套评价注意力机制准确性的新方法。该研究成果可以应用于网络多媒体内容分析、工业多模态信息处理、大数据情报分析等领域。
IEEE Transactions on Image Processing是计算机视觉领域中最具影响力的国际期刊,被中国计算机学会推荐为国际A类期刊(最高等级期刊),也是我校认定的国际A类权威期刊,由IEEE(国际电气和电子工程师协会)出版,SCI检索,影响因子为11.041。(文/信息管理学院 审核/一审 姜莹 二审 赵旻 终审 李大晖)