新闻网首页 人大主页 数字人大 校长信箱 广角 部处 院系 校园 校务 交流 学者 学生 学术
返回首页
您的位置:人大新闻网>校园时讯
信息学院多媒体计算实验室团队论文被CVPR接收
2021-04-25 14:54:41
3,039 次浏览
来源:信息学院
编辑:王 思琪

信息学院多媒体计算实验室团队论文 Towards Diverse Paragraph Captioning for Untrimmed Videos 被计算机视觉和模式识别领域顶会CVPR接收。CVPR(Computer Vision and Pattern Recognition,计算机视觉与模式识别)会议是计算机视觉与模式识别、人工智能领域的国际顶级会议,影响因子在泛AI领域排名第一,该会议每年的论文录取率仅有不到25%。

论文摘要:本文主要研究了为长视频生成多样的段落性内容描述。以往的研究工作均采用先“事件检测”后“事件描述”的两阶段方法来解决这一问题。然而,事件检测的准确性不足严重影响了最终描述生成的质量。因此,本文首次提出了一个一阶段模型框架,并分别对长视频段落描述生成中解码效率低、事件描述冗余、语言表达缺乏多样性的问题进行了改进。该模型在两个公开数据集上无论是描述准确度,还是生成多样性方面均达到了最优结果。

作者简介:宋宇晴是中国人民大学信息学院2019级硕士生,所属于多媒体计算实验室(AIM3),导师为信息学院教授金琴。她的主要研究方向是 Vision and Language,包括图像/视频的内容摘要生成,多模态机器翻译等。她已发表了多篇CCF A类会议论文,并取得了多项国际视频描述生成大赛的冠军。

金琴,中国人民大学教授,多媒体计算实验室(AIM3)负责人。主要研究领域为多媒体智能计算、人机交互。主持多项国家自然科学基金,北京市自然科学基金,国家重点研发计划等项目和课题,在多媒体情感计算,视觉描述生成,跨模态交互等研究与应用中取得突出成果。蝉联2018-2020 CVPR ActivityNet Dense Video Captioning、2017-2019 ACM Multimedia Audio-Visual Emotion Challenge (AVEC)、2017-2020 TRECVID VTT、2019年之江杯全球人工智能大赛等多项国际权威竞赛冠军。

(责任编辑:杜嘉懿)