全球计算机视觉顶会CVPR 2020论文出炉 申恒涛教授团队表现抢眼

文:未来媒体研究中心 图:未来媒体研究中心 / 来源:未来媒体研究中心 / 2020-03-03 / 点击量:6251

  2月24日,2020 IEEE国际计算机视觉与模式识别会议(IEEE Conference on Computer Vision and Pattern Recognition,简称CVPR)官方公布论文收录结果。本届大会总共录取来自全球的论文1470篇,申恒涛教授带领的电子科技大学未来媒体研究中心共有7篇文章被接收。

  作为计算机视觉领域世界三大顶级会议之一,CVPR的论文投稿量近三年持续上涨。据CVPR官网显示,今年大会论文有效投稿数量6656篇,最终录取1470篇,录取率仅为22%,相比去年降低3个百分点。这些被录取的最新科研成果涵盖了计算机视觉领域各项前沿工作。电子科技大学未来媒体研究中心被录取的7篇论文研究方向以多媒体检索与理解为主,包括视频检索、跨媒体检索、对抗攻击、Person Re-ID、Visual Grounding等最新科研成果,对计算机视觉算法领域的前沿研究起到助推作用。

c386f8adc17968b13a9890c5433cda32_fa50c.j

7ddb89f2f0c447913a5a2eaa9c95f9c1_fa50c.j

  图1 论文《Searching for Actions on the Hyperbole》层级结构的双曲几何模型和双曲动作网络模型。

  其中,团队博士研究生龙腾为第一作者的论文《Searching for Actions on the Hyperbole》(作者:龙腾、Pascal Mettes、申恒涛(通讯作者)、Cees Snoek)深入探索了含层级结构的视频检索方法。

图2.jpg

  图2 论文《Universal Weighting Metric Learning for Cross-Modal Matching》通用权重度量学习框架信息对挖掘以及加权示意图。

  博士研究生位纪伟为第一作者的论文《Universal Weighting Metric Learning for Cross-Modal Matching》(作者:位纪伟、徐行(通讯作者)杨阳、姬艳丽、汪政、申恒涛)为跨模态匹配任务设计了一种可解释的通用权重框架,并创新性提出了一种优于当前广泛使用的三元组损失函数的损失函数。

图3.jpg

  图3 论文《What Machines See Is Not What They Get: Fooling Scene Text Recognition Models with Adversarial Text Images》针对主流STR模型提出的攻击方法在Targeted和Untargeted两种攻击模式下的效果示例。

  徐行副教授为第一作者的论文《What Machines See Is Not What They Get: Fooling Scene Text Recognition Models with Adversarial Text Images》(作者:徐行、陈杰夫、肖金辉、高联丽、沈复民、申恒涛(通讯作者))创新性地提出了一种高效的基于优化的对抗样本生成方法。

  此外,高联丽研究员与浙江大学合作的Visual Grounding研究《Where Does It Exist: Spatio-Temporal Video Grounding for Multi-Form Sentences》,提出了基于多形态的句子从视频中进行物体定位的算法,并发布了供研究者使用的数据集,对本领域的研究有促进作用。沈复民研究员与阿联酋起源人工智能研究院合作发表了《Auto-Encoding Twin-Bottleneck Hashing》,提出了基于自编码的哈希检索方法。宋井宽教授与南方科技大学合作发表了《Salience-Guided Cascaded Suppression Network for Person Re-identification》提出了基于级联压制网络的行人重识别算法,以及与北京航空航天大学合作发表了基于前后向信息保留的二值神经网络的研究成果《Forward and Backward Information Retention for Accurate Binary Neural Networks》。


  相关链接:

  电子科技大学未来媒体研究中心申恒涛团队成立于2014年。团队致力于计算机科学与技术、人工智能等学科在多媒体智能信息处理方面的学科建设、人才培养、科学研究与技术应用。团队现有国家级人才4人,OSA Fellow1人,ACM杰出会员1人,省级人才6人,教授/研究员8人,特聘副教授3人,研究生一百余人。团队十余名教师均为来自澳大利亚昆士兰大学、新加坡国立大学、日本东京工业大学等海外著名大学的博士。团队主要从事多媒体、计算机视觉、人工智能、信息检索与数据库等领域的国际一流研究。近三年已经在ACM MM、CVPR、ICCV、AAAI、IJCAI、SIGIRVLDBICDEIEEE TPAMI、 IEEE TIP、IEEE TMM、IEEE TCSVT、IEEE TKDE、ACM TOISVLDB Journal等CCF A类/中科院JCR二区以上的顶级会议和期刊上发表论文200余篇。相关论文在多媒体、计算机视觉、人工智能和大数据等研究方向产生了较大的国际影响力,并获得了10多项国际会议最佳论文奖项(含提名奖),包括CCF A类国际顶级会议ACM MM和SIGIR等。目前,中心承担1项国家科技部科技创新2030—“新一代人工智能”重大项目2项、国家自然基金重点项目1项、国家自然基金重点国际合作项目,以及10多项国家自然科学基金面上和青年项目。

 


编辑:林坤  / 审核:林坤  / 发布者:陈伟