MaskFlownet:基于可学习遮挡掩模的非对称特征匹配丨CVPR 2020
来源 | 微软研究院AI头条(ID: MSRAsia)
编者按:在光流预测任务中,形变带来的歧义与无效信息会干扰特征匹配的结果。在这篇 CVPR 2020 Oral 论文中,微软亚洲研究院提出了一种可学习遮挡掩模的非对称特征匹配模块 ,它可以被轻松结合到端到端的基础网络中,无需任何额外数据和计算开销就可以学习到遮挡区域,从而显著改进光流预测的结果。
光流预测任务(opticalflow estimation)即给定一张原始图像与一张目标图像,希望建立一个表示从原始图像的每个像素到目标图像的对应关系的流场(flow field)。在理想情况下,目标图像通过流场形变得到的形变图像应该与原始图像非常相似。但是,前景与背景之间的相对位移产生的遮挡区域(occlusions)给形变图像带来了歧义与无效信息(如图1),使得光流预测任务变得更加困难。
图1:可学习遮挡掩模作用于形变图像
近年来,基于卷积神经网络的深度学习正在被广泛地应用于光流预测领域,而特征形变(feature warping)则是其中最关键的一步。原始图像与目标图像首先通过同一个特征提取器得到不同层级的特征图,为了找到原始特征图与目标特征图之间的对应关系,特征形变将目标特征图通过当前预测的流场形变到与原始特征图相似的位置,再通过互相关层得到局部区域内两两像素之间的相关程度。然而,形变后的特征图同样在遮挡区域留下了歧义与无效信息,会干扰特征匹配的结果,这也是光流问题中尚未解决的主要问题之一。
本文提出一种可学习遮挡掩模(learnable occlusion mask)的非对称特征匹配模块,不需要任何显式的监督信息就可以预测遮挡区域、过滤特征形变带来的无效信息。如图1,目标图像通过流场形变之后,可学习遮挡掩模预测的遮挡(黑色)区域准确地过滤了重影部分的干扰信息,得到了干净的掩模图像(masked image)。在这个简单的例子中就可以看到,原始图像与目标图像并非完全对等——后者在形变之后产生了重影,需要利用掩模信息进行过滤。
可学习遮挡掩模的非对称特征匹配模块可以轻松结合到任何已有的基础网络上,通过端到端的方式自动学习到遮挡掩模,仅仅引入可忽略不计的额外计算量就可以显著提升网络的表现。
除此之外,我们还发现学习到的掩模可以和形变图像一起送入之后的级联网络中,进一步提升网络的整体表现。我们在 MPI Sintel、KITTI 2012 和 KITTI 2015 的光流数据集上都做了算法评测,截至投稿时间,均达到所有不使用额外信息的公开方法中最好的结果。
模型介绍
图2:可学习遮挡掩模的非对称特征匹配模块(AsymOFMM)
可学习遮挡掩模的非对称特征匹配模块的结构如图2所示。首先,我们非对称地引入了变形卷积(deformable convolution),即在根据当前流场对目标特征图进行形变的同时做一次额外的卷积,目的在于打破原始特征图与目标特征图的对称性。此时,网络预测的可学习遮挡掩模作用在形变后的特征图上(相乘),过滤重影现象带来的干扰信息,得到掩模特征图。最后,由于遮挡区域原本携带的信息在过滤之后有所缺失,因此需要与一个权衡项相加作为弥补,而这个权衡项,也是无监督学习到良好掩模的关键。
从图3中的对比可以看出,该模块不需要任何额外的监督信息就可以学习到反映真实遮挡区域的掩模。
图3:可学习遮挡掩模与遮挡区域真值(取反)对比
在该模块的基础上,我们还提出了可以充分利用掩模信息的双特征金字塔级联网络结构,进一步提升整个网络的表现。结合以上模块设计的MaskFlownet 的整体结构如图4所示。
图4:MaskFlownet 完整网络结构
推荐阅读
360金融首席科学家张家兴:别指望AI Lab做成中台 我们想研发一个机器学习框架,6 个月后失败了
那个分分钟处理10亿节点图计算的Plato,现在怎么样了? 中国 App 出海“变形记” 詹克团反攻比特大陆:一场失去人心的自我挽留
你点的每个“在看”,我都认真当成了AI
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
随时掌握互联网精彩
- 1 共绘亚太下一个“黄金三十年” 7978547
- 2 山里藏价值6000亿元黄金?村民发声 7907144
- 3 微信或史诗级“瘦身” 内存有救了 7873723
- 4 中国主张成为G20峰会的一抹亮色 7729780
- 5 朝鲜将军队提升至战斗准备状态 7685211
- 6 男生解锁“滑步下泰山”技能 7597568
- 7 带96岁母亲酒店养老遭拉黑 男子发声 7469415
- 8 女教师被指出轨学生 校方通报 7365295
- 9 《小巷人家》全员告别 7272089
- 10 千年古镇“因网而变、因数而兴” 7162813