Optical Flow Estimation using a Spatial Pyramid Network  

spynet 

  本文将经典的 spatial-pyramid formulation 和 deep learning 的方法相结合,以一种 coarse to fine approach,进行光流的计算。This estiamates large motions in a coarse to fine approach by warping one image of a pair at each pyramid level by the current flow estimate and compute an update to the flow.

  我们利用 CNN 来进行每一层 flow 的更新,而不是传统方法中目标函数的最小化。与 FlowNet 相比,本文的方法不需要处理 large motions;这些已经在 pyramid 中处理了。该方法的主要优势有:

  1. our Spatial Pyramid Network is much simpler and 96% smaller than FlowNet in terms of model parameters.

  2. since the flow at each pyramid level is small (< 1 pixel), a convolutional approach applied to pairs of warped images is appropriate.

  3. unlike FlowNet, the learned convolution filters appear similar to classical spatio-temporal filters, giving insight into the method and how to improve it.

  现有方法存在的 主要问题

  将两张图直接 stack大一起,放到 CNN 当中。当两帧图像之间的 motion 大于 one or a few pixels, spatial-temporal convolutional filters 将不会收到有效的相应。也就是说,if a convolutional window in one image does not overlap with related image pixels at the next time instant, no meaningful temporal filter can be learned.

  这里需要解决两个关键性的问题:1. 长期依赖的问题;  2. detailed, sub-pixel, optical flow and precise motion boundaries。FlowNet 是尝试在一个网络中解决这两个问题,而该方法则是用 CNN 来解决第二个问题,用现有的方法来解决第一个问题。

  

  Approach:

  本文用 spatial pyramid 的方式,from coarse to fine 的方法来解决 large motion的问题。

  

  其流程图如下所示:

  

  

  

  在训练上一层网络 G 的时候,需要下面几层的初始 flow 结果。而本文得到训练所需的 gt,是根据 gt flow 和 下一层光流图上采样后的结果 之间的差值的得到的。根据这个,来训练当前的网络参数。

  


最新文章

  1. 擦掉STM32F429芯片上的数据的一个方法
  2. PhotoSwipe - 移动开发必备的 iOS 风格相册
  3. 25 uname-用于显示系统信息
  4. 嵌入式 H264参数语法文档: SPS、PPS、IDR以及NALU编码规律
  5. js中的call、apply
  6. 关于table的一些兼容性问题
  7. IHttpModule与IHttpHandler的区别整理
  8. 思维方式--SMART原则
  9. 读写ini文件
  10. MyEclipse开发平台下如何将新建的JSP页面的默认编码格式设置为UTF-8--JSP
  11. Linux的邮件服务器配置
  12. SQL Server 基本UPDATE和DELETE语句
  13. python socket编程笔记
  14. Eclipse中JSP生成的class文件去了哪里?
  15. BadgeView 圆形数字提醒 购物车常用
  16. Spring的国际化(转载)
  17. PHP curl_setopt函数用法介绍中篇
  18. requirejs——config
  19. ReadyAPI 教程和示例(二)
  20. dataTables基础函数变量

热门文章

  1. 【Hadoop学习之八】MapReduce开发
  2. 新做了块avr开发板--tft屏研究用
  3. [转载]Oracle修改用户表所属表空间的步骤
  4. [转载]oracle的常用函数 instr() 和substr()函数
  5. Navicat连接MySQL8.0亲测有效
  6. GoldenGate 12.3 MA架构介绍系列(2) - 数据同步测试
  7. JavaScript笔记 #05# 用Regex辅助生成文章目录
  8. Golang数组注意细节
  9. XX-net
  10. P2617 Dynamic Rankings(树状数组套主席树)