进行了一段时间的论文学习后,现在下载了一些代码,准备从OpenCV跟matlab两个方面着手搭建自己的图像分割平台,计划耗时一个月左右的时间!

昨天去西工大,听了一场Graph Asia的报告,里面有个Microsoft的人讲述自己怎么写paper。纠正了我一直以来的一个误区:就是做完实验再写paper,这个是不对的,应该像软件工程的开发流程一样,文档先行才对,一遍写文档一边写代码

还有一点感悟就是,关于图像分割这块的内容,大家都做的比较多了,怎么样让自己的工作出彩,还有原创性的idea很重要。

图论方法的主要思想是将图像映射成加权图,把图像像素看作图的顶点, 邻接像素之间的关系看作图的边, 邻接像素之间的相似性看作边的权值, 根据边的权值设计能量函数,
通过最小化能量函数完成对图的分割, 从而实现图像分割. 基于图论的分割方法对图像进行分割时优点明显:

1) 图论是一门研究比较早而且已经发展成熟的学科, 具有较好的数学基础. 针对某个问题, 图论中有多个方法可以解决;

2) 图像和图之间非常相似. 在图像映射为图之后, 便可以利用图论中的各种理论和数学工具进行图像分割.

目前常用的基于图论的分割方法包括最小割 (通常称为图割)、归一化割等. 和图割相比, 归一化割存在以下几点不足:

1) 没有嵌入一元 (Unary) 项, 如各自图结点的先验, 相当于对所有结点都是零先验;

2) 需要计算大矩阵的广义特征向量, 尽管采取了复杂度抑制措施, 计算量仍很大;

3) 只能逼近全局最优解;

4) 倾向于分割出的类具有相同的类内相似度.

因此, 尽管图割容易分离出小目标, 但图割方法的优点更加明显:

1) 在全局最优的框架下进行分割, 保证了能量函数的全局最优解;

2) 同时利用了图像的像素灰度信息和区域边界信息, 分割效果好;

3) 用户交互简单且方便, 只需在目标内部和背景区域标记少量的种子点, 对种子点的具体位置也没有严格要求, 而且通过预处理方法自动确定种子点, 也可让图割方法自动化.

因此, 近 10 年来, 基于图割的图像分割方法的发展和应用尤为广泛. 经典的图割只能精确求解特定的能量函数, 而对其他能量函数需要用线性规划松弛方法来求解, 有两个思路可实现:

1) 基于移动制造的方法, 包括 α 扩展和 α−β 交换等, 不试图精确地求解松弛问题;

2) 基于消息传递的方法, 包括信念传播 (Belief propagation) 和 TRW (Tree-reweightedmessage-passing) 等, 试图精确地求解松弛问题.

参考文献[7]中证明了,最小割等价于能量函数最小化

参考文献

[1] Y. Boykov, and M. P. Jolly, "Interactive graph cuts for optimal boundary and region segmentation of objects in N-D images",
Proceeding of IEEE International Conference on Computer Vision, 1:105~112, July 2001.

[2] C. Rother, A. Blake, and V. Kolmogorov, "Grabcut – interactive foreground extraction using iterated graph cuts",
Proceedings of ACM SIGGRAPH 2004, 23(3):307~312, August 2004.

[3] A. Agarwala, M. Dontcheva, M. Agrawala, et al, "Interactive digital photomontage",
Proceedings of ACM SIGGRAPH 2004, 23(3):294~302, August 2004.

[4] Y. Li, J. Sun, C. Tang, et al, "Interacting with images: Lazy snapping",
Proceedings of ACM SIGGRAPH 2004, 23(3):303~308, August 2004.

[5] A. Blake, C. Rother, M. Brown, et al, "Interactive Image Segmentation using an adaptive GMMRF model".
Proceedings of European Conference on Computer Vision, pp. 428~441, May 2004.

[6] V. Kwatra, A. Schodl, I. Essa, et al, "Graphcut Textures: Image and Video Synthesis Using Graph Cuts".
Proceedings of ACM Siggraph 2003, pp.277~286, Augst 2003.

[7] Song-Tao L I U, Fu-Liang Y I N. 基于图割的图像分割方法及其新进展[J]. 自动化学报, 2012, 38(6): 911-922.

最新文章

  1. 玩转spring boot——结合JPA入门
  2. 烂泥:ubuntu 14.04搭建OpenVPN服务器
  3. tp框架总结(二)
  4. springmvc 配置多视图,返回jsp,velocity,freeMarker,tiles(模板)等等
  5. JavaScript(五)——插入地图
  6. 中缀表达式转后缀表达式(用于求字符串表达式值)(js栈和队列的实现是通过数组的push和unshift方法插值,pop方法取值)
  7. SDUT 2622 最短路径(Dijkstra)
  8. 老生常谈--Js继承小结
  9. 函数的非固定参数-Day3
  10. QuickChm 制作chm文档 chm文档脚本错误,乱码
  11. android事件分发源码分析—笔记
  12. 服务化改造实践 | 如何在 Dubbo 中支持 REST
  13. Kth MIN-MAX 反演
  14. 025 如何利用github绑定自己的域名
  15. C# widget
  16. 【从0到1学Web前端】CSS定位问题一(盒模型,浮动,BFC) 分类: HTML+CSS 2015-05-27 22:24 813人阅读 评论(1) 收藏
  17. MVC ---- Lambda表达式
  18. 前端获取table表格里面的所有(单个)tr和所有(单个)td,用js实现
  19. shell 规范
  20. Eclipse中的maven项目打war包

热门文章

  1. (一一五)利用NSKeyedArchiver实现任意对象转为二进制
  2. SSH深度历险(七) 剖析SSH核心原理(一)
  3. Spark技术内幕:Worker源码与架构解析
  4. jquery实战---标签页效果
  5. UNIX网络编程——TCP输出,UDP输出
  6. 《java入门第一季》之TreeSet存储自定义对象并保证排序和唯一
  7. Unity UGUI基础之Image
  8. ROS(indigo)国外开源示例包括多机器人控制等基于V-Rep和Gazebo的仿真
  9. golang:高性能消息队列moonmq的简单使用
  10. Leetcode_58_Length of Last Word