零零星星挖坑几个了,都没填土,实在是欠账太多,闲话少说吧,还是多记录总结一下。今天的主题是围绕convolution和加速

记得之前看过lecun他们组的一篇文章,是fft加速convolution的。按照Convolution Theorem,时域上的卷积可以转成空间域的傅立叶变换进行。

lecun的文章就是通过把卷积变成傅立叶变换实现加速的。从实验里看到,加速比2倍左右。目前这部分有代码开源,但是好像并没有merge到caffe中,原因可能是因为加速比例有限,再者消耗空间。猜测主要是加速比例问题吧,因为加速过程中,由于其原理,当卷积核小,是没什么加速的,当核是3或者5时,速度有的更慢或者相当,而在cnn中卷积的核大多数比较小,起到的加速作用很小,而基于图像处理本身目前的任务来说,卷积核一般不会太大,googlenet用7X7已经是爆炸天了。而从另外一方面来说,对caffe实现多GPU卡的加速或者多机的加速,则是实打实的加速,无论你的卷积核多大,你都能加速。

lecun他们又出了一篇新的文章,facebook的,Fast Convolutional Nets With fbfft: A GPU Performance Evaluation。caffe上已经有人实现了,加速1.4(3X3)到14.5倍。从他们的文章中看到,卷积核小的时候也是实现了加速了,赞。

待续……

最新文章

  1. 2016/12/31_Python
  2. c coroutine
  3. Apache error: 403 Forbidden You don't have permission to access
  4. EXCEL设置选中单元格样式
  5. 如何使用office2010插入屏幕截图
  6. MetaHandler.js:移动端适配各种屏幕
  7. PRAGMA AUTONOMOUS_TRANSACTION
  8. listbox icon
  9. 《ACM国际大学生程序设计竞赛题解I》——6.11
  10. js 日常问题记录
  11. IP地址接口小结
  12. WebGIS中使用ZRender实现前端动态播放轨迹特效的方案
  13. 【Netty】UDP广播事件
  14. HTML 超链接 表格
  15. Android开发中有用工具之--Log工具类
  16. hdu3076—概率dp
  17. 基于微软企业库的AOP组件(含源码)
  18. ucloud中的udisk错误“Read-only file system”修复指南
  19. SQL反模式学习笔记11 限定列的有效值
  20. leetcode python 032 识别最长合法括号

热门文章

  1. 持久层框架---jdbc
  2. tomcat正常关闭,端口号占用解决 StandardServer.await: create[8005]:
  3. 多线程编程_读写锁ReadWriteLock
  4. RTT之ENV
  5. UGUI [TextArea]
  6. SuperSpider(简书爬虫JAVA版)
  7. C/C++中 static 的作用
  8. Video 视频播放防作弊和禁止下载
  9. Redis学习1
  10. DataGridView进度条列 C# WinForm