接着我的微博继续八卦吧

微博里问了几个人,关于deep learning和cnn的区别,有不少热心网友给了回答,非常感谢。结合我听课和看文章的理解,我大胆大概总结一下:

在上世纪90年代,neural network火了后就不再火了,听说,在投稿到nips时,如果你的关键词是neural network等,会大大降低你的文章的接受率,而如果是bayesian parameters or svm等,就会提高接受率,云云,但是在06年左右,neural network又开始出来闹腾了。

其实,之前neural network之所以偃旗息鼓了,主要是因为深层神经网络中,使用BP进行训练,是走不动了,层一深,训练无差就被前面层吃掉了,这样就没法再进行进一步训练了。因此,很多使用neural network的都是一两层的,唯一一个比较成功的案例是1998年lecun的lenet,用了七层,也就是cnn, convolutional neural network,这个是通过convolutional 和subsampling对network进行了降维,只有在最后三层是fully connected的,维度降低了,再用BP梯度进行训练,就好些了。当时是对图像手写体进行了识别,很成功的说,当时的图片大小是32X32。

06年时,hinton提出了RBM训练多层,同时,微软什么的又成功将多层neural network成功应用了,于是neural network又火了。这个,我最近还没仔细跟踪,不八卦了。

接着说cnn吧,cnn在12年的imagenet上火了,当时是hinton的学生,就是那个Alex,用cnn,成功用在了大图片大数据上,基于gpu, cuda进行编程,娃哈哈,效果很好,甩了第二名很远。我看文章中,就是用的lecun的cnn,一共8层,5层是做convolutional 和pooling的,后面三层是fully connected的,也是用梯度下降进行训练的,在训练时,用到了dropout,同时还用了局部normalization,其实这个我也不懂。

基于两块GPU,完成的效果还不错,而且人家可真是实打实的大图片大数据,好吧,12年的文章,至今已经被引用超过100次了。

另外,看了几篇文章,best practice for cnn applied to document 还有几篇介绍的博客什么的,目前对cnn的训练思路是没问题了,打算就着网上的代码,咀嚼一遍试试,只是,目前看Alex的imagenet代码,还是很不清晰,主要是基于cuda的编程,不明白,再者,人家的程序写的框架性是真好,框架性越好,其实对某一个针对性问题越不容易理解,是的,扩展性好,可我小虾米只想顺着结构走,还不会跟着对象走。

最新文章

  1. SQL存储过程来调用webservice
  2. sdut 2610:Boring Counting(第四届山东省省赛原题,划分树 + 二分)
  3. BestCoder Round #43
  4. Qt *.pro编写一般规则
  5. pancake sort的几个问题
  6. 大型B/S系统技术总结(不断更新)
  7. PHP的curl常用的5种写法
  8. birkenfeld / sphinx-contrib — Bitbucket
  9. php查询,多条件查询
  10. SVN环境搭建步骤
  11. Xamarin.Android 使用百度地图获取定位信息
  12. linux条件判断:eq、ne、gt、lt、ge、le
  13. 【原创】USART异步模式配置
  14. python中@classmethod @staticmethod区别(转)
  15. 在三台Centos或Windows中部署三台Zookeeper集群配置
  16. Hystrix介绍以及服务的降级限流熔断
  17. poj1733(带权并查集+离散化)
  18. Lua------------------改善Unity编辑器对Lua文件的支持
  19. 百度地图API和高德地图API资料集锦
  20. 046——VUE中组件之使用动态组件灵活设置页面布局

热门文章

  1. JavaScript实现StringBuffer
  2. JS中的prototype(转载)
  3. C# 判断List集合中是否有重复的项
  4. 第一个servet(用注解),不用web.xml
  5. javaSE练习13——(知识点:类的继承 方法的覆盖)
  6. 视觉库—OpenCV
  7. SharePoint 2013 - User Custom Action
  8. CentOS安装QQ2012
  9. SpringCloud的学习记录(8)
  10. JavaScript基础入门知识