一、图像识别与定位

  0.Classification:C个类别

   Input:Image

   Output:类别标签

   Evaluation metric:准确率

  1.Localization:

    Input:Image

    Output:物体边界框(xy,w,h)

    Evaluation mertric:交并准则

  3.Classification+Localization:识别主题+定位

   4.ImageNet:实际上有   识别+定位  2个任务

  5.思路1:视作回归问题

    (1)先解决简单问题,搭建一个识别图像的神经网络

    (2)在AlexNet VGG GoogleLenet ResNet上fine-tun一下

    (3)步骤2:在上述神经网络的尾部展开,称为classification+regresssion模式

    (4)步骤3:回归部分(Regression)用欧氏距离损失;使用SGD(随机梯度下降)训练

    

    (5)Regression(回归)的模块部分加在什么位置

      最后的卷积层后;全连接层后

    (6)能否对主体有更细致的识别呢?

      提前规定好友K个组成部分;做成K个部分的回归

    (7)应用:如何识别人的姿势?

      每个人的组成部分是固定的;对K个组成部分(关节)做回归预测=》收尾相连的线段

    (8)实际应用时

      尝试各种窗口的大小;甚至会在窗口上再做一些“回归”的事情

  2.思路2:图窗+识别与整合

    (0)想办法克服一下过程中的“参数多”与“计算慢”

      测试/识别阶段的计算是可以复用的(小卷积)

      加速计算

      用多卷积核的卷积层替换全连接层

      降低参数量

    (1)类似刚才的classification+regression

    (2)咱们取不同大小的“框”

    (3)让框出现在不同的位置

    (4)判定得分

    (5)按照得分高低对结果框做抽取和合并    

  3.图像相关任务:

  

二、物体识别

  1.边缘策略/选择性搜索=>R-CNN

  2.R-CNN=>Fast R-CNN

  3.Fast R-CNN=>Faster R-CNN

  4.YOLO/SSD

三、图像分割

  1.语义分割

  2.反卷积

最新文章

  1. wcf DataTable作为返回类型
  2. 一个解决表单中的文字和文本区域(textarea)上对齐的方法
  3. Delphi面向对象的属性
  4. 简单的将内容加入到drupal的主页面
  5. C++日志操作开源函数库之Google-glog
  6. mac 系统开发android,真机调试解决方案
  7. 后缀数组之hihocoder 重复旋律1-4
  8. C语言第八次博客作业--字符数组
  9. Linux VMware新添加网络适配器找不到配置文件问题
  10. CodeVs 1615 数据备份
  11. 使用EF保存数据时 提示: 其他信息: 对一个或多个实体的验证失败。有关详细信息,请参阅“EntityValidationErrors”属性。
  12. mybatis 中 使用 allowMultiQueries=true
  13. Windows 远程桌面剪贴板失效的处理办法
  14. Hard Life UVA - 1389(最大密度子图 输出点集)
  15. MUI组件四:选择器、滚动条、单选框、区域滚动和轮播组件
  16. common lisp的几个基本概念
  17. keepalive实现MGR的自动切换(二)
  18. Hyper-V 安装系统
  19. [luogu3258][JLOI2014]松鼠的新家
  20. script标签中type为"text/x-template"或"text/html"

热门文章

  1. http服务配置和apache
  2. 七、smarty--缓存的控制
  3. Python学习笔记:数据的处理
  4. SecureCRT For Mac安装、破解、使用详细总结
  5. MySQL MGR 单主模式下master角色切换规则
  6. Let a mthod in RestControl return a json string
  7. python模块------pyautogui
  8. 【转】Eureka集群
  9. IP冲突如何把冲突的IP挤下去
  10. arguments对象的callee属性详解